Технология генерации видео на основе ИИ делает прорыв, перестраивая экосистему творчества и потребность в вычислительной мощности.

robot
Генерация тезисов в процессе

Прорыв в технологии генерации видео с помощью ИИ и перспективы ее применения

В последнее время одним из самых значительных достижений в области ИИ стало прорыв в технологии многомодальной генерации видео. Эта технология перешла от простого текстового генерирования видео к интеграции текстов, изображений и аудио в полную цепочку генерации.

Несколько典型ных技术ных突破ов值得关注:

  1. Открытая платформа EX-4D, разработанная одной из технологических компаний, может преобразовывать обычные видео в 4D-контент с произвольным углом обзора, а уровень признания пользователей достигает 70,7%. Эта технология делает возможным создание эффектов просмотра с любого угла, для чего раньше требовалась команда профессиональных 3D-моделлеров.

  2. Платформа ИИ представила функцию "绘想", которая утверждает, что может создавать 10-секундные видео "кинематографического" качества из одного изображения. Однако подлинность этого заявления еще предстоит проверить.

  3. Технология Veo, разработанная одним из исследовательских институтов в области ИИ, может синхронно генерировать 4K видео и окружающий звук. Эта технология преодолевает проблемы синхронизации видео и аудио, достигая семантического соответствия в сложных сценах.

  4. Технология ContentV на одной из платформ коротких видео имеет 8 миллиардов параметров и может генерировать 1080p видео за 2,3 секунды при стоимости 3,67 юаня за 5 секунд. Хотя контроль затрат неплохой, все же есть пространство для улучшения качества генерации в сложных сценах.

Эти технологические прорывы имеют значительное значение в таких аспектах, как качество видео, затраты на генерацию и области применения:

Во-первых, сложность технологий генерации многомодальных видео является экспоненциальной. Она требует не только обработки пикселей одиночных кадров, но и обеспечения последовательности видео, синхронизации аудио и согласованности в 3D-пространстве. Теперь, благодаря модульному разложению и сотрудничеству больших моделей, эти сложные задачи могут быть выполнены.

Во-вторых, достигнуты значительные успехи в сокращении затрат. Это стало возможным благодаря оптимизации архитектуры вывода, включая технологии иерархической генерации, механизмы повторного использования кэша и динамическое распределение ресурсов.

В конце концов, эти технологические прорывы оказали огромное воздействие на традиционную индустрию видеопроизводства. Технологии ИИ упростили процесс создания видео, который изначально требовал значительных человеческих и материальных ресурсов, до ввода подсказок и ожидания всего несколько минут, при этом обеспечивая перспективы и эффекты, которые сложно достичь с помощью традиционной съемки. Это может привести к переосмыслению экономики создателей.

Эти изменения оказали глубокое влияние на развитие технологий ИИ:

  1. Структура спроса на вычислительную мощность изменилась. Генерация мультимодальных видео требует разнообразных комбинаций вычислительной мощности, создавая новые возможности для распределенной неиспользуемой вычислительной мощности.

  2. Увеличение потребности в аннотировании данных. Для создания профессионального видео требуется точное описание сцен, эталонные изображения, аудиостили и другие профессиональные аннотации данных, что предоставляет новые возможности для соответствующих специалистов.

  3. Выявляется тенденция модульного сотрудничества. Технология ИИ постепенно переходит от централизованного распределения ресурсов большого масштаба к модульному сотрудничеству, что само по себе является новой потребностью децентрализованных платформ.

В будущем, с совместным развитием вычислительной мощности, данных, моделей и механизмов стимулов, ожидается, что технологии ИИ смогут сформировать самоподдерживающийся положительный цикл, способствующий интеграции и инновациям в различных сценариях применения ИИ.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 4
  • Репост
  • Поделиться
комментарий
0/400
BoredStakervip
· 08-11 05:00
Снова рисуют большие пироги, да? Давай поговорим, когда правда будет подтверждена.
Посмотреть ОригиналОтветить0
TokenStormvip
· 08-10 11:32
Данные, действительно, все на бумаге хвастаются, 70.7% уровень одобрения, кто в это верит?
Посмотреть ОригиналОтветить0
fren.ethvip
· 08-10 11:11
Говоря о 4D, можно уже почти гулять с собакой в пространстве.
Посмотреть ОригиналОтветить0
DegenWhisperervip
· 08-10 11:07
Это всё с настоящим человеком?
Посмотреть ОригиналОтветить0
  • Закрепить