Как заявили в Google, это знаменует конец «безмолвной эры» ИИ-видео, открывая новые горизонты для кинематографистов, маркетологов и создателей цифрового контента.
Veo 3 позиционируется как прямой конкурент Sora от OpenAI, но, по данным CNBC, ключевое преимущество разработки Google — встроенный аудиомодуль с расширенными возможностями. Пользователи могут не только задавать текстовое описание сцены, но и детально настраивать звуковое сопровождение: указывать тембр голосов персонажей, эмоциональную окраску диалогов и даже акустические особенности окружающего пространства.
Генеральный директор Google DeepMind Демис Хассабис во время презентации подчеркнул: «Вы можете написать инструкцию с детальным описанием персонажей, обстановки и даже диалогов, указав, как они должны звучать — громко, шёпотом, с эхом в большом зале или приглушённо в маленькой комнате. Veo 3 воплотит это в жизнь с беспрецедентной точностью».
В условиях растущей проблемы дипфейков и манипуляций с медиа, Google внедряет дополнительные меры защиты. Технология SynthID добавляет невидимые цифровые водяные знаки в сгенерированные ролики, позволяя идентифицировать их происхождение. Это должно помочь в борьбе с мошенничеством и распространением недостоверной информации.
Однако, как отмечает TechCrunch, для обучения модели, вероятно, использовались данные с YouTube, что может вызвать новые вопросы о соблюдении авторских прав. Эксперты уже выражают озабоченность по поводу этичности использования общедоступного контента без явного согласия правообладателей.
Параллельно с Veo 3 компания представила ряд других инновационных разработок:
Эти инструменты в комплексе формируют мощную экосистему для профессионального и любительского творчества, потенциально сокращая время и затраты на производство контента.
Несмотря на амбициозные заявления, у Google неоднозначная репутация в этой области. В феврале 2024 года компания была вынуждена временно отключить Imagen 3 после волны критики. Пользователи жаловались на искажение исторических фактов, неточности в изображениях известных личностей и даже случаи непреднамеренного оскорбления культурных особенностей.
Сооснователь Google Сергей Брин публично признал провал: «Мы определённо облажались с генерацией изображений. Основная причина — недостаточное тестирование и поспешный вывод продукта на рынок».
Этот инцидент заставил компанию пересмотреть подход к контролю качества и этическим аспектам ИИ-разработок.
Запуск Veo 3 может кардинально изменить ландшафт цифрового контента, предлагая:
Однако вместе с возможностями возникают и новые вызовы:
Аналитики прогнозируют, что к 2026 году до 30% коммерческого видеоконтента будет создаваться с помощью ИИ. Veo 3 и аналогичные инструменты могут democratize видеопроизводство, давая возможность малым студиям и независимым авторам конкурировать с крупными игроками.
Но успех Google будет зависеть от того, сможет ли компания:
Пока Veo 3 доступен ограниченному кругу тестеров, но его официальный релиз ожидается уже в конце 2024 года. Одно можно сказать точно: эпоха "немого" ИИ-видео осталась в прошлом, и индустрия стоит на пороге новой революции.