00:00 Введение

• Инструменты для синхронизации губ с речью на основе ИИ важны для создателей фильмов и аватаров.
• Автор сравнивает лучшие инструменты, чтобы выбрать лучший для конкретных задач.
• Первый инструмент для тестирования — Omni-Human от Drmina.

00:54 Работа с Omni-Human

• Вход в систему и выбор инструмента для аватара ИИ.
• Загрузка изображения ИИ-персонажа и аудиофайлов с диалогами.
• Генерация речи с помощью ИИ или запись голосов самостоятельно.

01:50 Создание сцены диалога

• Загрузка изображения женщины в баре и диалога.
• Использование модели аватара Pro для лучшего качества.
• Сгенерирование сцены диалога.

02:41 Анализ результатов Omni-Human

• Синхронизация губ соответствует словам, но мимические движения иногда преувеличены.
• Проблемы с выразительностью у некоторых персонажей.
• Высокая стоимость модели: почти 20 долларов за 60 настроек синхронизации губ.

04:35 Тестирование Design

• Создание нового проекта и загрузка изображения лица.
• Ручная обрезка изображения и загрузка аудиофайла.
• Редактирование аудиофайла и выбор профессионального режима.

06:34 Результаты тестирования Design

• Качественная синхронизация губ и анимация элементов фона.
• Возможность добавления синхронизации губ к видео.
• Контроль направления сцены и выразительности персонажей.

09:31 Особенности Design

• Выразительные, но не преувеличенные результаты.
• Работа с нечеловеческими персонажами.
• Бюджетная платформа: около 2,90 долларов за 60 секунд.

10:25 Тестирование Hera AI

• Hera AI специализируется на кинематографичных кадрах.
• Простая платформа для вставки аудиозаписи и загрузки изображения.
• Панель подсказок для управления движениями персонажа.

11:23 Проблемы с панелью подсказок и моделью Hera 3

• Панель подсказок работает плохо, ИИ не может правильно воспроизвести движения и мимику персонажа.
• Рекомендуется использовать модель Hera 3, а не Google.
• Качество видео Hera низкое — 720p, анимация дёрганая.

12:17 Стоимость и ограничения Hera

• Hera относительно дешёвая: 2,70 доллара за 60 секунд синхронизации губ.
• Качество анимации низкое, модель устарела.

13:13 Обзор Hagen Avatar

• Hagen — один из первых инструментов для создания аватаров, недавно выпустила модель Avatar 4.
• Позволяет начинать с фотографии персонажа и добавлять диалог.
• Хорошо справляется с подсказками, можно выбрать разрешение 720p или 1080p.

15:07 Проблемы с анимацией в Hagen

• Движения повторяются, если не разделить их на короткие сегменты.
• Автоматически анимируются мерцающие огни на заднем плане.
• Иногда возникают проблемы с синхронизацией губ.

16:00 Ограничения и стоимость Hagen

• Модель Avatar ограничена пятью минутами в месяц, стоимость около 6 долларов за минуту.

16:54 Обзор Higgs Field

• Higgs Field предлагает множество вариантов анимации персонажей.
• Можно задать конкретное выражение лица.
• Результаты зависят от выбранного режима качества.

17:51 Проблемы с анимацией в Higgs Field

• Начало видео может выглядеть странно из-за неправильных подсказок.
• Вторая часть видео обычно лучше.
• Режим гнева может быть слишком экспрессивным.

19:49 Стоимость Higgs Field

• Модель высокого качества стоит 130 кредитов.
• Подписка на 30 долларов в месяц даёт 600 кредитов, что позволяет сгенерировать около 4,5 высококачественных видео.

21:45 Обзор Cling AI

• Cling AI известен своими видеомоделями с ИИ, но также имеет функцию синхронизации губ.
• Позволяет загружать видео и аудиофайлы, задавать движения персонажу.
• Пример использования: персонаж откидывается назад, говоря «Больше никому не позволяй следить за мной. Слишком многих поймали. Слишком многие не вернулись».

22:41 Преимущества Cling AI

• Возможность синхронизировать аудиофайл с движением персонажа.
• Динамичные сцены диалога становятся более реалистичными.

23:41 Введение и анимация

• Обсуждение анимации и её содержания.
• Упоминание о динамичности сцены при использовании видео с басовой партией для синхронизации губ.

24:41 Проблемы синхронизации губ

• Снижение качества синхронизации губ при использовании видео.
• Примеры нереалистичных движений губ.
• Преимущества функции синхронизации губ в Inkling: низкая стоимость и возможность бесплатной генерации 60 секунд в день при регистрации.

25:29 Модель Pixverse

• Pixverse как инструмент для качественной синхронизации губ.
• Возможность загрузки видео и сцены с диалогом.
• Естественные движения губ и низкая стоимость синхронизации.

27:30 Google VEO 3

• Google VEO 3 как генератор видео с ИИ.
• Ограничения: невозможность загрузки собственных аудиофайлов.
• Преимущества: создание диалогов персонажей, добавление звуков и эффектов окружающей среды.

29:47 Проблемы с голосом в Google VEO 3

• Отсутствие контроля над голосом персонажа.
• Зависимость голоса от внешности персонажа.
• Высокое качество анимации и реалистичность эмоций.

31:34 Рекомендации по синхронизации

• Использование синхронизации изображения с речью для точного движения губ.
• Рекомендации программ: Higgs Field, Design, Hagen.
• Рекомендации по использованию Pixverse и Google VEO 3 для анимации речи и диалогов.

33:29 Заключение

• Рекомендация посмотреть другое видео для сравнения генераторов видео с ИИ.