- Сообщения
- 4.422
- Реакции
- 4.916
Новая модель Dia2 создаёт озвучку, неотличимую от реального голоса, и работает в режиме реального времени. Это настоящий мастхев для дипфейков и видео — речь генерируется прямо во время воспроизведения, без задержек.
Технология позволяет клонировать любые голоса с сохранением тембра, интонаций и акцентов. Модель передаёт эмоции — может волноваться, смеяться или запинаться как живой человек.
Dia2 доступна в двух версиях с полностью открытым кодом. Разработчики могут запускать её локально, без ограничений и без модерации контента. Пока система работает с английским и создаёт до двух минут аудио.
Для тестирования доступны командная строка, веб-интерфейс и API. Появление открытой системы синтеза речи расширяет возможности создания голосовых сообщений для многих структур.