Мегареалистичный генератор речи появился в открытом доступе

DailyNews

Местный
Команда форума
Редактор
Подтвержденный
RuTOR MEDIA
Сообщения
4.422
Реакции
4.916
1764195468974.png


Новая модель Dia2 создаёт озвучку, неотличимую от реального голоса, и работает в режиме реального времени. Это настоящий мастхев для дипфейков и видео — речь генерируется прямо во время воспроизведения, без задержек.

Технология позволяет клонировать любые голоса с сохранением тембра, интонаций и акцентов. Модель передаёт эмоции — может волноваться, смеяться или запинаться как живой человек.

Dia2 доступна в двух версиях с полностью открытым кодом. Разработчики могут запускать её локально, без ограничений и без модерации контента. Пока система работает с английским и создаёт до двух минут аудио.

Для тестирования доступны командная строка, веб-интерфейс и API. Появление открытой системы синтеза речи расширяет возможности создания голосовых сообщений для многих структур.
 
Назад
Сверху Снизу