Синтез выразительной речи для аудиокниг | Степан Комков, Яндекс Поиск
Это доклад Степана Комкова, старшего разработчика службы синтеза речи в Яндекс Поиске, на Practical ML Conf 2024. В своём выступлении Степан рассказал об опыте создания виртуального рассказчика в Букмейте. Зачем его создавали и чего хотят пользователи, как выжать максимум из технологий уходящего поколения и внедрить длинный контекст в low-resource real-time модель. И как GPT и диффузионные модели произвели революцию в синтезе речи.
Подписывайтесь на телеграм-канал Яндекса для ML-специалистов:
402 views
122
28
3 months ago 00:17:05 3
Синтезатор NUX NEK-100 || Наверное, лучший из доступных на сегодня