Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)
Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры.
👀 Обо всех возможностях SpeechKit для бизнеса:
Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса.
👀 Все принципы синтеза речи:
По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону?
На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов.
🦸♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов.
yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.
🎧 НА ДРУГИХ ПЛАТФОРМАХ:
• Яндекс Музыка:
• Apple Podcasts:
• Google Podcasts:
⚡ ЧТО В ВЫПУСКЕ
00:00 — Выпуск про синтез речи
02:06 — Этика речевых технологий — что это?
04:28 — Что нужно для виртуального голоса
06:30 — «Мы варим голоса»
12:01 — Шёпот, милый, нейтральный. Какие голоса есть?
13:45 — Синтез голоса — это быстро?
16:57 — Для создания голоса ещё нужен человек?
18:37 — Час шёпота в студии, и голос готов
21:59 — Кол-центры и роботы
26:07 — «Робот никогда не устаёт»
29:43 — «Позовите оператора!»
33:10 — Самые известные голоса
34:35 — Алиса и Siri читают рэп
36:42 — Генерация голоса без людей
38:11 — Где актёры озвучки незаменимы
40:31 — Царь, Анаксимандр и Вася
41:45 — Дикторы не останутся без работы
45:45 — Робот должен представляться?
49:50 — Как понять, что говоришь с роботом?
53:44 — Лайфхак: как переключиться на оператора
55:16 — «Вам звонит синтез»
57:52 — Разговоры по телефону уйдут в прошлое?
59:49 — Культура звонков в разных странах
01:02:35 — Может ли синтез взять на вас кредит
01:06:02 — Что умеет нейросеть-эмпат
01:11:42 — Как научить нейросеть эмоциям
01:13:35 — А какая польза от эмпатичной нейросети?
01:16:24 — Строгий, милый, добрый. Какие ещё голоса бывают?
01:18:24 — Как сделать синтез своего голоса
01:20:03 — Вопросы! Можно ли объединить SpeechKit и YandexGPT?
01:22:23 — Что будет, если накричать на робота
01:23:47 — Можно ли «украсть» речь?
2,236 views
101
27
1 week ago 00:13:04 1
[4K] АСМР ВЫЗОВ ВРАЧА НА ДОМ РОЛЕВАЯ ИГРА (Тихий голос, звуки рук, персональное внимание)
1 week ago 01:25:16 2.2K
Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)