«Kandinsky: развитие моделей генерации изображений и видео по тексту»
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
Денис Димитров, Исполнительный директор по исследованию данных в Sber AI, научный консультант в Институте искусственного интеллекта AIRI
Последние несколько лет без преувеличения можно назвать расцветом генеративных моделей, при этом работающих с самими разными модальностями. Доклад будет посвящен одним из самых трудоемких и сложных задач этого направления — задачам синтеза изображений и видео по текстам на естественном языке и основным подходам к их решению.
В первой части доклада обсудим задачу генерации изображений (в основном условной генерации по тексту). Остановимся на истории задачи, подробно обсудим основные методы и архитектуры для её решения, на каких данных такие архитектуры обычно учатся, поговорим о метриках для оценки качества генераций. Также поговорим о развитии моделей Kandinsky: от трансформерных архитектур (Malevich, Kandinsky 1.0) до диффузионных (Kandinsky 2.X и 3.X). Поговорим про ключевые результаты последних релизов моделей Kandinsky 2.1 и 2.2, обсудим планы развития линейки моделей Kandinsky.
Во второй части доклада затронем задачу генерации видео по текстовому описанию (причем обсудим как создание различных видов анимации, так и end-to-end генерацию полноценных видеороликов по тексту), основные трудности обучения моделей и способы оценки их качества. Немного поговорим и о нашей новой модели генерации видео: Video-Kandinsky.
1 view
5514
1705
1 month ago 05:47:59 1
Семь Бессмертных Даосов
3 months ago 00:11:08 1
Рахманинов. Его “10 характерных признаков прекрасной фортепианной игры“.
3 months ago 00:54:33 1
Метафизическое искусство - альтернатива совриску. Манифест мета-авангарда. Экскурс в направления.
4 months ago 00:18:58 1
👗 Обзор бесплатной AI примерки одежды для развлечения и создания изображений для маркетплейсов.
4 months ago 00:09:55 1
GigaChat vs ChatGPT — что внутри, и какие перспективы у российской модели за рубежом? | ИИнтервью
4 months ago 00:02:26 1
Урбан-тур в Екатеринбурге от Этажи Девелопмент
4 months ago 00:07:08 1
АРКТИЧЕСКИЕ НОВОСТИ #4/ радиационная опасность, хаски - спецназ и долгожданный фильм
5 months ago 01:32:16 15
Лекция «Кинестезия ‒ “шестое чувство“ авангарда» | Ирина Сироткина
5 months ago 00:50:54 1
Презентация двухтомника «Василий Кандинский. О духовном в искусстве»
5 months ago 00:44:16 1
Стоит ли опасаться искусственного интеллекта? Эксперты и нейросеть ответят на вопросы малого бизнеса
5 months ago 00:55:26 1
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.2)
5 months ago 00:53:35 1
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.1)
5 months ago 00:50:06 1
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
6 months ago 01:04:16 1
Сказки с нейросетями с Валентином ▶ Алиса в стране чудес
6 months ago 01:41:32 3
ИИ в прошлом и будущем. Сергей Марков #23
7 months ago 00:01:58 1
Секреты работы с нейросетями
7 months ago 01:23:18 1
Полный разбор 1 варианта из нового сборника 2024 | Обществознание ОГЭ | Умскул
8 months ago 00:12:41 1
Космос и Авангард: рисуем по мотивам Кандинского. Искусство детям - Творчество с ребёнком
8 months ago 00:47:29 1
Русский авангард. Искусство 20 века. Чёрный квадрат: Почему так дорого? Малевич, Кандинский, Татлин
8 months ago 00:17:34 1
Общество (байки из таверны)
8 months ago 00:24:25 1
Урок Adobe Illustrator: Дизайн свадебного приглашения и нейросеть Кандинский
8 months ago 00:22:31 1
Эволюция Человека (байки из таверны)
9 months ago 00:06:51 1
36 ТЫСЯЧ ЛЕТ ЖИВОПИСИ ЗА 5 МИНУТ [ART I FACTS]
9 months ago 01:14:28 1
Работа с документацией / Как, где и зачем составлять понятный всем спек? Часть 3