«Kandinsky: развитие моделей генерации изображений и видео по тексту»
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
Денис Димитров, Исполнительный директор по исследованию данных в Sber AI, научный консультант в Институте искусственного интеллекта AIRI
Последние несколько лет без преувеличения можно назвать расцветом генеративных моделей, при этом работающих с самими разными модальностями. Доклад будет посвящен одним из самых трудоемких и сложных задач этого направления — задачам синтеза изображений и видео по текстам на естественном языке и основным подходам к их решению.
В первой части доклада обсудим задачу генерации изображений (в основном условной генерации по тексту). Остановимся на истории задачи, подробно обсудим основные методы и архитектуры для её решения, на каких данных такие архитектуры обычно учатся, поговорим о метриках для оценки качества генераций. Также поговорим о развитии моделей Kandinsky: от трансформерных архитектур (Malevich, Kandinsky 1.0) до диффузионных (Kandinsky 2.X и 3.X). Поговорим про ключевые результаты последних релизов моделей Kandinsky 2.1 и 2.2, обсудим планы развития линейки моделей Kandinsky.
Во второй части доклада затронем задачу генерации видео по текстовому описанию (причем обсудим как создание различных видов анимации, так и end-to-end генерацию полноценных видеороликов по тексту), основные трудности обучения моделей и способы оценки их качества. Немного поговорим и о нашей новой модели генерации видео: Video-Kandinsky.
1 view
5528
1710
5 months ago 01:11:18 0
Искусственный интеллект: Ключ к трансформации человечества. #ии #ai
7 months ago 05:47:59 0
Семь Бессмертных Даосов
8 months ago 00:11:08 0
Рахманинов. Его “10 характерных признаков прекрасной фортепианной игры“.
9 months ago 00:54:33 0
Метафизическое искусство - альтернатива совриску. Манифест мета-авангарда. Экскурс в направления.
9 months ago 00:18:58 0
👗 Обзор бесплатной AI примерки одежды для развлечения и создания изображений для маркетплейсов.
9 months ago 00:09:55 0
GigaChat vs ChatGPT — что внутри, и какие перспективы у российской модели за рубежом? | ИИнтервью
10 months ago 00:02:26 4
Урбан-тур в Екатеринбурге от Этажи Девелопмент
10 months ago 00:07:08 0
АРКТИЧЕСКИЕ НОВОСТИ #4/ радиационная опасность, хаски - спецназ и долгожданный фильм
10 months ago 01:32:16 16
Лекция «Кинестезия ‒ “шестое чувство“ авангарда» | Ирина Сироткина
10 months ago 00:50:54 1
Презентация двухтомника «Василий Кандинский. О духовном в искусстве»
11 months ago 00:44:16 0
Стоит ли опасаться искусственного интеллекта? Эксперты и нейросеть ответят на вопросы малого бизнеса
11 months ago 00:55:26 0
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.2)
11 months ago 00:53:35 0
Сказки с нейросетями с Валентином ▶ Незнайка на луне (ч.1)
11 months ago 00:50:06 0
«Kandinsky: развитие моделей генерации изображений и видео по тексту»
11 months ago 01:04:16 0
Сказки с нейросетями с Валентином ▶ Алиса в стране чудес
12 months ago 01:41:32 3
ИИ в прошлом и будущем. Сергей Марков #23
1 year ago 00:01:58 0
Секреты работы с нейросетями
1 year ago 01:23:18 0
Полный разбор 1 варианта из нового сборника 2024 | Обществознание ОГЭ | Умскул
1 year ago 00:12:41 0
Космос и Авангард: рисуем по мотивам Кандинского. Искусство детям - Творчество с ребёнком
1 year ago 00:47:29 0
Русский авангард. Искусство 20 века. Чёрный квадрат: Почему так дорого? Малевич, Кандинский, Татлин
1 year ago 00:17:34 0
Общество (байки из таверны)
1 year ago 00:24:25 1
Урок Adobe Illustrator: Дизайн свадебного приглашения и нейросеть Кандинский