[3Blue1Brown] Визуализация внимания, сердце трансформера | Глава 6, Глубокое обучение
🎯 Загружено автоматически через бота:
🚫 Оригинал видео:
📺 Данное видео принадлежит каналу «3Blue1Brown» (@3blue1brown). Оно представлено в нашем сообществе исключительно в информационных, научных, образовательных или культурных целях. Наше сообщество не утверждает никаких прав на данное видео. Пожалуйста, поддержите автора, посетив его оригинальный канал.
✉️ Если у вас есть претензии к авторским правам на данное видео, пожалуйста, свяжитесь с нами по почте support@, и мы немедленно удалим его.
📃 Оригинальное описание:
Демистификация самовнимания, множественных голов и перекрестного внимания.
Вместо спонсорского чтения рекламы эти уроки финансируются непосредственно зрителями:
Не менее ценная форма поддержки - просто поделиться видео.
Другие ресурсы о трансформаторах
Видеоролики Андрея Карпати
Посты по теме “Трансформаторные схемы“, автор Anthropic
В частности, только прочитав этот пост, я начал думать о комбинации матриц значения и выхода как о комбинированной низкоранговой карте из пространства вложения в себя, что, по крайней мере, в моем сознании, сделало все намного яснее, чем другие источники.
История языковых моделей от Брит Круз, @ArtOfTheProblem
Что такое языковая модель от @vcubingx
Сайт с упражнениями, связанными с ML-программированием и GPT
Ранняя статья о том, как направления в пространствах встраивания имеют смысл:
Временные метки:
- Обзор вкраплений
- Мотивирующие примеры
- Шаблон внимания
- Маскировка
- Размер контекста
- Ценности
- Параметры подсчета
- Перекрестное внимание
- Множественные головы
- Матрица вывода
- Идти глубже
- Окончание
2 views
0
0
2 months ago 00:03:41 16
Как LLM хранят факты? Принес вам на вечер субботы отличный ролик от 3blue1brown
3 months ago 00:15:56 28
Глава 4. Визуализация цепного правила и производной произведения | Суть математического анализа [Субтитры]
4 months ago 00:14:48 1
Визуализация всех возможных пифагоровых троек [3Blue1Brown]
7 months ago 00:08:16 1
Как создавать математические анимации?
1 year ago 00:53:02 1
Выпуск 48: Профессия Data Scientist в игровой индустрии
1 year ago 01:03:53 2
PyTorch | Урок #5 | Пишем ResNet с нуля
2 years ago 00:08:15 201.7K
Как создавать математические анимации
2 years ago 00:08:15 21
Как создавать математические анимации - Wild Mathing
3 years ago 00:36:11 32
Trying to Improve My Geography Game with More Real-World Data
3 years ago 01:03:56 1
Лекция . Визуализация электромагнитных волн
3 years ago 00:24:26 2
The Beauty of Bézier Curves
4 years ago 00:15:35 125
Суть матанализа. Часть 4. Визуализация правила произведения и сложной функции // 3Blue1Brown