Если очень кратко, вчера я занимался доведением до ума проекта impruver, в частности в нём были проблемы с генератором датасета типа чат, с тем как хранить конфигурацию и с тем работают скрипты тренировки.
В генераторе датасетов типа чат удалось решить ряд проблем связанных с токенизацией и поправить интеграционные тесты.
-
-
Следом была реализованна базовая конфигурация, структура которой похожа на то, что реализовано в torchtune.
-
-
После чего был реализован скрипт предобработки датасета, вытягивающий данные из HuggingFace и преобразующий их.
-
После чего внесены правки в скрипт обучения через трансформеры, оригинальная версию которого была позаимствованна из проекта Saiga.
-
-
Градиенты спускаются...
Сделать пожертвование:
-
-
Ссылки:
-
-
-
13 views
1505
516
1 week ago 01:33:58 419
Разбор варианта №1 из сборника Ященко ОГЭ по математике
4 weeks ago 00:44:24 135
РАЗБОР первой части варианта №3 из сборника Ященко ОГЭ по математике
1 month ago 00:40:15 40
ВСЕ про уравнения на ОГЭ по математике
1 month ago 01:21:06 133
JavaScript для начинающих. Урок 2: Функции, циклы, объекты, массивы. 2024