Разметка репозитория на темы — полезная практическая задача, которая может помочь в понимании сути проекта, ответственности разработчиков в команде и т.д. В данный момент у GitHub существует возможность ручной разметки на топики, и пользователи проставили уже очень много тем. Например, у репозитория pytorch есть тэги “python”, “deep-learning”, “autograd”, а у React — “javascript”, “frontend”, “ui”. Размечено довольно много разных проектов, поэтому можно попробовать применить обучение с учителем. На семинаре мы поговорим о том, как проект Code Tagger решает задачу предсказания топиков для репозиториев, какие при этом встретились сложности и как хочется их решать в будущем.
Докладчики: Александр Федотов.