Flow2Vec — это новый подход в статическом анализе кода, который полагается на методы машинного обучения и запросы с контекстно-свободными (КС) ограничениями на графах. Данный подход позволяет строить embedding кода, который сохраняет ассимитричность графа программы, учитывает информацию о потоках данных и о структуре программы, как о наборе процедур с множеством рекурсивных вызовов функций. Построенный embedding можно использовать в дальнейшем в таких задачах, как обобщение или классификация кода, что значительно повышает точность работы и улучшает основные метрики качества конечных алгоритмов.Мы разберем основные шаги построения подобного embedding’а, применение запросов с КС ограничениями в данном процессе, а также посмотрим на возможные приложения наших новейших результатов для вычисления КС запросов в рассматриваемой области.
Докладчик: Егор Орачев
Материалы к докладу:
1. Yulei Sui, Xiao Cheng, Guanqin Zhang, and Haoyu Wang. 2020. Flow2Vec: value-flow-based precise code embedding. Proc. ACM Program. La