Сейчас, во многом благодаря исследованиям антропика и дипмайнд, мы, наконец, можем говорить о том, что с помощью интерпретируемости можем не только понимать как работают трансформеры, но и изменять их поведение в нужном для нас направлении. В докладе Никита рассказал, чем его группа занимается прямо сейчас в направлении механистик интерпретабилити.
#nlp #ml #тбанк
244 views
329
85
3 days ago 00:08:19 4
[bycloud] The More Woke The AI Is, The More Dumb They Are?