Data Fest Online 2020
NLP in Industry Track:
Тексты, например медицинские или юридические, содержат конфиденциальную информацию. Это создает сложности при создании датасетов для NLP задач и увеличивает риски утечки информации при работе с ними. Доклад посвящён методам, позволяющим уменьшить риски работы с чувствительными данными. На примере задачи классификации изучается влияние метода деперсонализации данных на качество работы NLP моделей на целевой задаче.
Посмотреть эфир и список треков и организаторов:
Зарегистрироваться на фест и получить доступ к трекам:
Вступить в сообщество:
Соцсети Data Fest:
1 view
105
23
4 months ago 00:03:41 1
ПРЕМЬЕРА ПЕСНИ «БЫЛА БЫ РОДИНА ЖИВОЙ» / Я.СУМИШЕВСКИЙ, А.КУРЯЕВ И С.ВОЙТЕНКО (Lyric video)
1 year ago 00:08:53 1
Ярослав Емельянов vs. Александр Аралов | Yaroslav Emelyanov vs. Aleksandr Aralov | ACA YE 36
2 years ago 00:01:41 1
111222 6 класс 50м вс Емельянов Ярослав 2дор 37сек 2юн 3место Дементьев Саша 3дор 36сек 2юн 2место
2 years ago 00:01:05 1
051122 Дети Воды 50м вс 2дор Емельянов Ярослав 2010 38с 2юн
2 years ago 00:02:50 1
051122 Дети Воды 100м на спине 3дор Емельянов 2010 1м37с 2юн 5дор Замашанский 2010 1м47с 2юн
2 years ago 00:01:17 1
041122 Дети Воды 50м на спине 1дор Орлов 2011 48с 2юн 6дор Емельянов 2010 44с 2юн