Анастасия Богатенкова | Dedoc - открытая библиотека для получения унифицированного содержимого

Спикер: Анастасия Богатенкова, ИСП РАН, стажер-исследователь Тема доклада: Dedoc -- открытая библиотека для получения унифицированного содержимого из разнородных текстовых документов. Вам нужно получить текст из сканированной страницы или автоматизировать обработку документов разных форматов в одном пайплайне? В этом может помочь dedoc - Python библиотека/API сервис по получению содержимого из документов и его представлении в общем виде. В рамках доклада рассказывается об открытой библиотеке/сервисе dedoc: - для чего нужен dedoc; - что умеет dedoc; - примерная архитектура и основные структуры данных; - достоинства и недостатки, дальнейшее развитие. Полезные ссылки: Data Fest 2024: Презентацию к докладу Вы можете скачать в треке секции OpenSource: ______ Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost:
Back to Top