Поиск по архивам: как найти историю семьи в документах XVIII века (yet another podcast #33)
Год назад Яндекс запустил «Поиск по архивам». Это сервис, в котором можно искать информацию по архивным документам почти как в интернете. Для этого разработчики обучили нейросети расшифровывать рукописные записи со сложной дореволюционной орфографией.
Сейчас в базе более 11 миллионов архивных документов из хранилищ Москвы, Астраханской, Оренбургской, Иркутской и других областей. Это метрические книги, исповедные ведомости и ревизские сказки XVIII — начала XX века. Они будут полезны как историкам, так и тем, кто хочет больше узнать о прошлом своей семьи.
👉 «Поиск по архивам»:
В yet another podcast обсуждаем, что интересного можно найти в архивах и как мы обучили нейросеть распознавать букву Ѣ. Разобраться с исторической темой помогают руководитель «Поиска по архивам» Александр Болховитянов и руководитель группы распознавания текста Татьяна Сапатова.
yet another podcast — регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.
🦸♂️ В гостях — Иван Корякин, автор телеграм-канала «Генеалогика» и подкаста «Откуда родом»
🎧 НА ДРУГИХ ПЛАТФОРМАХ:
• Яндекс Музыка:
• Apple Podcasts:
• Google Podcasts:
⚡ ЧТО В ВЫПУСКЕ
00:00 — Поиск, но не в интернете
02:13 — Сколько архивов в России
05:23 — Легенда про суперархив мормонов
11:19 — Раньше даже бумага была лучше
13:13 — Как сделать запрос в архив
17:47 — Фонд и опись: глоссарий архивов
19:29 — Архивный мем!
22:00 — Зачем придумали «Поиск по архивам»
23:19 — Три главных вызова
27:03 — Как обучали нейросеть
31:39 — Что такое метрическая книга
34:30 — Нейросеть видела слова везде
39:27 — Учили на «Анне Карениной»
42:58 — Байка про The Beatles
46:50 — Ефросинья или баранина
49:41 — 40 000 долларов за 10 символов
54:23 — Особенности старой орфографии
01:02:48 — Нейросеть YASTREB
01:05:01 — Распознавание почерка врачей?
01:08:21 — Особенности тайского и корейского
01:10:39 — Тамбов как треть Европы
01:13:37 — Про коллаб с Genotek и «Великими описями»
01:19:38 — Кушелев — про семейное древо
01:21:48 — С чего начать поиск предков
01:25:42 — Да, но зачем всё это?
1 view
1871
602
1 week ago 00:28:31 2
Пираты Чёрного Моря // Александр Батов. Что делать
1 week ago 00:15:35 1
ЧТО ДЕЛАТЬ ЕСЛИ ВЫ ВЗЯЛИ КРЕДИТ ПОД ВЛИЯНИЕМ МОШЕННИКОВ ||КАК ЕГО УБРАТЬ ИЗ БКИ И НИЧЕГО НЕ ПЛАТИТЬ
1 week ago 00:29:27 2
Церковь изобрела мат
1 week ago 01:12:11 2
🟦 Forza Horizon 5 🍺 ИГРЫ ФЕСТИВАЛЯ! Полное Прохождение ЗИМНЕГО Сезона!!!
2 weeks ago 00:00:43 2
МИХАИЛ МАКЕДОНСКИЙ РАСКРЫВАЕТ СЕКРЕТЫ ВНЖ ИСПАНИИ
2 weeks ago 01:10:53 31
Борис Гребенщиков: как жить до и после смерти. Кучер +
2 weeks ago 01:05:49 11
Проблемы и трудности «Унесенных ветром»: как снимался самый кассовый фильм в истории Голливуда
2 weeks ago 00:09:59 5
ИЕШУА (Originally Jesus Image Worship -Yeshua) l Прославление. Ачинск
2 weeks ago 00:23:21 1
Залез на ЧЕРДАК а там Такая НАХОДКА, ЗАБРОШКА просто Набита ДОБРОМ, не Зря ЗАЛЕЗЛИ в Этот ДОМ!
2 weeks ago 00:24:46 1
Простите за беспокойство. Или человек, который продает(ся) // Ирина Штерк. Между строк.
3 weeks ago 00:24:04 1
Баланс 4х Стихий по гармониз. и целеоринтир-ти в создании лайя-центров на месте древних центров силы
3 weeks ago 00:31:12 1
Ловушка счастья: пятничные алкоголики и как распознать угрозу ❗
4 weeks ago 00:48:10 4
Банки выплатили рекордные бонусы, СВО в Гренландии, удача Лукашенко // Олег Комолов. Числа недели