Яндекс обучил нейросеть распознавать тексты газеты «Коммерсант», выпущенные до революции в России в 1917 году, после чего переводить их в электронный вид. Весь архив доступен в открытом доступе с удобной навигацией.
Первый номер деловой газеты «Коммерсант» вышел 5 августа (23 июля) 1909 года — 115 лет назад. Благодаря совместному проекту с Российской национальной библиотекой (РНБ), Национальной электронной библиотекой (НЭБ) и сервисом Яндекса «Поиск по архивам» в свободном доступе теперь можно прочесть дореволюционные выпуски издания. Сервис доступен по следующей ссылке.

Выпуски дореволюционной газеты «Коммерсант» будут интересны, как исследователям, так и любителям истории. Пользователям доступно 2250 номеров газеты (больше 10 тыс. страниц).
Для реализации этого проекта национальные библиотеки передали оригиналы из своих фондов, а Яндекс преобразовал их в электронный вид. Сервис «Поиск по архивам» использовал для этого технологию оптического распознавания символов и нейросеть, которая сумела считать мелкие газетные шрифты.

Также на сервисе «Поиск по архивам» пользователи смогут для поиска информации воспользоваться архивами других газет: «Советский спорт», «Вечерняя Москва», «Сенатские ведомости», «Русский инвалид» более чем за 100 лет, а также архив издания «Красная звезда» 1924–1953 годы.
Платформа «Поиск по архивам» разрабатывалась Яндексом совместно с главным архивом Москвы. На этой платформе нейросеть распознает рукописные тексты в исторических документах и автоматически переводит их в цифровой формат.

Система помогла тем, кто ищет историю своего рода и на постоянной основе пользуются онлайн-ресурсом Главархива «Моя семья».
Проект обучался на материалах онлайн-сервиса «Моя семья». Раньше поиск нужной документации занимал много часов, а сейчас нейросеть сможет найти нужную информацию с именами родственников за несколько минут.
Следите за новостями в наших социальных сетях: ВКонтакте и Telegram.