17 мая 2026

eur = 85.18 -1.11 (-1.28 %)

btc = 78 263.00$ - 851.21 (-1.08 %)

eth = 2 181.40$ -40.88 (-1.84 %)

ton = 1.91$ -0.08 (-3.83 %)

usd = 73.13 -0.01 (-0.02 %)

eur = 85.18 -1.11 (-1.28 %)

btc = 78 263.00$ - 851.21 (-1.08 %)

Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

1 минута на чтение
Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

Читайте в Telegram

|

Яндекс запустил сервис «Поиск по архивам» в котором собрано более 2,5 млн страниц исторических рукописных документов с текстовой расшифровкой. Об этом «Коду Дурова» сообщили в пресс-службе компании.

Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов. Нейросеть была обучена при помощи сотен тысяч рукописных строк в реальных архивных документах, датированных с XVIII по XIX век, а также десятков миллионов примеров, которые были сгенерированы.

Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса, – отметили в Яндексе.

Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллиона страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой.

Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Материал обновлен|
Обсудить
Блоги 544
ВТБ
OTP Bank
ЦНИС
билайн
Слетать.ру
ВКонтакте
Т-Банк
Газпромбанк
МТС
X5 Tech

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…