18 октября 2025

eur = 94.58 2.50 (2.72 %)

btc = 105 269.00$ -5 931.52 (-5.33 %)

eth = 3 751.85$ - 291.98 (-7.22 %)

ton = 2.11$ -0.17 (-7.48 %)

usd = 80.98 1.90 (2.40 %)

eur = 94.58 2.50 (2.72 %)

btc = 105 269.00$ -5 931.52 (-5.33 %)

Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

1 минута на чтение
Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

Яндекс запустил сервис «Поиск по архивам» в котором собрано более 2,5 млн страниц исторических рукописных документов с текстовой расшифровкой. Об этом «Коду Дурова» сообщили в пресс-службе компании.

Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов. Нейросеть была обучена при помощи сотен тысяч рукописных строк в реальных архивных документах, датированных с XVIII по XIX век, а также десятков миллионов примеров, которые были сгенерированы.

Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса, – отметили в Яндексе.

Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллиона страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой.

Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Материал обновлен|

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
OpenAI планирует потратить триллион долларов на развитие ИИ

ГигаЧат: коротко о главном

OpenAI планирует потратить триллион долларов на развитие ИИ

Полная версия 
Яндекс Карты рассчитывают время для каждого водителяЯндекс Карты рассчитывают время для каждого водителя

ГигаЧат: коротко о главном

Яндекс Карты рассчитывают время для каждого водителя

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 434
Газпромбанк
OTP Bank
МТС
Т-Банк
X5 Tech
билайн
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы