12 декабря 2024

eur = 108.56 2.36 (2.22 %)

btc = 101 213.00$ 4 729.35 (4.90 %)

eth = 3 835.87$ 213.05 (5.88 %)

ton = 6.37$ 0.44 (7.34 %)

usd = 103.27 3.24 (3.24 %)

eur = 108.56 2.36 (2.22 %)

btc = 101 213.00$ 4 729.35 (4.90 %)

Форум

Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

1 минута на чтение
Яндекс представил нейросеть для расшифровки архивных документов с дореволюционной орфографией

Яндекс запустил сервис «Поиск по архивам» в котором собрано более 2,5 млн страниц исторических рукописных документов с текстовой расшифровкой. Об этом «Коду Дурова» сообщили в пресс-службе компании.

Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнаёт утратившие актуальность буквы и понимает особую структуру архивных документов. Нейросеть была обучена при помощи сотен тысяч рукописных строк в реальных архивных документах, датированных с XVIII по XIX век, а также десятков миллионов примеров, которые были сгенерированы.

Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени. Наш сервис справляется с этим за несколько секунд. В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса, – отметили в Яндексе.

Пользователи могут протестировать технологию в действии в сервисе «Поиск по архивам». В рамках проекта доступно более чем 2,5 миллиона страниц исторических документов XVIII — начала XX веков с текстовой расшифровкой.

Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями Яндекса. Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
70c20f70-7f12-4e9d-a022-b281d879c6f2-изображение-0905b98de-7995-4bca-b9ef-227338105e4f-изображение-14deeffce-0bb5-4b63-8a59-f0f5676c5762-изображение-2

GigaChat Max: коротко о главном

Яндекс запустил Документы со встроенной YandexGPT

Полная версия 
3e71e041-6300-43ea-85c9-90df3c814a3b-изображение-0

GigaChat Max: коротко о главном

Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131