7 июня 2026

eur = 85.56 -0.71 (-0.83 %)

btc = 60 601.00$ - 823.15 (-1.34 %)

eth = 1 553.38$ -44.45 (-2.78 %)

ton = 1.65$ 0.14 (9.11 %)

usd = 73.47 -0.83 (-1.11 %)

eur = 85.56 -0.71 (-0.83 %)

btc = 60 601.00$ - 823.15 (-1.34 %)

Amazon представила Textract, технологию для корректного распознавания текста

1 минута на чтение
Amazon представила Textract, технологию для корректного распознавания текста

Читайте в Telegram

|

Amazon представила технологию Textract — интеллектуальный инструмент для оптического распознавания символов (OCR) и их конвертации в цифровые форматы.

Amazon представила Textract, технологию для корректного распознавания текста

Технология распознавания текста существует давно. Однако классические методы зачастую неэффективны.

Во-первых, система может легко перепутать единицу со строчной L или прописной I. То же справедливо для нуля и прописной О.

Во-вторых, при изменении шаблона, на основе которого формируется документ, данные могут перемешаться из-за неверного распознавания. Последнюю проблему и решает Textract.

Как заявил CEO AWS Энди Джесси (Andy Jassy), классическое оптическое распознавание просто «читает» текст, тогда как Amazon Textract способен определять форматирование текста, графические элементы и прочие особенности вёрстки. Ясси показал это при сравнении результатов обычного OCR и разработки компании. Первая система распознала таблицу как строку текста, а вторая корректно перенесла данные в цифровой формат.

По словам Ясси, Textract достаточно умён, чтобы определить номера документов, даты рождения и адреса, после чего правильно интерпретировать вне зависимости от того, в каком месте страницы они находятся. В случае изменения шаблона система не пропустит неправильный результат.

Источник: tproger.ru

Обсудить
Блоги 600
Softline
OTP Bank
ЦНИС
ВКонтакте
ВТБ
билайн
Слетать.ру
Т-Банк
Газпромбанк
МТС

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…