Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Можно ли есть черные бананы? Вы поразитесь ответу западных экспертов! Интересные факты Можно ли есть черные бананы? Вы поразитесь ответу западных экспертов! Интересные факты

Cтоит ли употреблять почерневшие бананы или безопаснее выбросить их в ведро

ТехИнсайдер
Новая грамотность Новая грамотность

Что значит быть грамотным в современном мире?

Цифровой океан
Как включить телевизор без пульта: 3 проверенных способа Как включить телевизор без пульта: 3 проверенных способа

Как включить телевизор без пульта и кнопок несколькими простыми способами

CHIP
Мятежная Вандея Мятежная Вандея

В марте 1793 года во Франции начался Вандейский мятеж

Дилетант
Чем полезен щавель и кому лучше от него отказаться Чем полезен щавель и кому лучше от него отказаться

Щавель насыщен витаминами и органическими кислотами, а потому очень полезен

РБК
После антибиотиков: как биологи пытаются предотвратить будущие пандемии После антибиотиков: как биологи пытаются предотвратить будущие пандемии

Как наука и общество должны бороться с пандемиями

Forbes
Поупражнялись в girl math и съели girl dinner: как «девчачий ужин» и «девчачья математика» стали мемами Поупражнялись в girl math и съели girl dinner: как «девчачий ужин» и «девчачья математика» стали мемами

Что за тренд с girl/boy появился в сети и так ли он безобиден, как кажется

Правила жизни
У американки с двумя матками выявили беременность в обеих У американки с двумя матками выявили беременность в обеих

32-летняя жительница Алабамы с двумя матками вынашивает ребенка в каждой из них

N+1
Как сделать так, чтобы борода росла быстрее Как сделать так, чтобы борода росла быстрее

Главный минус бороды в том, что она не может вырасти за один день

Maxim
Что такое настоящие инновации. 6 очень важных технологий в автомобилях Что такое настоящие инновации. 6 очень важных технологий в автомобилях

Современные автомобили становятся настоящими гаджетами на колесах

РБК
6 художественных книг, которыми зачитывались великие политики прошлого 6 художественных книг, которыми зачитывались великие политики прошлого

Уникальные литературные предпочтения политиков прошлого

Maxim
Не переключайтесь: 15 лучших фильмов на Netflix, которые идут не больше 90 минут Не переключайтесь: 15 лучших фильмов на Netflix, которые идут не больше 90 минут

Классика от Орсона Уэллса, о катастрофах и фильмы Дэвида Кроненберга

Правила жизни
«Я никогда не…»: один простой вопрос может превратить игру в психотерапию «Я никогда не…»: один простой вопрос может превратить игру в психотерапию

Может ли простая игра стать способом терапии?

Psychologies
Почему термос перестал держать тепло: 3 житейских способа восстановить изоляцию Почему термос перестал держать тепло: 3 житейских способа восстановить изоляцию

Как починить термос, чтобы он снова радовал горячими напитками

ТехИнсайдер
3 способа не испортить секс по дружбе 3 способа не испортить секс по дружбе

Что важно предусмотреть, чтобы дружба с привилегиями была комфорта для всех

Maxim
Евгений Стеблов: «Моя проба вышла настолько удачной, что когда Данелия ее увидел, то сразу сказал: «Где этот парень?» Евгений Стеблов: «Моя проба вышла настолько удачной, что когда Данелия ее увидел, то сразу сказал: «Где этот парень?»

Когда предлагают негодяев, отказываюсь даже за очень хорошие деньги

Караван историй
«Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры «Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры

Архитектор Олег Клодт — о том, чем отличается девелопмент в России и на Западе?

Forbes
Квалифицированный заказчик: как получаются замечательные школьные здания Квалифицированный заказчик: как получаются замечательные школьные здания

Как получаются замечательные школьные здания

Наука
Отставить панику! Что делать, если белые вещи покрасилась при стирке Отставить панику! Что делать, если белые вещи покрасилась при стирке

Можно ли спасти покрасившиеся при стирке вещи?

ТехИнсайдер
Уроки внедорожного мастерства. Крутые спуски и поперечные канавы Уроки внедорожного мастерства. Крутые спуски и поперечные канавы

Поговорим об очень крутых спусках, с которых на первый взгляд нельзя съехать

4x4 Club
За завесу тайны За завесу тайны

Шесть сказочных маршрутов, чтобы отдохнуть от гаджетов

Цифровой океан
10 самых лучших и горячих азиатских порноактрис в 2023 году 10 самых лучших и горячих азиатских порноактрис в 2023 году

Самые зажигательные девушки Азии

Maxim
Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA

Скандалы вокруг серии игр Grand Theft Auto

СНОБ
Гиперответственность или низкая самооценка: почему мы испытываем испанский стыд? Гиперответственность или низкая самооценка: почему мы испытываем испанский стыд?

Чем испанский стыд отличается от обычного стыда и почему мы его испытываем

ТехИнсайдер
Отпусти и забудь Отпусти и забудь

5 советов, которые помогут восстановиться после развода

Лиза
«Бессмертная жизнь Генриетты Лакс»: как ученые пытались культивировать живые клетки «Бессмертная жизнь Генриетты Лакс»: как ученые пытались культивировать живые клетки

Глава из книги «Бессмертная жизнь Генриетты Лакс»

Forbes
Семь подземных королей Семь подземных королей

Удивительные машины, которые можно встретить только под землей

ТехИнсайдер
Где рождается свет Где рождается свет

Что такое Солнце? Газовый шар плотнее воды, мощнейший термоядерный реактор

Вокруг света
Почему ты не спишь? Почему ты не спишь?

Ошибки при организации пространства в спальне, из-за которых ты не высыпаешься

Лиза
Как выбрать идеальный свитер и носить его, если тебе за 50: советы стилистов Как выбрать идеальный свитер и носить его, если тебе за 50: советы стилистов

Что нужно учесть, выбирая свитер на холодное время года?

VOICE
Открыть в приложении