Почему научить машину писать — легко, а искать ошибки в написанном — трудно

VC.RUHi-Tech

Обработка естественного языка: как создать «грамотного робота»

Узнали у разработчиков, почему научить машину писать — легко, а искать ошибки в написанном — трудно.

1280

Уже десяток российских команд включились в сложнейшую задачу по машинному обучению. Вот её условия:

Дано: реальные сочинения с ЕГЭ на двух языках — русском и английском. Их разметили школьные учителя: выделили смысловые блоки (аргументы, примеры, выводы) и нашли ошибки. В их числе — нарушение логики, искажение смысла, несоответствие теме.

1280

Задача: создать алгоритм, который сможет размечать такие же тексты и находить ошибки не хуже учителей. То есть разметка алгоритма должна отличаться от разметок педагогов не сильнее, чем разметки педагогов отличаются друг от друга. Язык можно выбрать на своё усмотрение.

Мы пообщались с тремя командами, работающими над решением.

  • «Антиплагиат» разработал одноимённый сервис обнаружения заимствований в текстах. В конкурсной команде эксперты в области машинного обучения, исследователи-алгоритмисты и специалисты по подготовке данных.
  • В составе команды «Наносемантика» — сотрудники «Нейросетей Ашманова» и системы проверки правописания «ОРФО»: нейросетевики, разработчики и лингвисты.
  • Команда DeepPavlov сформировалась во время работы над библиотекой разговорного AI DeepPavlov. Все участники — сотрудники лаборатории МФТИ.

Расскажите про своё решение. Какие ошибки оно уже определяет? Использовали в нём готовые модули или собственные наработки?

Антиплагиат: Делиться секретами до подведения хотя бы предварительных итогов было бы очень самонадеянно. Создание такого непростого алгоритма — задача творческая, каждая команда идёт к её решению особым путём.

Что касается результатов, то наш алгоритм приблизился к человеку в плане обнаружения грамматических ошибок.

Наносемантика: Конкурс лежит прямо в русле нашей работы. Мы развиваем одну из самых продвинутых систем проверки правописания — «ОРФО» — и как раз сейчас доделываем для неё английский граммер. А заодно экспериментируем с нейросетевыми модулями для выявления сложных ошибок — например, в расстановке артиклей, употреблении форм глагола или выборе слов из тех, которые для иностранца звучат похоже (steal вместо still или thin вместо thing).

Мы не стали ничего выдумывать, а просто попробовали подготовить бета-версию некоего продукта, напоминающего тот, который мы собираемся выпустить в будущем. Получилась в лучшем случае альфа (что тоже неплохо) — и, конечно, не хватило нескольких дней на то, чтобы выявить и исправить кучу крайне обидных ошибок. Не говоря уже о том, чтобы что-то отполировать.

Если в двух словах, то наше решение — соединение нейромодулей с традиционным граммером на правилах, который пока находит больше ошибок, но и сам ошибается чаще.

Это решение не было самым простым — кажется, мы знаем, как написать примитивную заглушку, которая формально дала бы результаты получше. И не удивлюсь, если какая-то из команд в условиях цейтнота так и поступила. Но мы заметно продвинулись в тех направлениях, в которых хотели продвинуться. Судя по разметке экспертов в доступных эссе, наша модель уже исправляет артикли не хуже среднестатистического учителя. Не знаем, насколько это серьёзный комплимент.

1280

На скриншоте — редкий пример текста, в котором найдено много ошибок. К другим эссе у нейросети претензий было меньше — часто одна-две, иногда ни одной. Сочинение, впрочем, действительно выдающееся: внимательный читатель, хотя бы немного знающий английский, легко найдёт в нём ошибки, которые наши модули пропустили.

Среди отмеченных ошибок, к сожалению, встречаются и ложные срабатывания. В предложении «дети предпочитают компьютерные игры обучению» нейросеть предлагает добавить местоимение (them), но тогда смысл исказится: «дети предпочитают играть в компьютерные игры, а не изучать их».

DeepPavlov: Мы использовали буквально всё, что могли, из нашей библиотеки и не только из неё. Для конкурса Alexa Prize от Amazon мы разработали DeepPavlov Agent — платформу для оркестрирования диалогов. Она отлично подошла и для этого конкурса и позволила нам совмещать несколько моделей, управлять ими и агрегировать результаты.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не думайте о покупателе: как вырастить стартап, который купит Apple Не думайте о покупателе: как вырастить стартап, который купит Apple

Что необходимо учитывать при создании стартапа, чтобы заинтересовать Apple

Forbes
Бизнес в стиле хиппи: как построить в коммуне самый дорогой стартап в сфере воздушного электротакси Бизнес в стиле хиппи: как построить в коммуне самый дорогой стартап в сфере воздушного электротакси

Джобен Бевирт хочет создать авиатакси по цене UberX

Forbes
Вопрос для Байдена: введут ли США новые санкции против компаний Олега Дерипаски Вопрос для Байдена: введут ли США новые санкции против компаний Олега Дерипаски

Почему не стоит ждать быстрой реакции санкционных властей США

Forbes
SPAльный район: бьюти-программа к празднику SPAльный район: бьюти-программа к празднику

Новый год хочется встретить красивой, свежей и отдохнувшей

Лиза
История исчезновения туристок в Панаме, которую сравнивают с «Ведьмой из Блэр» История исчезновения туристок в Панаме, которую сравнивают с «Ведьмой из Блэр»

История о том, насколько небезопасны туристические маршруты в джунглях

Maxim
Инфракрасная спектроскопия помогла алгоритму отличить человеческую кровь от животной Инфракрасная спектроскопия помогла алгоритму отличить человеческую кровь от животной

Химики разработали модель классификации крови человека и животных

N+1
Топ лучших новогодних фильмов на ТВ, без которых праздник не праздник Топ лучших новогодних фильмов на ТВ, без которых праздник не праздник

Топ лучших новогодних фильмов — как старых, так и новых

Cosmopolitan
«Королева китайского венчурного капитала»: история инвестора Кэти Сюй, которая вкладывает только в китайский рынок «Королева китайского венчурного капитала»: история инвестора Кэти Сюй, которая вкладывает только в китайский рынок

История одной из самых успешных инвесторов Китая Кэти Сюй

VC.RU
«Поймет лишь тот, кто сам испытал подобное»: кто такой равный консультант? «Поймет лишь тот, кто сам испытал подобное»: кто такой равный консультант?

История равного консультанта Марины Бурыгиной

Cosmopolitan
Беспилотники Беспилотники

Шины Michelin Power на треке, в городе и в путешествии

Мото
Не только Cyberpunk 77: топ-5 игр в киберпанк-эстетике Не только Cyberpunk 77: топ-5 игр в киберпанк-эстетике

Пять видеоигр, работающих с наследием киберпанка и стимпанка

Esquire
Диета «Любимая»: примеры рациона и комментарии нутрициолога Диета «Любимая»: примеры рациона и комментарии нутрициолога

В чем причина популярности диеты, о которой не слышали западные врачи?

РБК
Полнеют от лет? Полнеют от лет?

Эксперты помогают разобраться в проблеме увеличения веса у женщин старше 50 лет

Худеем правильно
К чему приведет признание экоцида преступлением против человечности К чему приведет признание экоцида преступлением против человечности

Экологические преступления могут быть приравнены к геноциду

СНОБ
В якутской мерзлоте нашли отлично сохранившуюся тушу молодого шерстистого носорога В якутской мерзлоте нашли отлично сохранившуюся тушу молодого шерстистого носорога

Этот шерстистый носорог дожил до трех-четырех лет, после чего утонул

N+1
5 советов, как подготовиться к автопутешествию с домашним питомцем 5 советов, как подготовиться к автопутешествию с домашним питомцем

Минимизируй стресс любимца во время путешествия

Playboy
Цена высоких достижений. Почему успешные предприниматели часто страдают от депрессии? Цена высоких достижений. Почему успешные предприниматели часто страдают от депрессии?

Одни и те же качества делают нас успешными — и ментально уязвимыми

Reminder
Почему мы толстеем от диет? Почему мы толстеем от диет?

Неожиданные последствия нашей одержимости похудением

kiozk originals
Мораль vs прибыль: почему благотворительные фонды имеют право зарабатывать деньги Мораль vs прибыль: почему благотворительные фонды имеют право зарабатывать деньги

Как НКО могут самостоятельно зарабатывать на свое существование?

Forbes
Как встретить принца: истории знакомства королевских пар Как встретить принца: истории знакомства королевских пар

Даже с будущим королем можно познакомиться при вполне банальных обстоятельствах

Cosmopolitan
Глава партии «За правду» Захар Прилепин: Если к нам попросится Горбачев, мы его не возьмем Глава партии «За правду» Захар Прилепин: Если к нам попросится Горбачев, мы его не возьмем

Интервью с Захаром Прилепиным о том, что не так с образом «‎нового будущего»

СНОБ
Лучшие турецкие сериалы на русском: хиты и новинки, от которых не оторваться Лучшие турецкие сериалы на русском: хиты и новинки, от которых не оторваться

Список лучших и новых турецких мелодрам для длинных новогодних каникул

Cosmopolitan
Как повысить жизнестойкость? Наблюдения клинического психолога Как повысить жизнестойкость? Наблюдения клинического психолога

Как не падать духом даже в тяжелые времена

Reminder
Первые строчки Billboard и продюсер-миллиардер: группа BTS в цифрах Первые строчки Billboard и продюсер-миллиардер: группа BTS в цифрах

K-pop-группа BTS бьет рекорд за рекордом

РБК
Нарциссы: почему они всегда возвращаются Нарциссы: почему они всегда возвращаются

Нарциссы обаятельны, опасны и всегда возвращаются к жертвам: почему?

Psychologies
Здравствуйте! Здравствуйте!

Бёхово — особенно место, и люди там живут — под стать

Seasons of life
Чем открыть HEIC и как перевести его в JPEG на Windows 7 или 10 Чем открыть HEIC и как перевести его в JPEG на Windows 7 или 10

Самые эффективные способы открыть файл формата .heic

CHIP
История первая — короткая История первая — короткая

Когда мне было пять лет, я написала очень короткий рассказ

Weekend
Глобальное планирование и постчеловек. Беседа с футурологом Данилой Медведевым Глобальное планирование и постчеловек. Беседа с футурологом Данилой Медведевым

Интервью с футурологом и кандидатом экономических наук Данилой Медведевым

СНОБ
Легко не будет Легко не будет

Как построить бизнес, когда вопросов больше, чем ответов

kiozk originals
Открыть в приложении