Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Это начало последней главы» «Это начало последней главы»

Что писали о первой встрече Джо Байдена и Владимира Путина зарубежные СМИ

РБК
Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам

Две трети убитых женщин в 2018 году были жертвами домашнего насилия

Cosmopolitan
«В переписке нас легко игнорировать»: как писать клиенту, чтобы он захотел купить «В переписке нас легко игнорировать»: как писать клиенту, чтобы он захотел купить

В какие моменты и как именно лучше писать сообщения потенциальным клиентам

Forbes
Новые космические бизнесы: Евгений Кузнецов Новые космические бизнесы: Евгений Кузнецов

«Космические разработки касаются каждого»

Esquire
Ловкость рук Ловкость рук

Заменит ли искусственный интеллект человеческий разум и ручной труд?

Grazia
Комета Борисова оказалась реликтом экзопланетной системы Комета Борисова оказалась реликтом экзопланетной системы

До встречи с Солнцем комета оставалась нетронутой с момента своего образования

N+1
Предел совершенству Предел совершенству

Мы можем становиться иными... Но до какого предела?

Psychologies
«Набат разума раздается по всему миру»: как Олимпия де Гуж стала прабабушкой феминизма «Набат разума раздается по всему миру»: как Олимпия де Гуж стала прабабушкой феминизма

Олимпия де Гуж стремилась доказать, что женщины ничем не хуже мужчин

Forbes
Не кочегарки и не плотницы: как женщины осваивают запрещенные раньше в России профессии Не кочегарки и не плотницы: как женщины осваивают запрещенные раньше в России профессии

Список запрещенных для женщин профессий устарел

Forbes
Твердая отцовская рука: 7 способов наказать ребенка без ремня Твердая отцовская рука: 7 способов наказать ребенка без ремня

Что делать, когда тебя просят поговорить с сыном «по-мужски, чтобы он понял»

Maxim
Спаржа Спаржа

Готовьтесь, в апреле начинается сезон спаржи

Здоровье
«Война за орбиту»: как СССР и США готовились к космической третьей мировой войне «Война за орбиту»: как СССР и США готовились к космической третьей мировой войне

Решающим сражением в третьей мировой станет битва за орбиту

Maxim
С мечтой о Мальте С мечтой о Мальте

Как российский император Павел I протянул руку помощи рыцарям-католикам

Дилетант
Знаменитые режиссеры-педагоги Знаменитые режиссеры-педагоги

Знаменитые режиссеры, которые учили студентов повторять их успех

Культура.РФ
Как убрать рекламу в Яндекс браузере: 4 способа Как убрать рекламу в Яндекс браузере: 4 способа

Рассказываем, как убрать рекламу в браузере Яндекс навсегда

CHIP
В видоискателе — животный мир В видоискателе — животный мир

Как стать фотографом-натуралистом?

Наука и жизнь
«Черные лебеди» Гоголя: что погубило бизнес-план Чичикова по покупке мертвых душ «Черные лебеди» Гоголя: что погубило бизнес-план Чичикова по покупке мертвых душ

Глава из книги Леонида Клейна «Бесполезная классика» о нелегком пути Чичикова

Forbes
15 мыслей Валерия Меладзе 15 мыслей Валерия Меладзе

Валерий Меладзе о самом прекрасном, что случилось в его грешной жизни

GQ
Редкий кадр: 7 женщин-режиссеров в истории «Оскара» Редкий кадр: 7 женщин-режиссеров в истории «Оскара»

За историю «Оскара» на статуэтку претендовали всего семь женщин-режиссеров

Forbes
Фон для измены: почему люди предают любимых Фон для измены: почему люди предают любимых

Секс-терапевт — о социальных, культурных и психологических причинах неверности

Reminder
Большие амурские наводнения Большие амурские наводнения

Трижды за последние десять лет на Амуре происходили очень большие наводнения

Наука и жизнь
«Надо перестать стесняться»: предприниматель выставил валенки на Kickstarter, чтобы сделать их популярными за рубежом «Надо перестать стесняться»: предприниматель выставил валенки на Kickstarter, чтобы сделать их популярными за рубежом

На Kickstarter появился проект Voylok, собирающий деньги на валенки

VC.RU
«Я любила сказочную музыку, и в этом ничего не поменялось»: Катя Шилоносова о поисках вдохновения и современных стриминговых сервисах «Я любила сказочную музыку, и в этом ничего не поменялось»: Катя Шилоносова о поисках вдохновения и современных стриминговых сервисах

Катя Шилоносова о детстве в Казани и очарованности московским «Детским миром»

Esquire
«Слушать» не значит «слышать»: почему важно быть хорошим собеседником «Слушать» не значит «слышать»: почему важно быть хорошим собеседником

Как вернуть утраченный навык слушать собеседника?

Psychologies
7 самых странных средств от похмелья 7 самых странных средств от похмелья

Человечество всегда искало и находило средства для лечения похмелья

Maxim
Самые крутые фильмы про супергероев: список 20 лучших от Playboy Самые крутые фильмы про супергероев: список 20 лучших от Playboy

Подборка культовых супергеройских картин, обязательных к просмотру

Playboy
Что такое сновидения Что такое сновидения

Ученые объясняют феномен сна и все, что в это время происходит с мозгом

GQ
Встала и пошла Встала и пошла

Юлия Высоцкая – о красоте, спорте и одинаковых лицах из «Инстаграма»

Домашний Очаг
Новый антибиотик избавил мышей от гонореи Новый антибиотик избавил мышей от гонореи

Описанное соединение имеет шанс перейти к клиническим испытаниям

N+1
«Я тебя люблю… или просто жалею?» «Я тебя люблю… или просто жалею?»

Искренне ли мы любим человека или попросту его жалеем?

Psychologies
Открыть в приложении