Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Посткапитализм Посткапитализм

Путеводитель по нашему будущему

kiozk originals
Запретный плод Запретный плод

Мария Лобанова решилась подробно рассказать свою женскую историю

Tatler
Овсянка, сэр! 10 сериалов с тонким британским юмором Овсянка, сэр! 10 сериалов с тонким британским юмором

10 классных английских сериалов, которые тебя точно развеселят

Cosmopolitan
3 великолепных романа об экспедициях на Марс 3 великолепных романа об экспедициях на Марс

Подборку остросюжетных произведений, посвященных экспедициям человека на Марс

Популярная механика
Игры с разумом Игры с разумом

На что гаджеты действительно способны и что нам за это будет

Vogue
Мужчины толкали женщин в огонь: как на пожаре в Париже погибли 120 аристократок Мужчины толкали женщин в огонь: как на пожаре в Париже погибли 120 аристократок

Тринадцатый благотворительный базар в Париже стал роковым

Cosmopolitan
Что нужно знать, чтобы избавиться от вредной привычки Что нужно знать, чтобы избавиться от вредной привычки

Можно ли легко избавиться от вредных привычек?

Psychologies
«Вечная блондинка» Голливуда: как поменялась Риз Уизерспун за почти 30 лет «Вечная блондинка» Голливуда: как поменялась Риз Уизерспун за почти 30 лет

Давай вспомним, как красотка Риз Уизерспун менялась с годами!

Cosmopolitan
Художница Нана Тотибадзе — о пирах из детства и героях своих работ Художница Нана Тотибадзе — о пирах из детства и героях своих работ

В работах Наны Тотибадзе звери проживают человеческие жизни

РБК
Закрыть гештальт: как Лев Хасис строит партнерства ради торговых и платежных сервисов «Сбера» Закрыть гештальт: как Лев Хасис строит партнерства ради торговых и платежных сервисов «Сбера»

Как Лев Хасис строит экосистему и почему раз за разом терпит неудачи?

Forbes
Приложение без фильтров: станет ли Dispo новым Instagram для зумеров Приложение без фильтров: станет ли Dispo новым Instagram для зумеров

Как создали Dispo и что сделало его популярным среди молодежи?

Forbes
Страшно красивые: чем чреваты бьюти-стандарты сети Instagram и можно ли их воплотить в реальной жизни? Страшно красивые: чем чреваты бьюти-стандарты сети Instagram и можно ли их воплотить в реальной жизни?

Возможно ли воспроизвести в реальной жизни эффект Instagram-фильтров?

Esquire
Больше, чем поэт Больше, чем поэт

Как русская девочка стала английским поэтом-миллионером

Tatler
Упражнения для красивой попы — как накачать ягодицы без помощи тренера Упражнения для красивой попы — как накачать ягодицы без помощи тренера

Несложный комплекс упражнений для красивой попы

Cosmopolitan
Ирина Кооп-Шароватова Ирина Кооп-Шароватова

Участница легендарной арт-поп-группы «Колибри»

Собака.ru
Спасибо, получила! Спасибо, получила!

Мы много слышали о волшебных оргазмах. Теперь пришло время их испытывать!

Cosmopolitan
OMAD-диета OMAD-диета

OMAD – одна из самых популярных на западе диет

Худеем правильно
Брильянты, балы и браки по расчету: британские сериалы про высшее общество Брильянты, балы и браки по расчету: британские сериалы про высшее общество

Британские сериалы о высшем свете

Cosmopolitan
За вами наблюдают, смиритесь За вами наблюдают, смиритесь

Сервис налоговой службы для хранения электронных чеков вызывает ряд вопросов

Эксперт
Лучшие игры внутри самих игр Лучшие игры внутри самих игр

Казалось бы — глупо заходить в игру, чтобы в ней найти другу игру, поменьше

Maxim
В любых долгосрочных отношениях есть эта сложная фаза. Как ее пережить? В любых долгосрочных отношениях есть эта сложная фаза. Как ее пережить?

Какой этап отношений дается партнерам сложнее всего?

Psychologies
Как становятся стендап-комиками: разговор со стендапером Никитой Некрасовым Как становятся стендап-комиками: разговор со стендапером Никитой Некрасовым

Никита Некрасов — путь комедианта нелегкий, но очень увлекательный

Playboy
Похудеть за неделю: 7 способов, которые не навредят здоровью Похудеть за неделю: 7 способов, которые не навредят здоровью

Как скинуть несколько лишних килограммов в кратчайшие сроки?

Cosmopolitan
Плюсы и минусы вегетарианства. Действительно ли отказ от мяса полезен? Плюсы и минусы вегетарианства. Действительно ли отказ от мяса полезен?

Растительная диета защищает от рака и болезней сердца — но есть свои риски

Reminder
Интервью с IOWA и премьера клипа Интервью с IOWA и премьера клипа

IOWA о том, почему российская музыкальная сцена прониклась большой поэзией

СНОБ
3 черты, которые объединяют самых счастливых людей 3 черты, которые объединяют самых счастливых людей

Что делает счастливых людей такими привлекательными?

Psychologies
Что представляет собой флот Монголии, не имеющей выхода к морю Что представляет собой флот Монголии, не имеющей выхода к морю

К 1990 году монгольский флот состоял из единственного судна

Maxim
Что такое Синдром упущенной выгоды и как его побороть Что такое Синдром упущенной выгоды и как его побороть

Возможно, ты счастливый обладатель Синдрома упущенной выгоды

Maxim
Коперникианская революция: 9 мифов об отце современной астрономии Коперникианская революция: 9 мифов об отце современной астрономии

Что мы знаем о Николае Копернике?

Вокруг света
Материал для победы Материал для победы

Композитная долина позволит запустить производство высокотехнологичной продукции

Эксперт
Открыть в приложении