Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как у Брижит или Хадид Как у Брижит или Хадид

Модная челка: 9 лучших вариантов

Лиза
«Слишком хороший сын»: мой мужчина чрезмерно заботится о матери «Слишком хороший сын»: мой мужчина чрезмерно заботится о матери

Как мужчина относится к своей матери, так он будет относиться к своей жене?

Psychologies
Желаю всего самого лучшего Желаю всего самого лучшего

Что будет, если попробовать желать себе всего самого лучшего

Psychologies
Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья Эмили Ратаковски, Шакира и другие роскошные женщины, которым изменили мужья

Даже звезды порой сталкиваются с циничным обманом

VOICE
Первые красавицы с тяжелой судьбой: советские киноактрисы, которые сошли с ума Первые красавицы с тяжелой судьбой: советские киноактрисы, которые сошли с ума

Этим актрисам прочили прекрасное светлое будущее. Но, увы, вмешалась судьба

VOICE
Отпуск без обязательств: что такое экспресс-путешествия и почему они набирают популярность в России Отпуск без обязательств: что такое экспресс-путешествия и почему они набирают популярность в России

Как спонтанные поездки ворвались в нашу жизнь, потеснив привычные путешествия

Вокруг света
Как правильно посадить чеснок осенью: советы для тех, кто хочет получить богатый урожай Как правильно посадить чеснок осенью: советы для тех, кто хочет получить богатый урожай

Если решили взяться за выращивание чеснока, начните готовить грядки уже сейчас

ТехИнсайдер
Правила жизни Нила Армстронга Правила жизни Нила Армстронга

Правила жизни астронавта Нила Армстронга

Правила жизни
Физики добились субпикосекундного переключения бозе-конденсата при комнатной температуре Физики добились субпикосекундного переключения бозе-конденсата при комнатной температуре

Физики добились потенциального улучшения оптоэлектронных устройств

N+1
Наталья Подольская и Владимир Пресняков. «Так и живем: один подумал — другой сказал» Наталья Подольская и Владимир Пресняков. «Так и живем: один подумал — другой сказал»

Интервью с Натальей Подольской о ее детях, программах и песнях

Коллекция. Караван историй
Почему август в России считают проклятым месяцем? Почему август в России считают проклятым месяцем?

Кризисы, катастрофы и трагедии, которые происходили с Россией в августе

Maxim
Двигатель EmDrive в самом деле нарушает законы физики, или это очередной фейк? Двигатель EmDrive в самом деле нарушает законы физики, или это очередной фейк?

По словам изобретателя, этот двигатель опровергает принципы физики

ТехИнсайдер
Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера Одна вокруг света: знаменитая Дорога смерти и Королевская Кордильера

181-я серия о кругосветном путешествии москвички Ирины Сидоренко: Боливия

Forbes
Как зарабатывать на рекламе на автомобиле и не получить штрафы Как зарабатывать на рекламе на автомобиле и не получить штрафы

Как превратить автомобиль в средство продвижения рекламы в массы?

РБК
Гриша Брускин: «Я смотрю туда, куда другие не смотрят» Гриша Брускин: «Я смотрю туда, куда другие не смотрят»

Гриша Брускин — о взаимоотношении литературы и визуального искусства

Полка
Навязанные «удобства» Навязанные «удобства»

Без чего автомобиль может легко обойтись?

Автопилот
Что разрушает наши отношения: 3 причины Что разрушает наши отношения: 3 причины

«Черная триада» — три причины, по которым разрушаются отношения

Psychologies
5 продуктов, которые можно есть перед сном, если вы хотите похудеть 5 продуктов, которые можно есть перед сном, если вы хотите похудеть

Чтобы сбросить лишний вес, есть на ночь не только можно, но и нужно!

ТехИнсайдер
Бегаю в туалет каждые 15 минут: как я живу с гиперактивным мочевым пузырем Бегаю в туалет каждые 15 минут: как я живу с гиперактивным мочевым пузырем

Как проявляется гиперактивность мочевого пузыря?

VOICE
«Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения? «Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения?

Почему женщины не хотят секса в браке и как об этом говорить?

Правила жизни
Будем цифросексуалами? Будем цифросексуалами?

Как изменятся наши отношения?

Psychologies
Почему в СССР ковры вешали на стену: дело совсем не в теплоизоляции Почему в СССР ковры вешали на стену: дело совсем не в теплоизоляции

Ковер — воистину король советского интерьера

VOICE
Георгий Гурьянов: художник, эстет, миф Георгий Гурьянов: художник, эстет, миф

Жизнь и творчество барабанщика группы «Кино» Георгия Гурьянова

СНОБ
Как устроена система охлаждения двигателя: что должен знать каждый Как устроена система охлаждения двигателя: что должен знать каждый

Что нужно знать о системе охлаждения двигателя, чтобы авто работало исправно

РБК
10 научных фактов о фильме «День независимости» 10 научных фактов о фильме «День независимости»

Кинофильм, запрещенный на планетах, где нет чувства юмора

Maxim
Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии

Эта музыка поможет собаке расслабиться, когда она сидит взаперти в машине

ТехИнсайдер
«Никто не знает, что такое внимание»: ученые до сих пор не понимают, почему люди бывают такими рассеянными «Никто не знает, что такое внимание»: ученые до сих пор не понимают, почему люди бывают такими рассеянными

Как именно наш мозг выбирает на что обращать внимание, а на что – нет?

ТехИнсайдер
5 вопросов про Ивана Грозного 5 вопросов про Ивана Грозного

Основанные на домыслах вопросы о жизни Ивана Грозного

Maxim
У древних колоссальных динозавров была мягкая У древних колоссальных динозавров была мягкая

Что позволяло огромным зауроподам иметь такой большой вес?

ТехИнсайдер
Имеют ли право судебные власти Имеют ли право судебные власти

Юрист анализирует право человека на частную жизнь его мозга

ТехИнсайдер
Открыть в приложении