Последним будет слово
В будущем «Терминатора» машины побеждают человеческий мир грубой военной силой. Компьютеры «Матрицы» подчиняют людей, напрямую подключаясь к нервной системе и наполняя ее потоком сладких иллюзий. Но в жизни апокалипсис может оказаться куда более утонченным. Похоже, что настоящая угроза исходит от нейросетей, способных разговаривать лучше нас самих.
В конце марта 2023 года Институт будущего жизни* опубликовал открытое письмо, под которым стояли подписи главы SpaceX и Tesla Илона Маска, сооснователя Apple Стива Возняка и еще тысяч не столь громких, но весьма авторитетных фигур в области информационных технологий и искусственного интеллекта (ИИ). Текст оказался медийной бомбой, эхо от взрыва которой прокатилось по всем мировым СМИ, от ведущих глобальных изданий до локальных городских газет. Две фразы в нем выделены жирным шрифтом.
«Мощные системы ИИ следует развивать лишь тогда, когда мы будем уверены, что они произведут позитивный эффект, а все связанные с ними риски можно контролировать». И «мы призываем всех разработчиков немедленно приостановить обучение ИИ мощнее, нежели GPT‑4, минимум на шесть месяцев». Авторы письма недаром назвали такой срок: как раз примерно через полгода, осенью 2023-го, компания OpenAI собирается представить модель GPT‑5, от которой эксперты и ожидают чего-то пока в точности неясного, но, возможно, весьма опасного. Особенно громко об этом заявил знаменитый философ и специалист по ИИ Элиезер Юдковский: «Наиболее вероятным результатом создания сверхразумного ИИ <…> является то, что погибнут буквально все жители Земли».
Подобные тревоги трудно назвать чем-то новым для человечества. Представления о возможности «бунта машин» появились как минимум одновременно со словом «робот». И то и другое впервые встречается в пьесе Карела Чапека, опубликованной еще в 1920 году. С тех пор эта тема прочно укоренилась в массовой культуре и философских дискурсах. Однако стремительный прогресс, который демонстрируют ИИ в последнее десятилетие, перенес ее из области фантастики и философии в повседневную реальность. И тут надо вернуться к модели GPT‑4, упомянутой в том самом открытом письме.
Модельный ряд
Практически все знаменитые нейросети последних лет относятся к типу больших языковых моделей (Large Language Models, LLM). «По сути, это математическая фантазия о том, как устроен язык, — объяснила нам лингвист и разработчица ИИ Татьяна Шаврина. — С точки зрения лингвистики в нем есть синтаксис и морфология, лексика, падежи и т. д. Но если взглянуть на язык статистически, то мы увидим последовательность символов, которые соседствуют с той или иной вероятностью. Если сказано „мама мыла“, то, скорее всего, дальше будет „раму“. Так работает LLM — большая вероятностная модель, которая описывает все пространство возможных текстов».
Благодаря некоторым удачно найденным архитектурным решениям и математическим приемам LLM уже прекрасно справляются с анализом и генерацией последовательностей слов, и не только слов. На волне успеха языковых моделей обнаружилось, что те же технологии отлично подходят и для других последовательностей: нот в музыке, команд в компьютерном коде, нуклеотидов в ДНК, атомов в молекулах, даже картинок, — если разложить их в цепочку пикселей. Благодаря этому LLM находят самое широкое применение и за пределами языка. Все эти модели работают словно гигантские функции с колоссальным количеством параметров.
GPT‑3, которую компания OpenAI опубликовала в 2020 году, содержала 175 миллиардов таких параметров, настроенных в процессе обучения на массиве из более чем 570 Гб текстов, в десятки раз больше полного объема «Википедии». А в 2023-м OpenAI представила GPT‑4, ИИ следующего поколения. Одним из нововведений стала дополнительная модель-ранжировщик, работающая поверх самой LLM. «Она была обучена на ответах реальных людей, которые давали оценки сгенерированным текстам, находя фактологические и стилистические ошибки, проверяя их на оскорбления, „токсичность“ и т. д., — говорит Татьяна Шаврина. — В GPT‑4 эта модель работает как внутренний цензор, фильтруя ответы нейросети. Такой прием сильно повысил качество генерации».