Последним будет слово

Текст Роман Фишман

В будущем «Терминатора» машины побеждают человеческий мир грубой военной силой. Компьютеры «Матрицы» подчиняют людей, напрямую подключаясь к нервной системе и наполняя ее потоком сладких иллюзий. Но в жизни апокалипсис может оказаться куда более утонченным. Похоже, что настоящая угроза исходит от нейросетей, способных разговаривать лучше нас самих.

В конце марта 2023 года Институт будущего жизни* опубликовал открытое письмо, под которым стояли подписи главы SpaceX и Tesla Илона Маска, сооснователя Apple Стива Возняка и еще тысяч не столь громких, но весьма авторитетных фигур в области информационных технологий и искусственного интеллекта (ИИ). Текст оказался медийной бомбой, эхо от взрыва которой прокатилось по всем мировым СМИ, от ведущих глобальных изданий до локальных городских газет. Две фразы в нем выделены жирным шрифтом.

«Мощные системы ИИ следует развивать лишь тогда, когда мы будем уверены, что они произведут позитивный эффект, а все связанные с ними риски можно контролировать». И «мы призываем всех разработчиков немедленно приостановить обучение ИИ мощнее, нежели GPT‑4, минимум на шесть месяцев». Авторы письма недаром назвали такой срок: как раз примерно через полгода, осенью 2023-го, компания OpenAI собирается представить модель GPT‑5, от которой эксперты и ожидают чего-то пока в точности неясного, но, возможно, весьма опасного. Особенно громко об этом заявил знаменитый философ и специалист по ИИ Элиезер Юдковский: «Наиболее вероятным результатом создания сверхразумного ИИ <…> является то, что погибнут буквально все жители Земли».

Подобные тревоги трудно назвать чем-то новым для человечества. Представления о возможности «бунта машин» появились как минимум одновременно со словом «робот». И то и другое впервые встречается в пьесе Карела Чапека, опубликованной еще в 1920 году. С тех пор эта тема прочно укоренилась в массовой культуре и философских дискурсах. Однако стремительный прогресс, который демонстрируют ИИ в последнее десятилетие, перенес ее из области фантастики и философии в повседневную реальность. И тут надо вернуться к модели GPT‑4, упомянутой в том самом открытом письме.

Модельный ряд

Практически все знаменитые нейросети последних лет относятся к типу больших языковых моделей (Large Language Models, LLM). «По сути, это математическая фантазия о том, как устроен язык, — объяснила нам лингвист и разработчица ИИ Татьяна Шаврина. — С точки зрения лингвистики в нем есть синтаксис и морфология, лексика, падежи и т. д. Но если взглянуть на язык статистически, то мы увидим последовательность символов, которые соседствуют с той или иной вероятностью. Если сказано „мама мыла“, то, скорее всего, дальше будет „раму“. Так работает LLM — большая вероятностная модель, которая описывает все пространство возможных текстов».

Благодаря некоторым удачно найденным архитектурным решениям и математическим приемам LLM уже прекрасно справляются с анализом и генерацией последовательностей слов, и не только слов. На волне успеха языковых моделей обнаружилось, что те же технологии отлично подходят и для других последовательностей: нот в музыке, команд в компьютерном коде, нуклеотидов в ДНК, атомов в молекулах, даже картинок, — если разложить их в цепочку пикселей. Благодаря этому LLM находят самое широкое применение и за пределами языка. Все эти модели работают словно гигантские функции с колоссальным количеством параметров.

GPT‑3, которую компания OpenAI опубликовала в 2020 году, содержала 175 миллиардов таких параметров, настроенных в процессе обучения на массиве из более чем 570 Гб текстов, в десятки раз больше полного объема «Википедии». А в 2023-м OpenAI представила GPT‑4, ИИ следующего поколения. Одним из нововведений стала дополнительная модель-ранжировщик, работающая поверх самой LLM. «Она была обучена на ответах реальных людей, которые давали оценки сгенерированным текстам, находя фактологические и стилистические ошибки, проверяя их на оскорбления, „токсичность“ и т. д., — говорит Татьяна Шаврина. — В GPT‑4 эта модель работает как внутренний цензор, фильтруя ответы нейросети. Такой прием сильно повысил качество генерации».

Последним будет слово

Модельный ряд

Рекомендуемые статьи

Суперкомпьютер из Дубны — один из мощнейших в мире

Откуда в нас берется синдром отличника и почему от него стоит избавляться

Чем ИИ напугал сильнейшие умы человечества

Немногие талисманы на удачу так же узнаваемы, как подкова!

Испытание гарнитуры дополненной реальности Hololens 2

Анна Философова — светская дама, боровшаяся за образование для женщин

Правда ли тренировки заряжают энергией?

Книги, действие которых разворачивается по России: от Санкт-Петербурга до Сибири

Одна из самых интересных технологий, переживающая настоящий ренессанс – фойлы

Необычный способ избавления от лишнего веса

Как Министерство цифрового развития связано с охраной памятников

Весна — лучшее время пробовать новое и жить жизнь в ярких красках

Как Андрей Монастырский перевел в акции поэзию абсурда

Думаете, главная трудность с психотерапией — это дойти до нее?

«Зеленые легкие планеты, первобытная среда обитания»

Как холод влияет на организм человека?

Низкопрофильные шины, сенсорные панели и многое другое: что раздражает водителей

Приходится ли тебе время от времени слышать «Ну ты прямо мать Тереза!»?

6 причин, из-за которых вес стоит на месте, и как это исправить

Почему аниме «нового Миядзаки», как иногда называют Синкая, стоит смотреть

Функции цензуры в Российской империи середины XIX века

Родной язык влияет на восприятие музыки

О том, как превратить скучный онбординг в переписку в мессенджере

Рекламное агентство сократило расходы на сотрудников, заменив их нейросетью

Почему мы так часто останавливаем выбор не на тех?

Тонкая грань между реальностью и игрой воображения в рассказе Веры Богдановой

Это должно было случиться: люди стали влюбляться в виртуальных персонажей

Чем опасны бьюти-подделки и как отличить оригинальную косметику от реплик?

Российские автомобили стали главными на отечественном рынке

Аутизм — расстройство, которое может проявляться совершенно по-разному