Чем хороша новая версия популярного бота от OpenAI GPT-4

ForbesHi-Tech

Четвертое измерение: что умеет новая языковая модель от OpenAI GPT-4

Манвел Аветисян

Фото Silas Stein / picture alliance via Getty Images

С момента появления ChatGPT в интернете уже разошлись мемы с вакансией «выключателя», который должен вытащить вилку из розетки, если ИИ внутри модели оживет. Директор по развитию прикладных проектов Института искусственного интеллекта AIRI Манвел Аветисян рассказывает о том, что сейчас умеет новая версия основы популярного бота GPT-4 и как релиз новинки от OpenAI отразится на нашей жизни.

Эволюция языковых моделей

Бурное развитие умных языковых ботов началось с довольно простой мысли: в виде текста можно представить огромное количество задач, а значит, можно научить модели ИИ эти задачи решать. В 2017 году появились трансформерные архитектуры, способные обучаться на больших объемах текстов. Чуть позже ученые совместили обучение с подкреплением (Reinforcement learning, RL, технология, которая позволяет «хвалить» программу за правильные действия и «наказывать» за неправильные) с большими языковыми моделями, такими, как GPT-3 (Large Language Models, LLM). Получился ChatGPT.

Представьте себе игру в шахматы: подкрепление в ней — это результат игры. Компьютерному агенту на основе искусственного интеллекта необходимо научиться делать ходы, которые приведут к победе. Люди способны действовать с подкреплением, удаленным на годы вперед, например, долго и усердно трудиться в школе и университете, чтобы получить первую зарплату. Компьютеру сложно выполнять длинные последовательности действий для достижения итогового результата, и разработчикам приходится учить ИИ «заглядывать вперед» при выборе следующего шага. Исследователи начали обучать модели, способные отвечать на вопросы человека и интегрировать в них огромные объемы человеческой обратной связи.

Среди основных прорывов, полученных исследователями в последнее время, можно отметить:

  • Toolformer, LLM от Meta (признана в России экстремистской организацией и запрещена): исследователи научили большие языковые модели обращаться к внешним инструментам (веб-поиску, переводчику, калькулятору).
  • LLaMA, LLM от Meta (признана экстремистской организацией на территории РФ): ученые доказали, что объем данных для обучения модели важнее, чем ее сложность. Более легкие по вычислительным ресурсам модели с большими выборками обучающих данных обошли большие модели в качестве решения прикладных задач.
  • ChatGPT на Bing научился указывать источники тех или иных фактов, которые он приводит в ответе на вопрос.

Плюсы и минусы нового движка

GPT-4 — последняя из больших языковых моделей семейства GPT от OpenAI: GPT-2, GPT-3 и GPT-3.5, которая легла в основу первой версии популярного бота ChatGPT. Модель состоит из большого количества нейросетей, которые умеют обрабатывать, понимать, анализировать, интерпретировать и генерировать тексты на естественном языке. Несмотря на то что четвертая версия модели понимает 28 языков, включая малоресурсные валлийский язык и урду (близкий к хинди язык индоевропейской семьи), наилучшие результаты по-прежнему можно получить, используя для создания промптов (так называются фразы-запросы к модели) английский.

GPT-4 прошел проверку эффективности на множестве экзаменов — как академических, так и профессиональных. Порой работы модели превосходили результаты большинства параллельно тестируемых людей. Например, на смоделированном экзамене для адвокатов (Uniform Bar Examination) GPT-4 оказалась среди 10% лучших участников теста, в то время как ChatGPT оказался среди худших 10%. Кроме того, согласно данным технического отчета OpenAI, сгенерированные GPT-4 ответы нравились тестовой группе пользователей в 70,2% случаев чаще, чем ответы GPT-3.5. Впрочем, по словам самих создателей, разница между ответами от двух версий бота может показаться незаметной в процессе работы с интерфейсом.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ничего личного Ничего личного

Несколько правил, которые позволят сохранить часть личных сведений при себе

Цифровой океан
Кто придумал водку? Нет, не Менделеев! Какие еще варианты? Кто придумал водку? Нет, не Менделеев! Какие еще варианты?

Легенда об открытии водки Менделеевым весьма далека от реальной ситуации

ТехИнсайдер
Насморк, прощай Насморк, прощай

Насморк – это не самостоятельная болезнь, а симптом различных заболеваний

Лиза
Искусственная кожа, выдерживающая экстремальный холод и убивающая микробов: теперь покров кальмаров могут носить и люди Искусственная кожа, выдерживающая экстремальный холод и убивающая микробов: теперь покров кальмаров могут носить и люди

Искусственная кожа сможет убивать бактерии и грибки

ТехИнсайдер
Жалобы, игнорирование, саботаж: 10 признаков того, что вы пассивно-агрессивны Жалобы, игнорирование, саботаж: 10 признаков того, что вы пассивно-агрессивны

Накопленная агрессия обладает разрушительной силой, но нам сложно распознать ее

Psychologies
Родинки Родинки

Чтобы родинки не причинили больших неприятностей, их надо регулярно проверять

Здоровье
10 самых сексуальных женщин-роботов в кино 10 самых сексуальных женщин-роботов в кино

Красавицы на микрочипах поджидают тебя в лучших фантастических фильмах

Maxim
«Слишком много шума» «Слишком много шума»

Лев Ландау выделялся глубоким пониманием всех разделов физической науки

Наука
Принять свое одиночество Принять свое одиночество

Какие шаги можно предпринять, чтобы легче переживать одиночество?

Psychologies
Причина 8% всех смертей может быть связана с плохим сном (и речь не только про его недостаток) Причина 8% всех смертей может быть связана с плохим сном (и речь не только про его недостаток)

Недостаток сна влияет на ваше здоровье сильнее, чем вы думали

Inc.
Как доверие в обществе связано с богатством, демократией и долголетием Как доверие в обществе связано с богатством, демократией и долголетием

Как доверие влияет на долголетие, благосостояние граждан и демократию

Forbes
5 вопросов, которые помогут узнать истинный возраст мозга — протестируй свой! 5 вопросов, которые помогут узнать истинный возраст мозга — протестируй свой!

Можно ли определить возраст мозга?

VOICE
Как долго человек может обходиться без сна? И что случится, если хронически недосыпать? Как долго человек может обходиться без сна? И что случится, если хронически недосыпать?

Насколько важен регулярный сон для повседневной жизни человека?

ТехИнсайдер
Пчелы ориентируются в полете, как пилоты первых самолетов Пчелы ориентируются в полете, как пилоты первых самолетов

Чем похожи пчелы и пилоты-люди?

ТехИнсайдер
Сколько цветов принято дарить девушке и как сделать это правильно Сколько цветов принято дарить девушке и как сделать это правильно

Изучаем нормы цветочного этикета

Maxim
Короли небес Короли небес

Завершается полувековая история производства Boeing 747

ТехИнсайдер
Боль и слова Боль и слова

Актеры сериала «Содержанки» – о любви

Новый очаг
И смех и грех И смех и грех

Как нарастить броню, надежно защищающую от насмешек?

Лиза
Самый большой и самый маленький астероиды Солнечной системы: какой сможет уничтожить планету? Самый большой и самый маленький астероиды Солнечной системы: какой сможет уничтожить планету?

Откуда возникают астероиды и что влияет на их размер?

ТехИнсайдер
Боль так сладка!.. Как современные авторы описывают абьюз: разбор с примерами Боль так сладка!.. Как современные авторы описывают абьюз: разбор с примерами

Психолог рассказывает про абьюз в современной литературе

Psychologies
Мебель ищет дорогу к покупателю Мебель ищет дорогу к покупателю

После спада производства мебельные компании стараются увеличить продажи

Эксперт
Что можно сажать в марте: ранняя подготовка к богатому урожаю Что можно сажать в марте: ранняя подготовка к богатому урожаю

Март — идеальный месяц для посадки некоторых культур

ТехИнсайдер
Агенты паранойи Агенты паранойи

Как манга о Холодной войне вскрывает травмы современной Японии

Weekend
Amirchik: «У меня такой период, когда я бы с радостью не трогал телефон вообще» Amirchik: «У меня такой период, когда я бы с радостью не трогал телефон вообще»

Amirchik — о том, почему его удручают соцсети и что делает счастливым

ЖАРА Magazine
Земля шести «единорогов»: как растут стартапы в Греции и других странах Балкан Земля шести «единорогов»: как растут стартапы в Греции и других странах Балкан

Как устроен венчурный рынок в балканский странах?

Forbes
Напиток покрепче: кто такой Пол Мескал — номинант на Напиток покрепче: кто такой Пол Мескал — номинант на

Рассказываем, почему имя Пола Мескала нужно запомнить

Правила жизни
Невозвращенец Невозвращенец

Один из первых политических эмигрантов Петровской эпохи — Авраам Веселовский

Дилетант
Как избавиться от запаха в холодильнике раз и навсегда: натуральные освежители найдутся в каждом доме Как избавиться от запаха в холодильнике раз и навсегда: натуральные освежители найдутся в каждом доме

Как сохранить продукты в холодильнике в свежести и чистоте?

ТехИнсайдер
Как выглядеть дорого, но покупать мало вещей: совет стилиста Как выглядеть дорого, но покупать мало вещей: совет стилиста

Как насмотренность и умение выбирать одежду по запросу помогает сэкономить

VOICE
Переложение для восьми волосов Переложение для восьми волосов

Генетики хотели разобраться со здоровьем Бетховена, но уперлись в генеалогию

N+1
Открыть в приложении