Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Человек-будильник и еще 4 необычные ретрофотографии Человек-будильник и еще 4 необычные ретрофотографии

Хорошо, что человечество изобрело не только фото, но и буквы

Maxim
Как помочь партнеру с социофобией? Как помочь партнеру с социофобией?

Социофобия — не просто застенчивость, а настоящее психическое расстройство

Psychologies
«На такие условия на входе никто бы не согласился»: почему не все инвесторы Telegram довольны Павлом Дуровым «На такие условия на входе никто бы не согласился»: почему не все инвесторы Telegram довольны Павлом Дуровым

Что команда Павла Дурова предложила инвесторам?

Forbes
Cтройными рядами Cтройными рядами

Выходим из карантина красиво

Лиза
Хитрая схема: почему бензин в России не дешевеет даже при ценах на нефть, как в 2000-х Хитрая схема: почему бензин в России не дешевеет даже при ценах на нефть, как в 2000-х

Нефтяные котировки рухнули до уровней 2000-х, а цены на бензин не снижаются

Forbes
Как жить дальше: какие вопросы задают бизнесмены своим психологам в разгар кризиса Как жить дальше: какие вопросы задают бизнесмены своим психологам в разгар кризиса

Как найти в себе силы двигаться и решать насущные вопросы в условиях кризиса

Forbes
Археологи предложили новый способ поиска древнего пива Археологи предложили новый способ поиска древнего пива

Археологи экспериментально проверили способ выявления следов пива

N+1
Фитнес без движения: как наш мозг сжигает много лишних калорий Фитнес без движения: как наш мозг сжигает много лишних калорий

Для сжигания калорий вовсе не обязательно пыхтеть на беговой дорожке

Популярная механика
Выход из самоизоляции: налаживаем режим дня Выход из самоизоляции: налаживаем режим дня

Что делать, чтобы появилась энергия структурировать свой день?

Psychologies
Трихолог — о способах борьбы с выпадением волос Трихолог — о способах борьбы с выпадением волос

Как справиться с облысением?

РБК
Химики остановили миграцию ионов в перовските Химики остановили миграцию ионов в перовските

Химикам удалось получить двумерную пленку из двух разных материалов

N+1
Новое дело Новое дело

Осваивай востребованные профессии, не выходя из дома

Лиза
Нержавеющая катастрофа: история самого загадочного автомобиля 1980-х Нержавеющая катастрофа: история самого загадочного автомобиля 1980-х

История Delorean DMC-12 — это драма о бунтаре Джоне Захарии Долореане

Популярная механика
9 способов выжить в самых неблагоприятных ситуациях 9 способов выжить в самых неблагоприятных ситуациях

Смертельные опасности будут обходить тебя стороной, если ты прочтешь эту статью!

Maxim
Зумеры на бумере Зумеры на бумере

Василий Степанов о сериале «Мир! Дружба! Жвачка!»

Weekend
Наше увлечение модой и страсть к покупкам убивают планету Наше увлечение модой и страсть к покупкам убивают планету

В погоне за модой человечество оказалось на дне глобальной мусорной ямы

GQ
Деревянко, Высоцкая, Виторган и другие — о карантине и приметах времени Деревянко, Высоцкая, Виторган и другие — о карантине и приметах времени

Филиппенко, Деревянко, Виторган и Высоцкая — как они проводят время

РБК
Молодой горячий нептун мигрировал к своей звезде Молодой горячий нептун мигрировал к своей звезде

В системе K2-25 не нашли другого тела, которое изменило бы орбиту экзопланеты

N+1
Пользователи твиттера запустили флешмоб #МояСтыднаяИстория. Они делятся самыми неловкими историями из своей жизни Пользователи твиттера запустили флешмоб #МояСтыднаяИстория. Они делятся самыми неловкими историями из своей жизни

Самые неловкие истории из жизни пользователей рунета

Esquire
5 действительно чокнутых правителей 5 действительно чокнутых правителей

Их подданным, конечно, не повезло

Maxim
8 лучших приложений для начинающих гитаристов 8 лучших приложений для начинающих гитаристов

Пора показать этой лопатообразной бренчалке кто здесь хозяин!

Maxim
«Потягушки»: как встать с постели «Потягушки»: как встать с постели

Как, едва проснувшись, сразу задать правильный тон всему дню

Psychologies
Как устроить дегустацию вина дома Как устроить дегустацию вина дома

Краткий гид для тех, кто хочет развеяться

Reminder
До сих пор работают! Лучшие упражнения из аэробики 90-х от Синди Кроуфорд До сих пор работают! Лучшие упражнения из аэробики 90-х от Синди Кроуфорд

Несложный комплекс упражнений поможет преобразить фигуру

Cosmopolitan
Картина мира предпринимателя Михаила Перегудова Картина мира предпринимателя Михаила Перегудова

Предприниматель Михаил Перегудов об эмоциональных спадах и состоянии потока

Reminder
Пример умножения. Тест-драйв Cadillac XT6 Пример умножения. Тест-драйв Cadillac XT6

Знакомимся с новым американским кроссовером на африканских дорогах

РБК
Павел Дуров пошел на уступки инвесторам в криптовалюту Telegram Павел Дуров пошел на уступки инвесторам в криптовалюту Telegram

Павел Дуров согласился на уступку покупателям криптовалюты Gram

Forbes
Далеко не первая Далеко не первая

Если ты выбрала «мужчину с прошлым», в браке будет маячить призрак его бывшей

Cosmopolitan
Статус «все сложно»: знакомьтесь, нью-йоркский бренд Vaquera Статус «все сложно»: знакомьтесь, нью-йоркский бренд Vaquera

Эксперты не определились, можно ли считать Vaquera модным брендом

GQ
Декрет — это не курорт. Что не так с восприятием материнства обществом Декрет — это не курорт. Что не так с восприятием материнства обществом

Как найти общий язык с ребенком и баланс между вашими потребностями

Forbes
Открыть в приложении