Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Сексуальные привычки животных: 5 самых необычных способов оплодотворения в дикой природе Сексуальные привычки животных: 5 самых необычных способов оплодотворения в дикой природе

Самые странные способы оплодотворить свою вторую половинку в животном мире

Популярная механика
С кем женщины категории MILF предпочитают заниматься сексом? С кем женщины категории MILF предпочитают заниматься сексом?

Почему «Пум» становится все больше и как мы к этому относимся?

Maxim
Как отличить поддельный смартфон от оригинального Как отличить поддельный смартфон от оригинального

Гайд, как обнаружить поддельное устройство, заказанное на маркетплейсе

Maxim
«Петровы в гриппе» — фильм, который обретает новый смысл теперь, когда Россия закончила выступление и в Венеции, и в Каннах «Петровы в гриппе» — фильм, который обретает новый смысл теперь, когда Россия закончила выступление и в Венеции, и в Каннах

«Петровы в гриппе» — фильм, от которого бросает то в холод, то в жар

Esquire
У Майка Омера вышел новый триллер «Странные игры». MAXIM публикует эксклюзивный отрывок! У Майка Омера вышел новый триллер «Странные игры». MAXIM публикует эксклюзивный отрывок!

Глава из нового романа Майка Омера, от которого волосы встают дыбом

Maxim
Режиссер. Данила Козловский Режиссер. Данила Козловский

Данила Козловский вновь в режиссерском кресле и вновь с наградой

GQ
«Как хорошо без женщины!» 5 главных муз Александра Вертинского «Как хорошо без женщины!» 5 главных муз Александра Вертинского

Главные жизни в жизни киноактера Александра Вертинского

Cosmopolitan
Почему у человека нет хвоста? Ответ генетиков Почему у человека нет хвоста? Ответ генетиков

У человека и человекообразных обезьян нет хвоста. Почему?

Популярная механика
Из Ирана с иронией: люди, ислам, диковинные способы пить и заниматься сексом Из Ирана с иронией: люди, ислам, диковинные способы пить и заниматься сексом

Мы отправили нашего корреспондента в одну из самых неуютных стран мира

Maxim
Котик или зая? Узнай значение своего прозвища и что оно говорит о вашей любви Котик или зая? Узнай значение своего прозвища и что оно говорит о вашей любви

Ласковые прозвища возникают не просто так

VOICE
Донбасс против Украины: кто победит? Донбасс против Украины: кто победит?

Сравнение военного потенциала участников войны в Донбассе

Эксперт
Редкие автомобильные эмблемы, которые ты часто видишь, но не можешь определить Редкие автомобильные эмблемы, которые ты часто видишь, но не можешь определить

Стань гуру карспоттинга!

Maxim
Избранные моменты из скандального интервью Дмитрия Гордона и Моргенштерна Избранные моменты из скандального интервью Дмитрия Гордона и Моргенштерна

Лучшие цитаты из удивительной беседы Гордона и Моргенштерна

Maxim
Палеонтологи описали энанциорниса с двумя удлиненными перьями в хвосте Палеонтологи описали энанциорниса с двумя удлиненными перьями в хвосте

Палеонтологи описали новую энанциорнисовую птицу из раннего мела Китая

N+1
Бытовая магия: как привлечь удачу и деньги в дом? Бытовая магия: как привлечь удачу и деньги в дом?

Что нужно сделать, чтобы привлечь богатство и денежную удачу

VOICE
“Нам свойственно идеализировать прошлое»: как молодые артисты возвращают моду на ретро-музыку” “Нам свойственно идеализировать прошлое»: как молодые артисты возвращают моду на ретро-музыку”

Феномен ностальгии в новой русской музыке

Esquire
Лицо с экрана. Антон Лапенко Лицо с экрана. Антон Лапенко

Комик Антон Лапенко превращается в полноценную кинозвезду

GQ
Тикток-поп: жанр, полностью меняющий русскую поп-музыку прямо сейчас Тикток-поп: жанр, полностью меняющий русскую поп-музыку прямо сейчас

Как и во что эволюционирует отечественная поп-сцена на наших глазах

Esquire
Никита Ефремов: «Когда ты переносишь свое внимание на работу, она начинает оживать» Никита Ефремов: «Когда ты переносишь свое внимание на работу, она начинает оживать»

Актер Никита Ефремов рассказал о своем стиле и работе c Тэроном Эджертоном

GQ
Бешенство: как защитить себя от смертельно опасной болезни Бешенство: как защитить себя от смертельно опасной болезни

Самую важная информация о бешенстве

РБК
Майя вернулись в город после извержения и построили из туфа пирамиду Майя вернулись в город после извержения и построили из туфа пирамиду

Извержение вулкана позитивно отразилось на социальной интеграции общества майя

N+1
«Не хочу отдавать падчерице свободную комнату в своем доме» «Не хочу отдавать падчерице свободную комнату в своем доме»

После развода родителей дети часто становятся причиной споров и конфликтов

Psychologies
Гормон-шило Гормон-шило

Новые открытия о нашем главном гормоне – тестостероне

Maxim
Какие мужчины и почему интересуются сексуальным прошлым своих партнерш Какие мужчины и почему интересуются сексуальным прошлым своих партнерш

Стоит ли рассказывать мужчине о прошлых отношениях?

Psychologies
Темное дело Темное дело

Британский дизайнер Нил Барретт решил, что яркие краски дома не нужны

AD
“Рекордов не надо, это просто дети!” “Рекордов не надо, это просто дети!”

Музыка может многому научить и нас, и наших детей

Psychologies
Чистое место: сауна Чистое место: сауна

Саун в Финляндии больше, чем автомобилей

Вокруг света
Синдром опустевшего гнезда Синдром опустевшего гнезда

Как сблизиться с мужем и вернуть отношениям смысл, когда дети выросли

Лиза
Жители Новой Гвинеи начали выращивать птенцов казуаров в неволе 17,8 тысячи лет назад Жители Новой Гвинеи начали выращивать птенцов казуаров в неволе 17,8 тысячи лет назад

Жители Новой Гвинеи уже 17,8 тысячи лет назад похищали из гнезд яйца казуаров

N+1
Совсем запутались Совсем запутались

Праймеры, пасты, кремы, пудра – и все это для волос!

Лиза
Открыть в приложении