Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Наука в мире фэнтези: как Брендон Сандерсон создает магические системы Наука в мире фэнтези: как Брендон Сандерсон создает магические системы

Магия и наука – это полные противоположности? Нет!

Популярная механика
Счастливые килограммы: почему мы толстеем после свадьбы Счастливые килограммы: почему мы толстеем после свадьбы

Почему после свадьбы многие женщины толстеют.

VOICE
Как на телефоне обрезать музыку: приложения и онлайн-сервисы Как на телефоне обрезать музыку: приложения и онлайн-сервисы

Из любого трека можно сделать рингтон, но как обрезать музыку для звонка?

CHIP
Знаки приоритета: что это и какие бывают Знаки приоритета: что это и какие бывают

Знаки приоритета являются одними из самых важных на дороге

РБК
Всем знакомо выражение «до свадьбы заживет». Но вы даже не догадываетесь, у кого, а главное что должно было зажить Всем знакомо выражение «до свадьбы заживет». Но вы даже не догадываетесь, у кого, а главное что должно было зажить

А вы знаете, что у кого должно было зажить и до чьей свадьбы?

ТехИнсайдер
Какая река самая длинная? Ответ не так прост Какая река самая длинная? Ответ не так прост

Длина реки больше не считается справедливой мерой

Популярная механика
Марта Геллхорн. Синдром войны Марта Геллхорн. Синдром войны

Она прошла тысячи километров под пулями, побывала почти на всех войнах ХХ века

Караван историй
Магомет идет к горе Магомет идет к горе

Мобильная станция, в которой содержится около 7–8 т различных видов масел

Популярная механика
Факты об осьминогах: удивительные животные, о которых практически ничего не знают даже прожженные умники Факты об осьминогах: удивительные животные, о которых практически ничего не знают даже прожженные умники

У осьминогов три сердца, голубая кровь и необычный механизм защиты от хищников

Популярная механика
Правда ли, что Юпитер — это Правда ли, что Юпитер — это

Был ли у Юпитера шанс стать полноценной звездой?

Популярная механика
Твой дорогой блонд: 5 правил для идеального окрашивания Твой дорогой блонд: 5 правил для идеального окрашивания

Что собой представляет дорогой блонд и как можно добиться такого эффекта

VOICE
Почему «Крестный отец» в первую очередь семейная драма, а не гангстерский боевик Почему «Крестный отец» в первую очередь семейная драма, а не гангстерский боевик

«Крестный отец» — конфликт традиционного общества с городской цивилизацией

Esquire
Пограничное расстройство личности: в чем его причина? Пограничное расстройство личности: в чем его причина?

ПРЛ было и остается одним из наиболее стигматизированных состояний

Psychologies
Что делают неврологи, когда у них болит голова: 8 приемов Что делают неврологи, когда у них болит голова: 8 приемов

Как справляются с головной болью сами врачи?

Psychologies
Гении маскировки: 7 животных с неповторимым камуфляжем Гении маскировки: 7 животных с неповторимым камуфляжем

Порой, то, что кажется «красивым окрасом», является настоящим охотничьим оружием

Популярная механика
Остудить землю Остудить землю

Самые распространенные направления геоинженерии

Вокруг света
10 рецептов от весенней хандры 10 рецептов от весенней хандры

Простые приемы против хандры, которые помогут не опускать руки

Psychologies
Как строить планы в ситуации неопределенности? Как строить планы в ситуации неопределенности?

Планирование помогает обрести уверенность в завтрашнем дне

Psychologies
Что мы должны родителям Что мы должны родителям

Сколько мы должны отдать родителям за жизнь, заботу и воспитание?

Psychologies
Удивительная история матери Юрия Гагарина: женщина, воспитавшая космонавта Удивительная история матери Юрия Гагарина: женщина, воспитавшая космонавта

Когда ее спрашивали, как ей удалось воспитать такого сына, она всегда удивлялась

Популярная механика
Как часто нужно менять постельное белье и стирать одежду: 9 вопросов о гигиене Как часто нужно менять постельное белье и стирать одежду: 9 вопросов о гигиене

Список правил для современной хозяйки, которая действует по науке

Популярная механика
Система сборов Система сборов

Как зарабатывает и сколько тратит Всемирное антидопинговое агентство

Forbes
Возвращение на кровавый перевал: новые данные о гибели группы Игоря Дятлова Возвращение на кровавый перевал: новые данные о гибели группы Игоря Дятлова

В знаменитом деле о гибели тургруппы Дятлова поставлена очередная точка

Популярная механика
Как увеличить скорость работы смартфона на Android Как увеличить скорость работы смартфона на Android

Любой смартфон со временем начинает тормозить, что можно сделать?

ТехИнсайдер
Сквозь хаос девяностых к тревожным нулевым: «Сезон отравленных плодов» — роман о поколении тридцатилетних Сквозь хаос девяностых к тревожным нулевым: «Сезон отравленных плодов» — роман о поколении тридцатилетних

Отрывок из романа Веры Богдановой «Сезон отравленных плодов»

Esquire
Гибрид подлодки и самолета. Почему все забыли о самом страшном советском экраноплане BAA-14 Гибрид подлодки и самолета. Почему все забыли о самом страшном советском экраноплане BAA-14

Pагадочный футуристичный то ли самолёт, то ли подлодка. Что это такое?

ТехИнсайдер
Харуки Мураками. Отрывок из сборника рассказов «От первого лица» Харуки Мураками. Отрывок из сборника рассказов «От первого лица»

Отрывок из меланхоличного автофикшена Харуки Мураками «От первого лица»

СНОБ
«Зеленые» технологии: в Россию возвращается рекуперация энергии «Зеленые» технологии: в Россию возвращается рекуперация энергии

Современных технологий — это не недавние разработки

Популярная механика
История кухарки, которая заразила полсотни человек: первый «нулевой пациент» История кухарки, которая заразила полсотни человек: первый «нулевой пациент»

Мэри Маллон стала первым в истории медицины «нулевым пациентом»

Популярная механика
Родион Галюченко: «Нужно всегда честно и прямо говорить!» Родион Галюченко: «Нужно всегда честно и прямо говорить!»

Родион Галюченко поделился с читательницами о проекте, роли и жизни

Cosmopolitan
Открыть в приложении