Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Назальный спрей с блокатором калиевого канала облегчил ночное апноэ Назальный спрей с блокатором калиевого канала облегчил ночное апноэ

Селективный блокатор калиевого канала TASK 1/3 снижает тяжесть ночного апноэ

N+1
Выкинуть из головы: почему мы так боимся собственного мусора Выкинуть из головы: почему мы так боимся собственного мусора

Антрополог объясняет, почему современный человек так боится собственного мусора?

Esquire
Французский аристократ описал процесс эволюции за 100 лет до Дарвина Французский аристократ описал процесс эволюции за 100 лет до Дарвина

Удивительный ученый, который предвосхитил теорию эволюции Дарвина на сто лет

ТехИнсайдер
Измена: взгляд с двух сторон. Если изменили вам Измена: взгляд с двух сторон. Если изменили вам

Измена — это «симптом» отношений, а в отношениях всегда участвуют две стороны

Psychologies
«Три женщины»: сериал о проблемах женской сексуальности по бестселлеру Лизы Таддео «Три женщины»: сериал о проблемах женской сексуальности по бестселлеру Лизы Таддео

«Три женщины»: откровенный сериал о современных женщинах

Forbes
Meet the Romanoffs Meet the Romanoffs

Великий князь Георгий Михайлович и Виктория Романовна Беттарини

Собака.ru
От электронных биде до кабинок без дверей: краткий гид по общественным туалетам разных стран От электронных биде до кабинок без дверей: краткий гид по общественным туалетам разных стран

Посещение туалета за рубежом может превратиться в целое приключение

СНОБ
Как родительские запреты могут портить нам жизнь Как родительские запреты могут портить нам жизнь

Бывает, человек вырос в хорошей семье, но его взрослая жизнь летит под откос

Psychologies
Как перестать беспокоиться о том, что думают другие Как перестать беспокоиться о том, что думают другие

Как перестать волноваться из-за мнений окружающих по поводу вашей персоны

Psychologies
6 качеств, за которые тебя все возненавидят: избавься от них немедленно! 6 качеств, за которые тебя все возненавидят: избавься от них немедленно!

Если найдешь у себя одно из этих качеств характера, знай: оно всех раздражает

Cosmopolitan
Невеста попросила подруг похудеть к свадьбе, и они обиделись Невеста попросила подруг похудеть к свадьбе, и они обиделись

В погоне за свадьбой мечты легко обидеть гостей

Psychologies
Совпадений нет Совпадений нет

Достичь гармонии реально – если оба партнера постараются

Cosmopolitan
Звук помог пленить спин Звук помог пленить спин

Физики исследовали эффект когерентного пленения спина

N+1
Основатели сети автомоек Fast&Shine занялись IT и производством сыра, а потом стали строителями. Теперь они планируют заработать миллиарды на элитной недвижимости Основатели сети автомоек Fast&Shine занялись IT и производством сыра, а потом стали строителями. Теперь они планируют заработать миллиарды на элитной недвижимости

Аркадий Хохлов и его партнеры рассказали, как вести стройку по Scrum

Inc.
Космический мусор: все, что ты хотел (или не хотел) знать о восьми тысячах тонн, летающих у тебя над головой Космический мусор: все, что ты хотел (или не хотел) знать о восьми тысячах тонн, летающих у тебя над головой

Человечество с размахом замусоривает и околоземную орбиту

Maxim
Как остаться друзьями после расставания: 3 правила Как остаться друзьями после расставания: 3 правила

Как избежать вражды и отрицательных эмоций при расставании?

Psychologies
Drossel riot Drossel riot

Как мотопромышленность ЕС и США проспала молодежь десять лет назад

Эксперт
«Девочки» выросли: дружба, отношения и поиск себя в сериале «Женщины за сорок» «Девочки» выросли: дружба, отношения и поиск себя в сериале «Женщины за сорок»

Четыре героини, большой город, отношения с мужьями, настоящая дружба

Forbes
10AGE: «Музыка как религия» 10AGE: «Музыка как религия»

Рэпер 10AGE — как он перестал быть лицемером, за что полюбил Советский Союз

ЖАРА Magazine
Секс-гайд по квартире: 5 лучших локаций для того, чтобы заняться любовью Секс-гайд по квартире: 5 лучших локаций для того, чтобы заняться любовью

Попробуем больше раскрыть "сексуальный потенциал" твоей квартиры

Playboy
Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем Часто ходите в тренажерный зал, но не можете похудеть? Избыточные тренировки тут не при чем

Частые тренировки слишком сильно стрессуют организм?

Популярная механика
Прощай, мой господин: как разводились в Османской империи Прощай, мой господин: как разводились в Османской империи

Почему мужчины искали «промежуточных» мужей бывшим женам?

Cosmopolitan
Урок черчения Урок черчения

Хочешь научиться скульптурировать лицо с помощью косметики?

Лиза
Как афроамериканцы друг другом торговали Как афроамериканцы друг другом торговали

Какой континент прославился как главный производитель и экспортер рабов

Maxim
Пепел миров: как мертвые звезды помогли заглянуть в недра далеких планет Пепел миров: как мертвые звезды помогли заглянуть в недра далеких планет

Американские ученые всмотрелись в остывающие звезды

Forbes
Вода и электричество Вода и электричество

Профессиональные спортсмены испытывают гаджеты для плавания

Цифровой океан
20 сугубо научных фактов, о которых вы не знали 20 сугубо научных фактов, о которых вы не знали

Чем картофель похож на человека, зачем чихают африканские собаки?

Популярная механика
Прокофьевы. Дела семейные Прокофьевы. Дела семейные

Прокофьевы: заочный музыкальный диалог великого деда и талантливого внука

СНОБ
Личный опыт: как запустить пиццерию в Великобритании и не потеряться среди гигантов Личный опыт: как запустить пиццерию в Великобритании и не потеряться среди гигантов

Уроки «Додо» из экспансии на перенасыщенный пиццериями рынок Великобритании

Inc.
Как Medallion смогла привлечь $30 млн и решить проблемы медицинских стартапов Как Medallion смогла привлечь $30 млн и решить проблемы медицинских стартапов

Как Medallion помогает зарабатывать медицинским компаниям по всей стране

Forbes
Открыть в приложении