Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Поздно не значит никогда: женщины, сделавшие состояние после 35 Поздно не значит никогда: женщины, сделавшие состояние после 35

Женщины, добившиеся успеха после 35 лет

Cosmopolitan
На завтрак, обед и ужин: топ-7 национальных пирогов На завтрак, обед и ужин: топ-7 национальных пирогов

Пироги с удовольствием едят в разных странах мира

Вокруг света
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Таблетки от кометы и радий от импотенции: 6 абсурдных «лекарств», в которые все верили Таблетки от кометы и радий от импотенции: 6 абсурдных «лекарств», в которые все верили

В истории человечества было немало сомнительных и опасных способов лечения

Вокруг света
Пациент с пересаженным ГМ-сердцем свиньи умер из-за свиного цитомегаловируса Пациент с пересаженным ГМ-сердцем свиньи умер из-за свиного цитомегаловируса

Причина смерти первого в мире человека, которому пересадили свиное сердце

N+1
Что случилось с детьми-актерами из советского фильма «Приключения Буратино» Что случилось с детьми-актерами из советского фильма «Приключения Буратино»

Что стало с актерами-детьми из любимого многими «Приключения Буратино»

Maxim
Бесчеловечный сервис Бесчеловечный сервис

Роботы в гостиницах — за и против

СНОБ
Не только Москва: в каком городе всего одна станция и другие факты о метро в России Не только Москва: в каком городе всего одна станция и другие факты о метро в России

Всего в городах России обслуживает пассажиров более 350 станций подземки

Вокруг света
По совету классика: почему стоит уехать на выходные в мае в Переделкино По совету классика: почему стоит уехать на выходные в мае в Переделкино

Когда в «Переделкино входит весна», пора забывать городские привычки

Вокруг света
Неизвестный Макиавелли: как сложилась судьба автора знаменитого трактата о государственном управлении Неизвестный Макиавелли: как сложилась судьба автора знаменитого трактата о государственном управлении

Никколо Макиавелли отличался трудолюбием и умел радоваться жизни

Вокруг света
Бедный Рюрик… Бедный Рюрик…

Кто такой Рюрик?

Дилетант
Шесть парадоксов похудения Шесть парадоксов похудения

Почему у нас не всегда получается похудеть?

Здоровье
Дважды беспокойный утенок Дважды беспокойный утенок

Как вандализм стал неотделим от искусства

Weekend
Ужасы и прелести кулачных боев Ужасы и прелести кулачных боев

Собрали все «за» и «против» кулачных боев

Maxim
Ешь, пока горячее Ешь, пока горячее

Некоторые продукты после подогрева лишаются большей части полезных веществ

Лиза
Внимание осанке: как держать спину ровно и не сутулиться Внимание осанке: как держать спину ровно и не сутулиться

Рассказываем, что делать, если сутулишься, и как перестать горбиться

VOICE
5 увлекательных книг об истории России 5 увлекательных книг об истории России

Подборка книг, авторы которых расскажут о возникновении и становлении России

Популярная механика
БАДы: польза и вред биологически активных добавок БАДы: польза и вред биологически активных добавок

Споры вокруг БАДов не утихают десятилетиями

Psychologies
Кинотерапия для снятия тревожности: инструкция психолога Кинотерапия для снятия тревожности: инструкция психолога

Кино лечит?

Psychologies
Лиризм, гротеск, музыкальный вкус: 7 причин, почему Паоло Соррентино — один из лучших режиссеров современности Лиризм, гротеск, музыкальный вкус: 7 причин, почему Паоло Соррентино — один из лучших режиссеров современности

Почему Паоло Соррентино — один из лучших авторов авторов европейского арт-кино

Правила жизни
«Тщательно контролируемая галлюцинация: как ваш мозг предсказывает (почти) все» «Тщательно контролируемая галлюцинация: как ваш мозг предсказывает (почти) все»

Наша повседневная реальность — это тщательно контролируемая галлюцинация

Вокруг света
Владимир Киселев Владимир Киселев

Почему мода на рэп скоро пройдет и какие современные треки являются мегахитами

ЖАРА Magazine
10 малоизвестных «Запорожцев»: родственники 10 малоизвестных «Запорожцев»: родственники

У ЗАЗ был целый ряд интересных и неизвестных непрофессионалам машин

ТехИнсайдер
Русский комиссар при Наполеоне Русский комиссар при Наполеоне

Как опрометчиво отдавать себя в руки врага, рассчитывая на его благородство!

Дилетант
Подушка безопасности: как получать доходы, которые помогут пережить кризис Подушка безопасности: как получать доходы, которые помогут пережить кризис

Кризис — время, когда вы можете оценить прочность своего финансового положения

Inc.
Как обустроить террасу на даче: 4 совета от дизайнера Как обустроить террасу на даче: 4 совета от дизайнера

Как правильно оформить террасу, чтобы ничто не омрачало отдых

Лиза
Лучшие фитнес-браслеты с измерением давления: рейтинг 2022 года Лучшие фитнес-браслеты с измерением давления: рейтинг 2022 года

В последние годы на рынке появилось немало фитнес-браслетов. Вот лучшие из них

CHIP
«Не могу решиться на развод: боюсь, что жизнь с любовником меня тоже разочарует» «Не могу решиться на развод: боюсь, что жизнь с любовником меня тоже разочарует»

Как опыт неудачных отношения сказывается на нас? История читательницы

Psychologies
В черепе единственной ночной дневной хищной птицы не нашлось адаптаций к ночному образу жизни В черепе единственной ночной дневной хищной птицы не нашлось адаптаций к ночному образу жизни

У чернополосого коршуна не удалось обнаружить адаптаций к ночному образу жизни

N+1
Кукушка и компания: 5 птиц, практикующих гнездовой паразитизм Кукушка и компания: 5 птиц, практикующих гнездовой паразитизм

Гнездовой паразитизм в природе практикуют несколько десятков видов птиц

Вокруг света
Открыть в приложении