Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Обнажить седины Обнажить седины

Чем сильней проседь, тем ближе закат жизни и немощь?

Psychologies
«Децентрализованное общество»: Виталик Бутерин и его товарищи нашли душу следующего интернета «Децентрализованное общество»: Виталик Бутерин и его товарищи нашли душу следующего интернета

«Децентрализованное общество: в поиске души Web3» — о чем этот манифест?

VC.RU
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
«Я зависима от мужского внимания» «Я зависима от мужского внимания»

Многие женщины живут с этими ощущениями, страдают и не понимают, что с ними

Psychologies
USS Vermont: Ноев ковчег на военной службе USS Vermont: Ноев ковчег на военной службе

Если вы не верите в Ноя и его ковчег, то прямо сейчас поверьте

Популярная механика
Киста яичника: признаки, лечение и последствия Киста яичника: признаки, лечение и последствия

Что такое киста яичника, может ли она пройти сама и как ее лечить?

VOICE
Как любовь к «своим» превращается в ненависть к «чужим» Как любовь к «своим» превращается в ненависть к «чужим»

Роберт Сапольски — об опасностях групповой идентичности

Reminder
«Ну не меняться же мне из-за каждого идиота!»: крылатые фразы киногероев Олега Янковского, которые стыдно не знать «Ну не меняться же мне из-за каждого идиота!»: крылатые фразы киногероев Олега Янковского, которые стыдно не знать

Самые крылатые фразы киноперсонажей Олега Янковского

Maxim
Первое свидание: как понять, что он(а) вам подходит? Первое свидание: как понять, что он(а) вам подходит?

Как понять, что человек искренен и готов к отношениям?

Psychologies
«Операция «Мясной фарш»: военная драма про гениальный обман «Операция «Мясной фарш»: военная драма про гениальный обман

«Операция «Мясной фарш» — о чем на самом деле это кино

Forbes
Неспортивно: почему Наоми Осака и Серена Уильямс все еще зарабатывают меньше мужчин Неспортивно: почему Наоми Осака и Серена Уильямс все еще зарабатывают меньше мужчин

За все годы в рейтинг богатейших спортсменов входили всего три женщины

Forbes
Престижная школа Престижная школа

Как сервис Educate Online зарабатывает на желании учить детей за границей

Forbes
«Нелегал»: фильм о хождении по мукам мигранта в современной России «Нелегал»: фильм о хождении по мукам мигранта в современной России

В прокат выходит «Нелегал», фильм о путешествии мигранта из Бишкека в Якутию

Forbes
Как вузам справиться с кризисом коллабораций Как вузам справиться с кризисом коллабораций

Время строить свои модели измерения вузовских достижений в области инноваций

Эксперт
«Нервные клетки не восстанавливаются»: 12 разрушительных мифов о старении мозга «Нервные клетки не восстанавливаются»: 12 разрушительных мифов о старении мозга

Развенчиваем распространенные мифы о старении мозга

Вокруг света
Джонни Депп и Кейт Мосс: что заставило расстаться самую скандальную пару 90-х Джонни Депп и Кейт Мосс: что заставило расстаться самую скандальную пару 90-х

Почему распалась самая эпатажная звездная пара конца XX века

VOICE
Как выбрать хорошую мультиварку: подробная инструкция Как выбрать хорошую мультиварку: подробная инструкция

Кто не работает, тот не ест, но кто приготовит поесть, пока ты на работе?

CHIP
Не только ценный мех: в России впервые в мире создали трехпородного кролика Не только ценный мех: в России впервые в мире создали трехпородного кролика

Первый в мире трехпородный кролик по имени Родник

Вокруг света
«Обвинительное клеймо»: почему не нужно осуждать себя и других за лень «Обвинительное клеймо»: почему не нужно осуждать себя и других за лень

Навязанное обществом чувство вины не просто деструктивно, но и безосновательно

Psychologies
Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы» Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы»

Иосиф Бродский — о смысле жизни, добре и зле, вере и умении прощать

Psychologies
«Держи свечку»: как на Руси проходила первая брачная ночь мужа и жены «Держи свечку»: как на Руси проходила первая брачная ночь мужа и жены

Знаешь, откуда пошло выражение «Я свечку не держал»?

VOICE
В шкуре лобстера В шкуре лобстера

«Волк»: социальный хоррор, подражающий Лантимосу

Weekend
Вегетососудистая дистония и старческое слабоумие: 5 диагнозов, существующих только в России Вегетососудистая дистония и старческое слабоумие: 5 диагнозов, существующих только в России

В России до сих пор ставят диагнозы, которые не признают во всем остальном мире

Psychologies
Марк Оже: «Старости не существует» Марк Оже: «Старости не существует»

Антрополог Марк Оже делится своим взглядом на старение

Psychologies
Проточный или накопительный: какой нагреватель выбрать для дома и дачи Проточный или накопительный: какой нагреватель выбрать для дома и дачи

Нагреватель — что нужно учесть при его выборе?

CHIP
Истории трудностей и инноваций: что бизнесу стоит рассказать о себе Истории трудностей и инноваций: что бизнесу стоит рассказать о себе

Почему клиентов отталкивают цифры и привлекают истории

VC.RU
Как превратить обычный M.2 SSD во внешний накопитель: наш опыт Как превратить обычный M.2 SSD во внешний накопитель: наш опыт

Как с минимальными затратами превратить обычный M.2 SSD во внешний накопитель?

CHIP
10 самых удивительных фотографий границ между странами 10 самых удивительных фотографий границ между странами

Давай представим, что мы смотрим на человечество, его границы немного свысока

Maxim
Королева пустыни: как Гертруда Белл стала одной из самых влиятельных женщин в Ираке Королева пустыни: как Гертруда Белл стала одной из самых влиятельных женщин в Ираке

Путешественница, писательница, шпионка, одна из первых женщин-археологов

Forbes
Наталья Подольская: «Мне нравится смотреть на лица людей, когда я говорю, что мне 40 лет. Не верят!» Наталья Подольская: «Мне нравится смотреть на лица людей, когда я говорю, что мне 40 лет. Не верят!»

Наталья Подольская — о семейных традициях и трудностях в воспитании детей

Здоровье
Открыть в приложении