Пульс технологий

Установите кодовое слово в Супернике!

* с его помощью вы всегда сможете войти в приложение, если, например, забыли пароль или сменили телефон

Новый тренд: обучение ИИ на искусственных данных

Искусственный интеллект, который в своём обучении использует базы данных о «реальном» мире — сгенерированные другими компьютерами. Эта идея кажется и логичной, и абсурдной одновременно — смотря с какой точки зрения взглянуть. Но это уже работает. Синтетическими данными уже занимаются как IT-гиганты вроде IBM и Microsoft, так и многочисленные стартапы.

Установите кодовое слово в Супернике

Устанавливай приложение «Цифроникель». Проходи обучение в игровой форме. Копи знания, получай баллы, участвуй в конкурсах и получай ценные призы.

КАК УСТАНОВИТЬ
КОДОВОЕ СЛОВО?

Можно ли доверять искусственному интеллекту, который учился у другого искусственного интеллекта? Вопрос достоин Станислава Лема и Филипа Киндреда Дика — но задавать его уже немного поздно, ибо ответ утвердительный. Вот мимо проезжает self-driving автомобиль крупной IT-компании — спокойно, без резких манёвров, намного плавнее и предсказуемее, чем если бы за рулём был homo sapiens. Но мало кто знает, что в алгоритме обучения этого автомобиля было использовано множество искусственно созданных 3D-изображений и видеороликов, так как каталогизированные и систематизированные массивы данных из реального мира — большой дефицит.

Почти всем компаниям, работающим в сфере ИИ, приходится сегодня искать альтернативы: конечно, не полную замену, а дополнения к данным из реального мира. И дело не только в экономической выгоде, но и в таких современных проблемах, как этика, нарушение конфиденциальности и подсознательные склонности персонала. Скажем, необходимо сделать максимально широкую выборку на ту или иную тему, но сотрудники «в полях» фотографируют и снимают в первую очередь то, что им нравится. В будущем такой перекос повлияет на решения искусственного интеллекта. С конфиденциальностью тоже всё понятно. Допустим, в видеоматериалы случайно попала знаменитая персона — и затем узнала об этом. Такое чревато исками и прочими проблемами юридического характера.

Проблемы эти куда более серьёзные, чем может показаться на первый взгляд. Компания Wakefield Research недавно провела опрос среди более чем трёхсот специалистов по компьютерному зрению и выяснила, что 100% (вдумайтесь в эту цифру) респондентов сталкивались с переносом проектов из-за нехватки тренировочных данных. 99% заявили о том, что хотя бы один проект в их практике был полностью отменён по этой же причине. Тут уже можно говорить о задержке очередной промышленной революции, так как компьютерное зрение — это ключевой элемент в таких направлениях, как беспилотная навигация, полностью автоматизированное производство, расширенная (то есть виртуальная и дополненная) реальность и робототехника.

В компьютерном зрении — как и во многих других областях, где задействован ИИ — данные собираются и каталогизируются вручную. Это чудовищно трудоёмкий процесс, сопровождающийся массой ошибок. Кроме того, в нём часто задействованы посредники — корифеи мира ИИ периодически отдают скучную работу на аутсорсинг, что и становится причиной упомянутых ошибок. Представьте себе, что нужно вручную «наклеить бирки» с исчерпывающим описанием на сотни тысяч фотографий и видеороликов — при этом вы не увлечены, так как не видите за этим канцелярским трудом общей идеи. Конечный результат не будет на сто процентов правильным.

Компания Datagen, ещё будучи «гаражным» стартапом в 2015-м году, одной из первых поняла, в чём суть проблемы. Первые два года было практически невозможно убедить потенциальных клиентов в том, что компьютеры могут успешно обучаться на искусственных примерах из реального мира, созданных другими компьютерами. Тогда такое казалось чем-то из разряда научной фантастики, но сегодня синтетические базы данных — почти мейнстрим, которым занимаются IBM, Microsoft, Nvidia и другие IT-гиганты. И статистика это подтверждает. Судя по результатам исследования Wakefield Research, 96% специалистов по компьютерному зрению используют некую долю искусственных данных, но это ещё не самое интересное. Львиная доля респондентов (81%) заявила о том, что прибегает как минимум к пропорции 50 на 50 — а во многих случаях синтетические данные перевешивают долю реальных роликов и фотографий.

При этом в некоторых специфических, но крайне важных вопросах синтетические данные абсолютно незаменимы. Скажем, системе беспилотной навигации автомобиля в целях обучения нужно продемонстрировать миллион каталогизированных примеров ДТП и прочих экстремальных ситуаций. Где брать такую библиотеку? Вопрос качества, разнообразия — а главное, этики и приватности в случае наличия пострадавших — встаёт небывало остро. И многие компании предпочитают сегодня положиться на синтетические данные.

Одна из лучших технологий для создания подобных данных — генеративно-состязательные сети, GAN. И здесь, как гласит народная мудрость, «нет худа без добра». Дело в том, что год-полтора назад GAN заработали себе дурную славу, так как именно их шутники — а затем и злоумышленники — использовали для создания дипфейков. В GAN есть два, если так можно выразиться, «действующих лица»: генератор и дискриминатор. Первый создаёт заведомо искусственное изображение (или видео), а второй как раз пытается определить, не подделка ли это. Мало того: в случае явного провала дискриминатор «подсказывает» генератору, что подретушировать — и так до тех пор, пока не признает подделку за чистую монету. Именно поэтому алгоритм называют обучением без учителя. Человек задействован лишь на начальной стадии — затем уже «соревнуются» (а на самом деле помогают друг другу) две нейросети.

Теперь GAN не только невольно «помогают» шантажистам, приставляя физиономии звёзд к актёрам в роликах пикантного содержания, но и оказывают реальную помощь компаниям, работающим во благо технологического прогресса. Например, GAN способны смоделировать плотный транспортный поток в 3D — и любые ситуации в нём.

Даже такие крупные компании как Tesla сегодня предпочитают подобный подход. Компания Илона Маска больше не делает акцент на огромных массивах видео — предпочтение отдаётся самой информации, алгоритмам взаимодействия техники, человека и окружающего мира. Затем уже в искусственном трёхмерном окружении на основании полученных данных эмулируются любые ситуации — не заботясь о том, что нарушены чьи-то права или приватность.

УЗНАТЬ БОЛЬШЕ

Новый тренд: обучение ИИ на искусственных данных

Что общего у цифровой трансформации и плавания с аквалангом?

В России наступил дефицит IT-кадров

Одна компания случайно парализовала работу сотен крупнейших сайтов

4 главных направления роста для IT-сектора в 2022 году