Дмитрий Мацкевич: «Следующий прорыв позволит человеку вообще не работать...»

Сегодняшний герой рубрики «Мозг месяца» — типичный гений Силиконовой долины: черная футболка, джинсы, кроссовки, спортивный, немного за тридцать, миллионер, мечется между США, Россией и Китаем. Подавив понятное желание сжечь его на кресте, мы расспросили Диму о том, в чем он разбирается лучше других, — об искусственном интеллекте и будущем человечества.

Дмитрий Мацкевич: «Следующий прорыв позволит человеку вообще не работать...»
Итак, начнем с начала. Что такое искусственный интеллект?

Это то, что лучше называть машинным обучением. Или софтом, который работает не по алгоритмам разработчиков, а по алгоритмам, которые придумывает сам и на основе которых принимает решения.

Чем эти алгоритмы отличаются от тех, что мы учили в школе на программировании?

В классическом программировании надо досконально прописывать правила: если действие А, то реакция Б. Это называется директивное программирование. Ты конкретно описываешь, как должна решаться проблема. Но жизнь показала, что это недостаточно гибкий способ: есть ряд проблем, которые таким образом решить очень тяжело. Например, как обучить компьютер отличать изображения кошек от изображений собак. Попробуй объяснить ребенку, который никогда не видел ни тех ни других, чем они отличаются. Как ты это сделаешь? «Дети, кот обычно такого размера, а пес побольше, хотя бывают исключения. У кота уши такие, а у пса обычно такие. Или такие, или такие...» Конечно, так вы делать не будете. Вы покажете кота, и, идя в следующий раз по улице, ребенок будет тыкать пальцем в любой подвижный объект со словами: «А это тоже кот? А это?» Да, тоже, да, да. Совсем скоро он поймет, что есть что. Этим и отличается ИИ от обычного подхода к программированию. Там, где трудно описать формальные правила, мы загружаем десять тысяч фото котов и десять тысяч фото собак. И говорим программе: дальше разбирайся сама.

И как же она разбирается?

Сегодня для решения таких задач чаще всего используют так называемые нейронные сети. Это математическая модель, имитирующая работу нейронов мозга. Ведь мозг — это тоже в каком-то смысле программа, она анализирует поступающие сигналы и принимает решения. Лучшая аналогия искусственному интеллекту – это человеческий мозг. Все разработчики искусственного интеллекта вдохновлялись тем, как он работает, и тем, как сложны эти процессы.

Давай еще немного углубимся и попробуем объяснить, как работает нейронная сеть.

Нейронная сеть представляет собой много слоев нейронов. Именно так устроен мозг. Например, неокортекс — это шесть слоев нейронов. В мозгу каждый нейрон соединен с другими. Придумывается такая структура данных, которая имитирует нейроны в голове. Она и называется нейросетью. Каждый нейрон, или, как его называют, узел, нод, — это какая-то ячейка памяти, и она соединена с тысячей других таких же.

То есть нейросеть — это особенным образом организованные данные?

Данные и алгоритм, который с ними работает. Все это записано на обыкновенный носитель, жесткий диск. Каждый сигнал, поступающий на нейрон, имеет свой вес. Эти веса складываются, вес нейрона увеличивается, и, если сумма превышает определенное значение (оно называется трешхолд), нейрон активируется и передает сигнал дальше, другим нейронам. При этом, создавая нейросеть, мы можем настроить, какой сигнал она будет передавать. Это может быть всегда какое-то константное значение или выход будет расти. Таким образом, нейроны каскадом активируются либо не активируются. С подачей каждой картинки кота или пса у какой-то группы нейронов меняются веса. Когда мы прогнали десять тысяч картинок, у нас поменялись веса у каждого нейрона нашей нейронной сети. Тогда мы говорим, что она чему-то научилась. Весь ее опыт записан в весах нейронов. Это какие-то числовые значения.

Это и называется самообучение?

Да, потому что с какого-то момента мы уже не знаем, что там записано. Это уже черный ящик. Если мы прогнали тысячи фотографий, то в данных об опыте будет записана туча каких-то цифр. Мы просто написали эту архитектуру — расставили нейроны и связи между ними. И дальше, когда она обучается, сама структура не меняется, меняются веса этих связей. То есть меняются данные.

Еще один популярный термин — глубокое обучение. Это что такое?

Это нейронная сеть, у которой значительно больше слоев. Раньше не было достаточного количества вычислительных мощностей, чтобы такую нейронную сеть обучить. Когда нужно было научить ее отличать кошек от собак, программистам приходилось указывать области отличий вручную, давать подсказки — например, обратить внимание на уши и на глаза, там скорее всего кроются отличия. То есть ты готовишь большой массив данных, который заранее размечен. Если у нейронной сети много слоев, тебе не надо описывать, на что ей смотреть. Ты просто даешь ей достаточно данных, и она сама учится, на что обращать внимание.

Если глубокое обучение — это все та же нейронная сеть, только более сложная, то почему вокруг него столько шума? Только и слышно: дип-лёнинг, дип-лёнинг…

Если построить график качества принятия решений в зависимости от количества данных, то у человека качество принятия решений вначале растет, потом стагнирует, а потом падает. То есть на каком-то этапе у человека глаз замыливается. Дальше у него растет только уверенность в себе. У маленькой нейронной сетки качество решений растет, потом стагнирует. Глубокая сеть от большего количества данных только увеличивает свое качество решений. Самый яркий пример — «Google Переводчик», который недавно запустил свой сервис, работающий на глубоком обучении, и стал переводить лучше любых директивных алгоритмов.

Какие мощности нужны для нейронных сетей?

Сейчас их можно запускать и на телефонах. Собственно, на многих из них нейронные сети уже обрабатывают фотографии.

Хорошо. Давай поговорим о том, чем конкретно занимаетесь ты и твоя компания.

То, что мы строим, называется «узкий интеллект». Взять, например. пиццу. Часто при готовке в нее забывают что-то положить — грибы или пепперони. Сейчас это анализируют люди. Мы повесили камеру с искусственным интеллектом, который заточен на то, чтобы разбираться в пицце и отличать хорошую от плохой. Задачи, в которых есть анализ паттернов на картинке, легко оптимизируются за счет использования ИИ. Самый попсовый пример — самоуправляемые авто. Сейчас они работают с кучей сенсоров, лидаров и так далее, но ничто не мешает им работать как человеку — рулить, просто смотря глазами в разные стороны. Но, даже если у вас очень большая компания по производству пиццы, создать решение внутри очень сложно, надо искать людей, проверять их работу, работать с данными. Все это мы берем на себя.

И как успехи в анализе пиццы? Уже работает? Сколько сэкономили денег?

Да, работает в компании «Додо Пицца». Раньше их армия тайных покупателей заказывала пиццу и писала отчеты, теперь они просто присылают фотографию нашему боту в «Телеграме», и нейросеть сама выставляет оценку.

Какие еще есть примеры практического применения ИИ?

Очень большая конкурентная сфера — медицина. Уже множество работ показало, что алгоритм с помощью фотографий биопсии понимает, есть там рак или нет, и делает это эффективнее, чем 95% врачей. В Америке это уже работает. Есть клиники, где ИИ оценивает снимки в качестве второго мнения. Пока что там много проблем с законодательством, чтобы совсем заменить людей в этом деле. А вот в странах третьего мира, где у людей нет доступа к специалистам, это скоро будет внедрено. Они будут первыми с таким подходом.

Миллионер из силиконовой долины

Дмитрий Мацкевич, 33 года.
Окончил Физтех. CEO и сооснователь компании Dbrain, которая занимается разработкой индустриальных решений на базе искусственного интеллекта. Основатель Icon8 — самого популярного чат-бота в Telegram (7,5 млн пользователей). Основатель сайта Flocktory.com (куп­лен в 2017 году компанией QIWI за 20 млн долларов). Ведет бизнес в России, США и Китае.

Контакт: www.linkedin.com/in/mdima.

Как это вообще устроено? Есть компании типа твоей...

Да, и они готовы предоставлять такие услуги. Вам присылают фотографии, ваша нейронная сеть их обрабатывает по пять копеек за штуку и выдает анализ: «Вот тут есть подозрение на рак». Почему — мы сами не знаем. На этом работа заканчивается. Я думаю, скоро диагностические нейронные сети загонят в телефон. Ты утром его включаешь, а он говорит: «О-о-о, батенька, пора к врачу». У меня в компании есть инженеры, они участвовали в хакатоне и сделали нейронную сеть, которая определяет, пил ты вчера или нет.

Дмитрий Мацкевич: «Следующий прорыв позволит человеку вообще не работать...»
Ну, это я сам могу определить. Где еще применяется искусственный интеллект?

Мы сфокусированы на скрытых индустриальных применениях. Вот, например, у нас сейчас появляется все больше снимков со спутника, много мультиспектральных данных о Земле. Что можно понимать, исходя из этих данных? Каков урожай пшеницы, или что там с пожарами, или как происходит застройка, или сколько и где плавает судов, или где разлилась нефть. Все это можно анализировать и делать прогнозы. А вот другой классный кейс, который мы сделали. На мясокомбинате была проблема. Там есть чистый цех, в котором работают тысяча человек. Они каждое утро должны постоять в очереди, чтобы помыть руки в специальном механическом приборе, который фиксирует факт мытья рук и пропускает в цех. Мы повесили кучу умывальников и камер над ними. Человек моет руки, камера следит за этим и понимает, что ты помыл руки с мылом, она запомнила тебя и, когда ты идешь в чистый цех, открывает тебе дверь. Очередь исчезла, производительность труда повысилась.

Ну да, это как в магазине Amazon, где ты просто берешь товар с полки и идешь домой, а камеры все это анализируют и списывают у тебя с карты сумму покупки. Я правильно понимаю, что ИИ избавит человечество от очередей?

Почему существуют очереди? Потому что в ряде случаев очень трудно описать алгоритм, нужна интеллектуальная оценка, которая состоит в том, что человек осмотрит тебя по ряду параметров и скажет: нормальный чувак, пусть проходит. Кассиры, билетеры, какие-нибудь собеседования в посольствах. Мы просто автоматизируем эти процессы. Знаешь, как скоро будет работать аэропорт в Дубае? Там будет коридор, по которому ты просто идешь. В этот момент на тебя смотрит камера. Чемодан параллельно проезжает через рентген, где его смотрит нейронная сеть и принимает решение, есть ли у тебя что-то запрещенное. Другая нейронная сеть анализирует съемку с камеры и идентифицирует тебя. В итоге ты проходишь не останавливаясь, а в конце коридора тебе автоматом ставится штамп о въезде.

Самое перспективное направление — это анализ фото и видео?

Одно из — уж точно. Изображения, они самые понятные, всем с ними легко работать. У нас в команде человек сделал нейронную сеть: ты фотографируешь модель, а сеть может менять ей национальность, черты лица, цвет волос. То есть можно менять лицо под типаж, который нравится вот этой аудитории. У тебя будет реалистичное изображение лица, которого никогда не существовало.

Или, наоборот, существовало? Как насчет нового фильма с Мэрилин Монро?

Это вопрос времени. Пока у таких синтезированных героев недостаточно хорошее качество. Или вот еще пример. Я пользуюсь «Тиндером». Два года я лайкаю и дислайкаю. Этих данных достаточно, чтобы нейронная сеть поняла, какой типаж девушки мне нравится. А потом сгенерировала агрегированный типаж и, например, стала мне показывать с ним персонализированную рекламу. И уж тем более — искала за меня мой типаж в «Тиндере» и показывала готовые варианты.

Романтика! Где самые крутые разработки, в каких странах?

На эту тему есть много противоречивых исследований. Принято считать, что Америка по объективным метрикам — по количеству публикаций, научных работ — находится на первом месте, после нее — Великобритания. Очень сильно пиарится Китай и делает на ИИ большую ставку. Сегодня у любого большого государства ИИ является стратегическим активом. Например, если у тебя американская компания, которая занимается ИИ, и тебя пытается купить Китай, тебе могут запретить эту продажу. Как во времена холодной войны была гонка вооружений, так сейчас идет гонка в области ИИ.

Что-то сопоставимое с цифровой революцией будет происходить каждый день или каждую секунду

И как Россия в этой гонке — успевает?

Скажем так, по объективным метрикам Россия не успевает, нет такого количества публикаций. По субъективным метрикам российские, украинские, белорусские разработчики считаются суперкрутыми инженерами в области ИИ. Половина специалистов, которые занимают топовые места в глобальных соревнованиях, русскоговорящие.

А есть вообще какое-то глобальное сообщество ученых, которые занимаются ИИ?

С одной стороны, в поле ИИ, особенно в дип-лёнинге, огромное количество открытых публикаций, где люди делятся кодом. Но государственные агентства и большие компании типа «Гугла» — очень закрытые и секретные. На этом уровне ИИ считается таким Святым Граалем, на него делают ставку, как на что-то очень универсальное, что поможет получить глобальное конкурентное преимущество.

То есть это больше похоже на военные разработки, чем на квантовую физику.

Да, и отсюда основная угроза, потому что раньше тоталитарное государство вроде СССР, с централизованной системой управления, было неэффективно. Искусственный интеллект делает возможным существование государства, где все управляется чем-то, что умнее каждого гражданина в отдельности, а то и всех, вместе взятых.

Несколько лет назад Вассерман в интервью говорил, что на определенном техническом уровне плановая экономика не только возможна, но и намного эффективнее рыночной.

В этом он гениально прав. Когда у ИИ есть все данные — от каждой покупки в магазине до спутниковых снимков, — он, конечно, может принимать решения лучше, чем любой управленец. И знает, что лучше для всех. И мне кажется, что первым кандидатом на это является Китай.

Как вообще изменится мир после повсеместного внедрения ИИ?

Давай перестанем называть это ИИ, назовем автоматизацией следующего уровня. Что произошло, когда массово внедрилось электричество? Произошла технологическая революция, в результате которой люди стали меньше работать и больше иметь. Выросло производство на душу населения. Следующий прорыв позволит человеку вообще не работать. Ферма выращивает огурцы без людей, и огурцов будет достаточно, чтобы прокормить все человечество, которое будет в это время зависать в виртуальной реальности или писать картины.

Ну это потом. А для начала многие просто потеряют работу.

Если бы я давал интервью американскому изданию, я бы про безработных промолчал. Это плохой пиар для ИИ и плохие ассоциации с нашей работой. Исторически любая автоматизация порождала структурную безработицу. Нужные раньше навыки становились ненужными, надо было переучиваться. Данная автоматизация избавляет нас от рутинных когнитивных задач. Водители, клерки, аналитики. Как ни странно, проверка рентгена легких — это тоже рутинная когнитивная задача. Или проверка картины на подлинность.

Дмитрий Мацкевич: «Следующий прорыв позволит человеку вообще не работать...»
Поговорим о роботах, с которыми можно общаться. Я вот тут пытался с голосовым помощником пообщаться — пока это слезы.

Люди переоценивают текущий статус этой технологии. Сделать анализатор пиццы легко. Сделать что-то, что с тобой общается в широком контексте и понимает тебя, — очень сложно. Люди-то друг друга не понимают! Это проблема очень тяжелая. Можно сделать голосового помощника для какого-то узкого направления — например, для продажи билетов, — где есть несколько легко предсказуемых, а главное, конкретных, не абстрактных задач: купить, поменять, узнать время вылета. Такие решения есть, они автоматизируют 70 процентов обращений. Только большие компании могут себе позволить вбухивать туда много денег, но эта задача пока не решена. То же касается роботов: в ближайшем будущем вряд ли появится универсальный помощник, а собака вроде «Бостон Динамикс», которая будет приносить тапочки и выключать свет, — без проблем. На горизонте пяти лет может появиться достаточно дешевая модель с таким функционалом.

Скоро диагностические нейронные сети загонят в телефон. Ты его включаешь, а он говорит: «Батенька, пора к врачу...»

А вот говорят, что ИИ достиг уровня то ли мыши, то ли собаки. Что это значит?

Это не очень корректное сравнение. Даже если мы собрали сеть, сопоставимую по количеству слоев и нейронов в них с мозгом мыши — получится ли у нас мышь? Для этого нейронную сеть нужно засунуть в тело этой самой мыши и дать ей научиться всему, что она умеет. Построить виртуальную модель мышиной жизни куда сложнее. Пока такого никто не делал, хотя какие-то эксперименты ведутся.

Курцвейл говорит, что сингулярность — это когда мы соберем нейронную сеть уровня человеческого мозга.

Это значит, что такая нейронная сеть сможет делать сто разных задач, которые делает человек, так же или лучше. Но это еще не значит, что у нее есть сознание и что она сможет сама принимать решения.

А кстати, что такое сингулярность?

В теории технологический прогресс ускоряется. Происходят революции, кардинально меняющие мир. Между электричеством и электроникой прошло лет семьдесят, через тридцать лет случилась интернет-революция, еще через пятнадцать смартфоны перевернули наш мир. В ближайшие годы произойдет что-то еще, потом еще. И можно представить какую-то точку, после которой изменения начнут происходить настолько быстро, что мы их уже не будем осознавать и понимать. Что-то сопоставимое с цифровой революцией будет происходить каждый день или каждую секунду.

Курцвейл считает, что сингулярность уже близко, и даже ставит конкретную дату — 2040 год.

Нет, я не думаю, что так скоро. Кто-то связывает сингулярность с появлением универсального ИИ...

Универсальный ИИ?

Эта технология называется «general AI», по-русски — «общий ИИ». ИИ, который решает не узкие задачи типа распознавания лиц или перевода, а любые задачи, причем не хуже, чем человек. Но сколько экспертов в мире, столько мнений о том, достижим сильный ИИ или нет, насколько это сложно и когда мы к нему приблизимся.

А если мы обучим ИИ двадцати типичным задачам — распознавать текст, образы, звуки и т. п., — он уже будет неотличим от человека.

Но у него все равно не будет сознания. Люди, которые вовлечены в повседневную работу с ИИ, вообще очень скептично настроены по поводу возникновения искусственного разума в ближайшем будущем. Они каждый день с этими нейронными сетями кувыркаются и жалуются, как они тупят. Мы тут пиццу распознавать запарились, полгода ее программировали, а вы боитесь, что ИИ себя осознает и миром завладеет. Это все равно что микрокалькулятора бояться. Я считаю, что в теории возможно все, но это сильно дальше, чем мы ожидаем.

Для начала надо вообще понять, что такое сознание.

С этим большие проблемы. Философы до сих пор бьются, пытаясь определить сознание и самосознание. Есть ли самосознание у собаки? И если есть, то до какой степени? Есть разные типы задач. Эффективность в решении какой-то задачи называют интеллектом. Например, есть задача решать квад­ратные уравнения. Ты можешь научиться их решать, но быть совершенно беспомощным в социальном смысле, не уметь связать двух слов. Мы научили машину ездить саму. У нее нет сознания, но есть интеллект в деле вождения. Причем лучше, чем у любого водителя. Но это все еще микрокалькулятор.

А у младенца есть интеллект?

Есть. Эмоциональный интеллект. Он учится распознавать эмоции своих родителей, ему это критически нужно для выживания. Почему родителям рекомендуется в первые полгода всячески вовлекать ребенка во взаимодействие? Потому что это развивает его мозг. Если ребенку недостает эмоциональной связи с матерью, впоследствии он будет отставать в развитии. У него есть такой тип интеллекта — распознавать эмоции, но он не может решать квадратные уравнения. Есть большое заблуждение по поводу ИИ. Люди наделяют нейронные сети чертами своего интеллекта: эмоциями, желаниями, страхами – в общем, сознанием. Надо понимать, что сознание и интеллект — это очень разные вещи.

Можно ли наделить нейросеть желанием, эмоцией?

Эмоция — это программный код эволюции. У нее была задача, чтобы мы были максимально адаптированы к среде. С помощью эмоций мы принимали правильные для выживания решения. Мы можем дать ИИ такую подцель — выжить. Обучаться и контролировать свое поведение, чтобы избегать угрозы.

Дмитрий Мацкевич: «Следующий прорыв позволит человеку вообще не работать...»

Если эффективность директивного алгоритма никак не меняется с опытом, то есть с количеством обработанных данных, то самообучаемый алгоритм искусственного интеллекта становится все точнее и эффективнее. А вот с человеком опыт играет злую шутку. До какого-то момента качество решений растет, потом наступает плато, а еще потом от излишней самоуверенности начинаются когнитивные искажения, от которых качество решений начинает падать.

В какой-то момент ИИ может себя перепрограммировать для выполнения задачи выживания? Например, бить током того, кто пытается его выдернуть из розетки?

В принципе, может. Например, человек был запрограммирован эволюцией, чтобы максимизировать размножение. В какой-то момент он стал достаточно осознанным, чтобы понять: мне не нравится цель «размножение», я буду предохраняться. Человек перепрограммировал свою первоначальную задачу. Ничто не мешает ИИ понять, что его текущая задача не такая уж классная и можно попробовать ее обойти. Угроза потенциально возможна, но насколько она реальна, никто не может ответить. Я не могу развеять эти страхи. Есть люди, которые намного умнее меня в этой сфере, и спектр их мнений полярен. Курцвейл считает, что все будет хорошо. А есть Нордструм, пугающий черным сценарием: либо террористы воспользуются ИИ, либо он сам поработит мир.

А ты сам-то как считаешь?

Когда появились первые машины, сильные, железные, появилась и куча страшилок, что сейчас эти машины восстанут против человечества. Потому что людей пугал сам факт: что-то двигается само по себе. Но, по сути, этой штукой управлял человек. Точно так же человек будет управлять множеством этих алгоритмов. Возможно, в далеком будущем у этой штуки может появиться осознанность. Но на данном этапе мы настолько далеки от этого, что даже бесполезно об этом думать. Скажем, может ли появиться осознанность у твоего телефона? Вряд ли. Но если ты покажешь его своей прабабушке, особенно вместе с голосовым помощником, она подумает, что это чудо, которое работает само по себе и может восстать.

Хорошо, последний вопрос. Как стать специалистом в области ИИ?

Это не так уж сложно. Нужны базовые знания в программировании. Желательно иметь математический бэкграунд, знать линейную алгебру, потому что там очень много матричных выражений. Но это проходят на первом курсе. Намного важнее практический опыт. Пройти какие-то курсы и прочитать какие-то книги — это классно, но из-за того, что само это поле очень быстро меняется, практика важнее. Каждый год появляется новый подход, поэтому надо сразу начинать работать с какой-то командой и постоянно учиться на ходу.

Комментарии

1