Искусственный интеллект и будущее человечества. Искусственный интеллект - угроза или помощник для человечества? Что такое УИИ, ИСИ и сверхразум

Искусственный интеллект – в последнее время одна из наиболее популярных тем в технологическом мире. Такие умы, как Элон Маск, Стивен Хокинг и Стив Возняк всерьез обеспокоены исследованиями в области ИИ и утверждают, что его создание грозит нам смертельной опасностью. В то же время научная фантастика и голливудские фильмы породили множество заблуждений вокруг ИИ. Так ли нам угрожает опасность и какие неточности мы допускаем, представляя уничтожение Земли Skynet, всеобщую безработицу или наоборот достаток и беззаботность? В человеческих мифах об искусственном интеллекте разобралось издание Gizmodo. Приводим полный перевод его статьи.

Это называли важнейшим тестом машинного разума со времен победы Deep Blue над Гарри Каспаровым в шахматном поединке 20-летней давности. Google AlphaGo победил на турнире по Го гроссмейстера Ли Седоля с разгромным счетом 4:1, показав насколько серьезно искусственный интеллект (ИИ) продвинулся вперед. Судьбоносный день, когда машины наконец превзойдут в уме человека, никогда не казался так близко. Но мы, кажется, так и не приблизились к осознанию последствий этого эпохального события.

В действительности, мы цепляемся за серьезные и даже опасные заблуждения об искусственном интеллекте. В прошлом году основатель SpaceX Элон Маск предостерег, что ИИ может захватить мир. Его слова вызвали бурю комментариев, как противников, так и сторонников этого мнения. Как для такого будущего монументального события, есть поразительное количество разногласий относительно того, произойдет ли оно, и, если да, то в какой форме. Это особенно тревожно, если принять во внимание невероятную пользу, которую может получить человечество от ИИ, и возможные риски. В отличие от других изобретений человека, у ИИ есть потенциал изменить человечество или уничтожить нас.

Трудно понять, чему верить. Но благодаря первым работам ученых в области вычислительных наук, нейробиологов, теоретиков в области ИИ, начинает возникать более четкая картина. Вот несколько общих заблуждений и мифов касательно искусственного интеллекта.

Миф №1: “Мы никогда не создадим ИИ с разумом сравнимым с человеческим”

Реальность: У нас уже есть компьютеры, которые сравнялись или превысили человеческие возможности в шахматах, Го, торговле на бирже и разговорах. Компьютеры и алгоритмы, которые ими руководят, могут становиться только лучше. Это лишь вопрос времени, когда они превзойдут человека в любой задаче.

Психолог-исследователь из университета Нью-Йорка Гари Маркус сказал, что “буквально каждый”, кто работает в ИИ, верит, что машины, в конце концов, обойдут нас: “Единственное реальное отличие между энтузиастами и скептиками – это оценки сроков”. Футуристы вроде Рея Курцвейла считают, что это может произойти в течение нескольких десятилетий, другие говорят, что потребуются века.

ИИ-скептики не убедительны, когда говорят, что это нерешаемая технологическая проблема, а в природе биологического мозга есть что-то уникальное. Наши мозги – биологические машины – они существуют в реальном мире и придерживаются основных законов физики. В них нет ничего непознаваемого.

Миф №2: “Искусственный интеллект будет иметь сознание”

Реальность: Большинство представляет, что машинный разум будет обладать сознанием и думать так, как думают люди. Более того, критики вроде сооснователя Microsoft Пола Аллена верят, что мы пока не можем достигнуть общего искусственного интеллекта (способен решить любую умственную задачу, с которой справляется человек), потому что нам не хватает научной теории сознания. Но как говорит специалист по когнитивной робототехнике Имперского колледжа Лондона Мюррей Шанахан, нам нельзя приравнивать эти две концепции.

“Сознание безусловно удивительная и важная вещь, но я не верю, что оно необходимо для искусственного интеллекта человеческого уровня. Если выражаться более точно, мы используем слово “сознание” для обозначения нескольких психологических и когнитивных признаков, которые у человека “идут в комплекте”, – объясняет ученый.

Умную машину, которой не хватает одного или нескольких подобных признаков, можно представить. В конце концов, мы можем создать невероятной умный ИИ, который будет неспособен воспринимать мир субъективно и осознано. Шанахан утверждает, что разум и сознание можно совместить в машине, но мы не должны забывать, что это две разных концепции.

То, что машина проходит тест Тьюринга, в котором она неотличима от человека, не означает наличие у нее сознания. Для нас передовой ИИ может казаться осознанным, но его самосознание будет не большим, чем у камня или калькулятора.

Миф №3: “Нам не стоит бояться ИИ”

Реальность: В январе основатель Facebook Марк Цукерберг заявил, что нам не стоит бояться ИИ, ведь он сделает невероятное количество хороших вещей для мира. Он прав наполовину. Мы извлечем огромную выгоду от ИИ: от беспилотных автомобилей до создания новых лекарств, но нет никаких гарантий, что каждая конкретизации ИИ будет доброкачественной.

Высокоразумная система может знать все о конкретной задаче, вроде решения неприятной финансовой проблемы или взлома системы вражеской обороны. Но вне границ этих специализаций, она будет глубоко невежественна и не сознательна. Система Google DeepMind эксперт в Го, но у нее нет возможностей или причин исследовать сферы вне своей специализации.

Многие из этих систем могут не подчинятся соображениям безопасности. Хороший пример – сложный и мощный вирус Stuxnet, военизированный червь, разработанный военными Израиля и США для проникновения и диверсии работы иранских атомных станций. Это вирус каким-то образом (специально или случайно) заразил российскую атомную станцию.

Еще один пример, программа Flame, использованная для кибершпионажа на Ближнем Востоке. Легко представить будущие версии Stuxnet или Flame, который выходят за пределы своих целей и наносят огромный вред чувствительной инфраструктуре. (Для понимания, эти вирусы не являются ИИ, но в будущем они могут его иметь, откуда и беспокойство).

Вирус Flame использовался для кибершпионажа на Ближнем Востоке. Фото: Wired

Миф №4: “Искусственный суперинтеллект будет слишком умен, чтобы совершать ошибки”

Реальность: Исследователь ИИ и основатель Surfing Samurai Robots Ричард Лусимор считает, что большинство сценариев судного дня, связанного с ИИ, непоследовательны. Они всегда построены на предположении, что ИИ говорит: “Я знаю, что уничтожение человечества вызвано сбоем в моей конструкции, но я все равно вынужден это сделать”. Лусимор говорит, что если ИИ будет вести себя так, рассуждая о нашем уничтожении, то такие логические противоречия будут преследовать его всю жизнь. Это, в свою очередь, ухудшает его базу знаний и делает его слишком глупым для создания опасной ситуации. Ученый также утверждает, что люди, говорящие: “ИИ может делать только то, на что его запрограммировали”, заблуждаются также, как и их коллеги на заре компьютерной эры. Тогда люди использовали эту фразу утверждая, что компьютеры не способны продемонстрировать ни малейшей гибкости.

Питер Макинтайр и Стюарт Армстронг, которые работают в Институте будущего человечества при Оксфордском университете, не соглашаются с Лусимором. Они утверждают, что ИИ в значительной мере связан тем, как его запрограммировали. Макинтайр и Армстронг верят, что ИИ не сможет совершать ошибок или быть слишком тупым, чтобы не знать, чего мы от него ожидаем.

“По определению, искусственный суперинтеллект (ИСИ) – субъект, с разумом значительно большим, чем обладает лучший человеческий мозг в любой области знаний. Он будет точно знать, что мы хотели, чтобы он сделал”, – утверждает Макинтайр. Оба ученых верят, что ИИ будет делать лишь то, на что запрограммирован. Но если он станет достаточно умен, он поймет, как это отличается от духа закона или намерений людей.

Макинтайр сравнил будущую ситуацию людей и ИИ с теперешним взаимодействием человека и мыши. Цель мыши – искать еду и убежище. Но она часто конфликтует с желанием человека, который хочет, чтобы его зверек бегал вокруг него свободно. “Мы достаточно умны, чтобы понимать некоторые цели мышей. Так что ИСИ будет также понимать наши желания, но быть к ним безразличным”, – говорит ученый.

Как показывает сюжет фильма Ex Machina человеку будет крайне сложно удерживать более умный ИИ

Миф №5: “Простая заплатка решит проблему контроля ИИ”

Реальность: Создав искусственный интеллект умнее человека, мы столкнемся с проблемой известной как “проблема контроля”. Футуристы и теоретики ИИ впадают в состояние полной растерянности, если их спросить, как мы будем содержать и ограничивать ИСИ, если такой появится. Или как убедиться, что он будет дружественно настроен в отношении людей. Недавно исследователи из Института технологий Джорджии наивно предположили, что ИИ может перенять человеческие ценности и социальные правила, читая простые истории. На деле, это будет куда более сложно.

“Предлагалось множество простых трюков, которые могут “решить” всю проблему контроля ИИ”, – говорит Армстронг. Примеры включали программирование ИСИ так, чтобы его целью было угождать людям, или, чтобы он просто функционировал как инструмент в руках человека. Еще вариант – интегрировать концепции любви или уважения в исходный код. Чтобы предотвратить ИИ от принятия упрощенного, однобокого взгляда на мир, предлагалось запрограммировать его ценить интеллектуальное, культурное и социальное разнообразие.

Но эти решения слишком просты, как попытка втиснуть всю сложность человеческих симпатий и антипатий в одно поверхностное определение. Попробуйте, к примеру, вывести четкое, логичное и выполнимое определение “уважения”. Это крайне сложно.

Машины в “Матрице” могли без проблем уничтожить человечество

Миф №6: “Искусственный интеллект нас уничтожит”

Реальность: Нет никакой гарантии, что ИИ нас уничтожит, или, что мы не сможем найти возможности контролировать его. Как сказал теоретик ИИ Элизер Юдковски: “ИИ ни любит, ни ненавидит вас, но вы сделаны из атомов, которые он может использовать для других целей”.

В своей книге “Искусственный интеллект. Этапы. Угрозы. Стратегии” оксфордский философ Ник Бостром написал, что настоящий искусственный суперинтеллект, после его появления, создаст риск больший, чем любые другие человеческие изобретения. Выдающиеся умы вроде Элона Маска, Билла Гейтса и Стивена Хокинга (последний предупредил, что ИИ может быть нашей “худшей ошибкой в истории”) также выразили обеспокоенность.

Макинтайр сказал, что в большинстве целей, которыми может руководствоваться ИСИ, есть веские причины избавиться от людей.

“ИИ может спрогнозировать, достаточно правильно, что мы не хотим, чтобы он максимизировал прибыль конкретной компании, чего бы это ни стоило клиентам, окружающей среде и животным. Поэтому у него есть сильный стимул, чтобы позаботится о том, что его не прервут, не помешают, выключат или не изменят его целей, поскольку из-за этого изначальные цели не будут выполнены”, – утверждает Макинтайр.

Если только цели ИСИ не будут точно отображать наши собственные, то у него будут достойные поводы не дать нам возможности остановить его. Учитывая, что уровень его интеллекта значительно превосходит наш, мы с этим ничего не сможем поделать.

Никто не знает, какую форму обретет ИИ и как он может угрожать человечеству. Как отметил Маск, искусственный интеллект может использоваться для контроля, регулирования и мониторинга другого ИИ. Или он может быть пропитан человеческими ценностями или преобладающим желанием быть дружественным к людям.

Миф №7: “Искусственный суперинтеллект будет дружелюбным”

Реальность: Философ Иммануил Кант верил, что разум сильно коррелирует с моральностью. Нейробиолог Давид Чалмерс в своем исследовании “Сингулярность: Философский анализ” взял известную идею Канта и применил ее к возникшему искусственному суперинтеллекту.

Если это верно… мы можем ожидать, что интеллектуальный взрыв приведет к взрыву моральности. Затем мы можем ожидать, что появившиеся ИСИ системы будут суперморальны также, как и суперинтеллектуальны, что позволит нам ожидать от них доброкачественности.

Но идея того, что развитый ИИ будет просветленным и добрым, по своей сути, не очень правдоподобна. Как отметил Армстронг, есть много умных военных преступников. Не похоже, что связь между разумом и моральностью существует среди людей, поэтому он поддает сомнению работу этого принципа среди других умных форм.

“Умные люди, ведущие себя аморально, могут вызывать боль гораздо больших масштабов, чем их более глупые коллеги. Разумность просто дает им возможность быть плохими с большим умом, она не превращает их в добряков”, – утверждает Армстронг.

Как объяснил Макинтайр, возможность субъекта достичь цели не относиться к тому, будет эти цель разумной для начала. “Нам очень сильно повезет, если наши ИИ будут уникально одаренными и уровень их моральности будет расти вместе с разумом. Надеяться на удачу – не лучший подход для того, что может определить наше будущее”, – говорит он.

Миф №8: “Риски ИИ и робототехники равнозначны”

Реальность: Это особенно частая ошибка, насаждаемая некритичными СМИ и голливудскими фильмами вроде “Терминатора”.

Если бы искусственный суперинтеллект вроде Skynet действительно захотел бы уничтожить человечество, он был не использовал андроидов с шестиствольными пулеметами. Гораздо эффективнее было бы наслать биологическую чуму или нанотехнологическую серую слизь. Или просто уничтожить атмосферу.

Искусственный интеллект потенциально опасен не тем, что он может повлиять на развитие роботетехники, а тем, как его появление повлияет на мир в принципе.

Миф №9: “Изображение ИИ в научной фантастике – точное отображение будущего”

Множество видов разумов. Изображение: Элизер Юдковски

Конечно, авторы и футуристы использовали научную фантастику, чтобы делать фантастические прогнозы, но горизонт событий, который устанавливает ИСИ, это совсем другая опера. Более того, нечеловеческая природа ИИ делает для нас невозможным знание, а значит и предсказание, его природы и формы.

Чтобы развлекать нас, глупых людишек, в научной фантастике большинство ИИ изображены похожими на нас. “Существует спектр всех возможных разумов. Даже среди людей, вы достаточно отличаетесь от своего соседа, но эта вариация ничто, в сравнении со всеми разумами, которые могут существовать”, – говорит Макинтайр.

Большинство научно-фантастических произведений, чтобы рассказать убедительную историю, не должны быть научно точны. Конфликт обычно разворачивается между близкими по силе героями. “Представьте, насколько бы скучной была история, где ИИ без сознания, радости или ненависти, покончил бы с человечеством без всякого сопротивления, чтобы добиться неинтересной цели”, – зевая, повествует Армстронг.

На заводе Tesla трудятся сотни роботов

Миф №10: “Это ужасно, что ИИ заберет всю нашу работу”

Реальность: Возможность ИИ автоматизировать многое, из того, что мы делаем, и его потенциал уничтожить человечество, две совсем разные вещи. Но согласно Мартину Форду, автору “На заре роботов: Технологии и угроза безработного будущего”, их часто рассматривают как целое. Хорошо думать об отдаленном будущем применения ИИ, но только если оно не отвлекает нас от проблем, с которыми нам придется столкнуться в ближайшие десятилетия. Главная среди них – массовая автоматизация.

Никто не ставит под сомнение, что искусственный интеллект заменит множество существующих профессий, от работника фабрики до высших эшелонов белых воротничков. Некоторые эксперты предсказывают, что половине всех рабочих мест США угрожает автоматизация в ближайшем будущем.

Но это не означает, что мы не сможем справиться с потрясением. Вообще, избавление от большей части нашей работы, как физической так и ментальной, – квази-утопическая цель нашего вида.

“В течении пары десятилетий ИИ уничтожит множество профессий, но это неплохо”, – говорит Миллер. Беспилотные автомобили заменят водителей грузовиков, что сократит стоимость доставки и, как следствие, сделает многие продукты дешевле. “Если вы водитель грузовика и зарабатываете этим на жизнь – вы потеряете, но все другие наоборот смогут покупать больше товаров на ту же зарплату. А деньги, которые они отложат, будут потрачены на другие товары и услуги, которые создадут новые рабочие места для людей”, – утверждает Миллер.

По всей вероятности, искусственный интеллект будет создавать новые возможности производства блага, освободив людей для занятия другими вещами. Успехи в развитии ИИ будут сопровождаться успехами в других областях, особенно в производстве. В будущем, нам станет легче, а не сложнее, удовлетворять наши основные потребности.

Человечество пока не полетело к звёздам. Да что там говорить, оно не совершило даже пилотируемые полёты к Венере и Марсу, которые фантасты прошлого века считали делом ближайшего будущего. Но кое в чём наша цивилизация превзошла самые смелые прогнозы. Лишь немногие фантасты тридцать-сорок лет назад предвидели появление сотовой связи и интернета. И даже они не представляли, как велика будет роль этих изобретений в повседневной жизни человека.

Поступь прогресса

Электроника совершенствуется стремительно, и, вероятно, темпы её прогресса не снизятся ещё полтора-два десятилетия. Но не стоит опасаться (или надеяться), что они останутся неизменными на протяжении столетий.

Развитие технологий происходит рывками. Так, иначе машина устаревала, ещё не родившись. А потом - как отрезало. Многие самолёты, сконструированные в 1950-е, выпускают до сих пор. Ценой титанических усилий раз в 5-10 лет создают новые модели, которые чуть-чуть безопаснее, немного экономичнее, слегка комфортнее, зато в разы дороже предыдущих.

Прогресс не остановился, но темпы его замедлились до нормы. В определённый момент изделие начинает так хорошо отвечать назначению, что улучшить его сложно, да и не нужно. Взять хотя бы топор: сильно ли его усовершенствовали за последнюю тысячу лет?

Сверхзвуковые авиалайнеры «Конкорд» и Ту-144 - яркая иллюстрация «ограниченности» прогресса. Летать быстрее 800-900 км/ч пассажирскому самолёту оказалось не нужно и слишком дорого, и их вывели из эксплуатации

Сравнение мобильных устройств - телефонов, ноутбуков, планшетов, навигаторов - с топором вполне уместно. Они столь же распространены, только дороже и куда надёжнее. Последнее может показаться спорным: электроника ломается то и дело, а топор, купленный дедом, как лежал на даче, так и будет лежать в полной исправности. Но это потому, что топором пользуются редко. Если тратить на рубку дров столько же времени, сколько на разговоры по мобильнику, станет ясно - телефон-то покрепче будет.

Перспективы усовершенствования электронники необъятны. Но фантасты могут спать спокойно: принципиально цифровые друзья человека почти не изменятся, когда будет достигнут потолок целесообразности. А современный мобильный телефон уже решает большинство задач в области связи, навигации и получения информации. Конечно, лет через 20 технологии позволят сделать его в сто раз миниатюрнее и даже встроить в человеческое тело. Но принцип останется тем же.

Следует ожидать объединения разных мобильных устройств в одно, оптимизированное для постоянного ношения и использования. Оборудование карманного компьютера 19-дюймовым монитором и полноценной клавиатурой представляет собой задачу нетривиальную, но разрешимую. Можно, например, представить гибкий сенсорный экран.

Прогресс вычислительной техники огромен даже за последние пять лет. А вот современные ракеты-носители принципиально не отличаются от разработок Цандера и Королёва

Предпосылки ИИ

В прошлом футурологи опасались, что машины, вытеснив человека из сферы производства, вызовут массовую безработицу. Таким мир торжествующих технологий видел, например, в опубликованном в 1952 году романе «Механическое пианино». Пессимизмом, в сущности, проникнуты и утопии советских авторов, воображение которых рисовало картины поужаснее воннегутовской антиутопии. Предполагалось, что при коммунизме машины заменят человека всюду, где не требуется творческий подход.

К творчеству же большинство людей - давайте смотреть правде в глаза - не способны. В чём легко убедиться в наше время, поглядев в интернете на массу горе-графоманов и горе-музыкантов. Этот момент хорошо обыгран в «Сказке о тройке» : пришелец Константин работает читателем скверных стихов - должен же их хоть кто-то читать! Его труд справедливо считается тяжёлым и вредным для здоровья.

Воннегут совершил ошибку, типичную для мыслителей конца XIX - середины XX века, исходивших из идеи, что у человека есть некий «разумный» уровень потребностей. Философы не учитывали, что технический прогресс удовлетворяет потребности, им же и порождённые. Обеспечивать население персональными автомобилями или персональными компьютерами не планировалось, пока автомобили и компьютеры не были изобретены, - то есть предложение здесь рождает спрос.

Британские учёные полагают, что мозг человека, оставленный электроникой без работы, в будущем начнёт уменьшаться, постепенно сократившись до размера мозга британского учёного (кадр из « »)

Машины заменили людей у станков и на пашне, но это не вызвало массовой безработицы. Освобождённые от физического труда массы были поглощены сферами управления и обслуживания. Цивилизация вошла в постиндустриальную стадию, и вдруг стало ясно, что производство как таковое вообще не представляет собой проблему. Выпуск любого товара в любом количестве можно в любой момент организовать в любой точке Китая.

Загвоздка только в реализации продукта. Значит, главный трудяга, создающий богатство нации, - скромный менеджер, изредка поднимающий телефонную трубку и неохотно отрывающийся от жизни в соцсетях, чтобы переложить файл из одной папки в другую. И это перекладывание ныне создаёт прибавочную стоимость, за которую менеджеру платят деньги.

Технический прогресс не вызвал социальной катастрофы - можно не опасаться этого и в будущем. Даже если роботы сумеют согнать с насиженных мест офисный планктон, останется ещё сфера услуг. Появятся новые специальности - хотя бы те же профессиональные читатели. Должен же кто-то принять на себя удар несущейся на человека информационной лавины? Специально обученные люди встанут на пути неконтролируемо множащихся публикаций, отбирая из тысяч те немногие, которые стоит читать (пахнет цензурой, не так ли?).

Куда важнее другой факт, ещё не осознанный, но уже свершившийся. Освободив человека от физического труда, машина начинает брать на себя и функции его мозга. Многие ли умеют сегодня умножать в столбик и грамотно писать без помощи «спеллчекера»? Впрочем, разобрать каракули, написанные на бумаге привыкшей к клавиатуре рукой, всё равно невозможно.

Доступ к информации и её фиксация упростились до предела. Электроника не просто дополняет человеческую память - всё чаще она её заменяет. А всякая способность утрачивается без упражнения. Можно безуспешно бороться с этой тенденцией, а можно смириться с тем, что до конца века фундаментальные признаки грамотности - умение считать и писать - постигнет участь стрельбы из лука. Когда-то владеть этим икусством было необходимо, потом - полезно, потом бесполезно, но принято. Наконец стрельба превратилась в спорт. Пожалуй, лет через 50 устный счёт и чистописание включат в программу Олимпиады.

Конечно, ситуация внушает беспокойство. Вдруг потребуется помножить семь на восемь, а калькулятора не будет под рукой? Подобные сомнения наверняка терзали и австралопитека, впервые взявшего в руку камень. Привыкнешь, думал он, а потом понадобится раздробить кость, а камня нет. Но если бы австралопитек, побоявшись остаться без камня, принялся упражнять челюсти, это не только оказалось бы глупостью, но и направило бы эволюцию в совершенно иное, не ведущее к человеку разумному русло. Наша сила, грозящая вот-вот стать богоравной, - именно в нашей неспособности обойтись без орудий.

Мир меняется. Умение считать заменяется умением пользоваться калькулятором (точнее, уже компьютером). Значит, именно обращению с этим устройством следует учить. Для того же, чтобы владеть калькулятором, требуется понимать суть арифметических действий, тригонометрических функций, возведения в степень, извлечения корня, логарифма. А знать таблицу умножения - излишне.

Тест Тьюринга

Ограничится ли дело только лишь памятью и способностью к счёту? Что ещё может заменить (а значит, неизбежно заменит) искусственный интеллект? В 1950 году математик Алан Тьюринг предложил оценивать искусственный интеллект по умению программы выдать себя за человека. Если квалифицированный, специально готовившийся к испытанию экзаменатор, знающий, что один из его невидимых собеседников робот, а второй - человек, в 30% случаев ошибётся, пытаясь определить, кто есть кто, - можно считать, что машина научилась мыслить. Почему 30 процентов, а не 50, которые означали бы, что различий нет в принципе и угадать удаётся только случайно? Потому что для действительно безупречного притворства необходим некий «запас прочности», вот и всё.

Победа компьютера, обоснованно полагал Тьюринг, будет означать, что машина способна заменить человека. Робота можно посадить на телефон, и на другом конце провода никто не заметит разницы. Программа скажет то, что сказал бы человек, и даже отдаст такие же распоряжения, которые отдал бы человек на её месте.

Чемпион мира по шахматам Гарри Каспаров играет против компьютера Deep Blue в 1997 году. Каспаров проиграл, расстроился, отказался признавать результаты матча и зарёкся впредь играть с роботами

Сейчас боты вплотную подошли к преодолению барьера. Пессимисты считают, что он будет преодолён в ближайшие 15 лет, оптимисты же полагают, что успех уже пора отмечать. В августе 2012 года российская программа «Евгений» набрала на тесте 29,2%. А ведь речь идёт о состязании робота со специалистами, пытающимися разоблачить бота изощрёнными и каверзными методами.

В ближайшем будущем реальностью станет то, на что у фантастов не хватает воображения. Появятся, например, телефоны, которые сами, через неравные (чтобы пунктуальность не показалась подозрительной) промежутки времени будут обзванивать пожилых родственников хозяина, справляясь об их здоровье, терпеливо выслушивать пересказы сериалов, анализировать рост цен на гречку и вступать в полемику о воспитании пуделей. В рабочее время такой аппарат сможет вести переговоры с клиентами и лепетать оправдания, услышав в трубке начальственный голос. Обладатель которого, впрочем, в этот момент будет рубиться на том же игровом сервере, что и подчинённые, поручив имитацию руководства своему телефону.

Речь идёт лишь об имитации, не так ли? Робот продаёт морозильное оборудование, общается на форуме, причём постит страшную чушь, и его даже банят за хамство… Программа не думает, а лишь симулирует мыслительный процесс человека, просчитывая, какие решения могли бы быть приняты им в данной ситуации. Но и шахматный суперкомпьютер на самом-то деле в шахматы не играет. Он просто преобразует входящий сигнал по сложному алгоритму.

А не замахнуться ли нам…

Какая разница между «мыслит» и «не мыслит», если результат одинаков? Где граница между качественной подделкой, доступной уже сейчас, и остающимся фантастикой разумным дроидом C-3PO из кинофильма «Звёздные войны»? Теоретически разницу можно будет заметить. Например, виртуальный менеджер среднего звена, удостоверившись, что фотография на личной странице девушки отвечает критериям привлекательности, будет пытаться назначить ей свидание, не замечая, что это фотография Миллы Йовович времён «Пятого элемента». Человек такой ошибки не совершит.

Но это в теории. В реальности программа будет знать в тысячу раз больше уловок и методов их распознавания, чем живой пользователь. И уж подавно больше, чем обаятельный, но простодушный дроид. Скорее всего, бот просто взломает сервер и сверит фотографию с паспортными данными.

Для C-3PO каждый разговор с человеком - успешно пройденный тест Тьюринга. В отличие от реальных программ, робот из «Звёздных войн» разумен и обладает не только интеллектом, но и чувствами

Тем не менее разум - нечто большее, чем интеллект. Разумной можно назвать лишь машину, обладающую волей и сознанием. И как взяться за её создание, не слишком-то ясно. Не потому, что сознание - столь уж великая тайна. Просто появ ление «железа», способного потянуть такой софт, ожидается только лет через сорок. И это при сохранении прежних темпов развития электроники, на что вряд ли можно рассчитывать.

В природе программы - безусловные рефлексы - пишутся путём отбора мутаций, затрагивающих нервную систему. Это крайне непроизводительный метод, который обеспечивает приемлемые результаты лишь для видов, отличающихся плодовитостью. Именно по этой причине у позвоночных эволюция пошла другим путём. Долгоживущее существо анализирует опыт, вычленяя связи между событиями, затем сопоставляет между собой выявленные закономерности, - и так без конца. Для приобретения условных рефлексов требуется большой и свободный от «врождённого софта» мозг. Метод очень трудоёмок, но потенциально позволяет приспосабливаться к любым условиям.

Но боту не нужно накапливать и анализировать личный опыт. У него есть программист, способный научить всему сразу, а не постепенно, за миллион лет отбора. Поэтому непонятно, стоит ли в принципе браться за создание подлинного машинного разума, если проще написать программу, воспроизводящую любые реакции настоящего C-3PO на внешние раздражители. Благо они столь же предсказуемы, как и у человека. Поддерживая беседу, бот мастерски будет разыгрывать наивность, тугодумие и затруднённую речь, якобы характерные для разумных роботов. Оснащённый интеллектом, но не разумом, бот будет подконтролен - программа не взбунтуется против создателей. Она не личность и не живёт, а значит, удаляя её с диска, не придётся терзаться угрызениями совести.

При этом бот может обучаться и даже способен к творчеству. Программы уже давно пишут музыку, расставляя семь нот в порядке, соответствующем человеческим представлениям о гармонии, - живым композиторам далеко не всегда это удаётся! Боты способны даже делать изобретения, ведь всё новое - это удачная комбинация уже существующих элементов, а просчёт комбинаций - сильное место машин.

Вьетнамский робот-художник Tosy SketRobo создаёт чёрно-белые скетчи, но лишь в рамках заданной программы. Воображения робот лишён

Перспективные направления

Киборгизация

Замена человеческих органов электронными протезами - перспективное направление в трансплантологии. Как далеко может зайти слияние человека с машиной?

В будущем наверняка появится возможность производить крошечные компьютеры, пригодные для вшивания под кожу. Способность подключаться к интернету и по мысленному запросу получать из Сети любые сведения прямо в мозг, минуя органы чувств, кажется привлекательной, особенно на экзаменах. Но в достаточной ли мере человек контролирует свои мысли для того, чтобы управлять таким устройством? И даже если решить эту проблему, останется вторая: мозг не будет расценивать сигнал, поступающий не с глазного нерва, как зрительную информацию.

Знание не возникнет ниоткуда. Человеку по-прежнему придётся читать либо прослушивать текст. Не удобнее ли в таком случае по старинке пользоваться наушниками и экраном? Во всяком случае, это позволит избежать сложной и небезопасной операции по вживлению электродов в нервные волокна.

Кибертранспорт

Ещё в 1988 году автопилот поднял, свёл с орбиты и посадил космический корабль «Буран». А эта задача сложнее, чем управление автомобилем

Уже сегодня сотовый телефон умеет практически всё, но функции грядущего универсального мобильного устройства окажутся ещё шире. Почему, например, навигатор в телефоне лишь подсказывает, куда и когда следует повернуть? Если он такой умный, пусть сам и рулит.

Конечно, управление можно возложить и на бортовой компьютер автомобиля, но это явное излишество. Машине незачем двигаться без пассажира, а человек никуда не денется от своего телефона. Таким образом, один электронный интеллект в салоне присутствовать всегда будет. Для чего тогда нужен второй? Телефон можно будет объединить с автомобилем, вставил в слот - и поехал.

Автомобиль с автопилотом - не фантастика уже сегодня. Конечно, нетрудно представить себе ситуацию на дороге, с которой робот не справится. Но - будем откровенны - представить себе ситуацию, с которой не справится человек, несравненно проще.

Нанороботы

В романах «Непобедимый», «Осмотр на месте», а также в нескольких других произведениях Станислав Лем высказывает предположение, что мы неправильно строим машины. Место больших автоматов должны занять крошечные, однообразные элементы (наноботы), при необходимости образующие из своих тел любые другие конструкции. В том числе и мозг.

Только на таком принципе, кстати, можно создать встречающиеся в фантастике «экспоненциальные машины», которые расширенно воспроизводят себя без участия человека и одновременно совершают какую-то полезную работу. Автомат традиционного типа слишком сложен для размножения, так как состоит из множества деталей, для производства которых требуется разнообразное оборудование, заведомо не помещающееся внутри самой машины.

Аналогия с клетками, составляющими человеческое тело, бросается в глаза. Но, несмотря на впечатляющие успехи миниатюризации, дело не выгорит. Проблема в том, что наши роботы - твёрдые. А все процессы, протекающие в живых организмах, имеют химическую природу и происходят в растворе. Воспроизвести клетку можно, работы в этом направлении уже близки к завершению, но при этом реальная экспоненциальная машина будет просто живым существом со всеми присущими ему слабостями.

* * *

Что бы там ни воображали фантасты, восстания машин не будет. Искусственный интеллект в современном понимании - не более чем имитация. Другой вопрос, насколько реалистичной она может быть. Если робот подумает, что для людей характерно уничтожение себе подобных (а оно, к слову, характерно), он начнёт это уничтожение имитировать. И смешно не покажется. Поэтому три закона Азимова нам всё-таки пригодятся.

Одна из наших ключевых экспертиз – машинное обучение, и мы стараемся отправлять сотрудников на профильные конференции для получения новых знаний (о копенгагенской конференции Scala Days мы уже в блоге), да и просто, чтобы быть в курсе основных трендов.

Для отрасли искусственного интеллекта это особенно важно, так как здесь ландшафт меняется как нигде быстро, а количество источников информации огромно. Целью моей поездки было как раз понять, что из «горячих» тем мы сможем использовать на практике в наших проектах.

Приехал я в Нью-Йорк за день до начала мероприятия и, как оказалось, в самый разгар очередного гей-парада, поэтому все витрины магазинов, фасады зданий и символ города Empire State Building были раскрашены в цвета радужного флага. Отчасти это задало тон поездке. На следующий день, погуляв и проникнувшись духом города, я поехал регистрироваться на конференцию.

О конференции

Конференция оказалась довольно масштабной и включала около 80 выступлений, проходивших параллельно в семь потоков, поэтому очно мне удалось посетить лишь небольшую часть. Для остального пришлось ждать видеоматериалов - O’Reilly всегда их публикует на safarionlinebooks , и там же можно посмотреть видео с предыдущих конференций (правда нужна подписка).

С одной стороны, тематика конференции довольно узка: когда мы говорим «искусственный интеллект», то в 90% случаев подразумеваем глубокие нейронные сети. С другой стороны, докладчики приглашаются из совершенного разных областей, и ввиду разнообразия решаемых ими задач компания спикеров получается довольно разношерстной. На сайте конференции можно ознакомиться с ее агендой .

Говоря о представленных на конференции компаниях, можно выделить три большие группы. Первая – это вездесущие технологические гиганты вроде Google, IBM, Microsoft, Amazon и др. Вторая – молодые компании и смузи-ориентированые AI-ориентированные стартапы, в коих сейчас недостатка нет. И третья – это представители академической среды – основной поставщик новых теорий, подходов и алгоритмов. Лично на меня выступления последних, как правило, производят наибольшее впечатление.

Ввиду короткого формата выступлений (на каждую лекцию вместе с вопросами отводилось всего 45 минут) в них было очень мало математики или алгоритмов, в основном описывались общие идеи и демонстрировались примеры их применения. В целом это понятный подход, если что-то тебя заинтересовало - welcome, гугли эту тему в интернете и изучай её более подробно. Поэтому для себя я сформулировал цель посещения подобных мероприятий так – понять, какие темы на слуху и в каком направлении развивается индустрия.

К слову, за все время конференции ни в одном из выступлений я не услышал так любимый многими термин «Big Data», что, на мой взгляд, говорит о достаточно профессиональном уровне аудитории – терминология должна использоваться корректно.

Вообще, когда мы говорим «искусственный интеллект», воображение чаще всего рисует нечто подобное.

Но на самом деле ИИ - не только и столько про роботов, это гораздо шире. По сути речь идет о любой интеллектуальной системе или программе, способной в условиях большой неопределенности решать задачи, традиционно считавшиеся прерогативой человеческого интеллекта.

О глубоком обучении

Первый день организаторы отвели под мастер-классы. В основном это были туториалы по всевозможным фреймворкам глубокого обучения (deep learning), которых сегодня «на слуху» около 10 штук и которые, на мой личный взгляд, как две капли воды похожи другу на друга.

Глубокое обучение - это процесс обучения многослойных нейронных сетей, оптимизированных для работы с данными сложных иерархических форматов, и в последнее время ставший стандартным подходом для анализа текстов, изображений, аудио/видео данных и временных рядов.

Основное преимущество глубоких сетей перед другими методами машинного обучения и немногослойными сетями (shallow networks) – они избавляют от необходимости заниматься ручной генерацией фич (feature engineering), поскольку этот механизм заложен в архитектуру самой сети. Обратная сторона – такие сети требуют больше данных для обучения и для них сложнее подбирать параметры.

В глубоких сетях выделяют 2 базовых архитектуры: сверточные (CNN, Convolutional Neural Networks) и рекуррентные сети (RNN, Recurrent Neural Networks). Первые используются в основном для работы с изображениями, а вторые - для анализа текстов и любых последовательностей. Все остальные архитектуры - вариации на тему этих двух.

Чтобы аналитики не занимались реализацией низкоуровневой логики, за несколько лет появилось множество API, упрощающих разработку таких сетей и сводящих ее к конфигурации нужной архитектуры. Здесь перечислены почти все:

Я решил не мудрить и выбрал два наиболее популярных: TensorFlow и Keras.

Keras – один из наиболее высокоуровневых инструментов в этой серии, по сути являющийся Lego-конструктором. Разработка приложения сводится к выбору архитектуры сети, числа слоев, нейронов и активационных функций. Простейшие глубокие сети в Керасе собираются в 10 строк кода, что делает этот инструмент идеальным для быстрого старта или прототипирования.

TensorFlow, наоборот, один из наиболее низкоуровневых инструментов. Google его позиционирует как пакет для любых символьных вычислений, не только для глубоких сетей. На мой взгляд, одна из киллер-фич – это обалденная динамическая визуализация. Чтобы понять, о чем идет речь, можно посмотреть, например, .

TensorFlow является основной технологией для огромного числа AI-проектов и помимо Гугла используется в IBM, SAP, Intel и много где еще. Важный его плюс – большой репозиторий готовых к использованию моделей.

Второй и третий дни были отведены под лекции. После утренней обзорной сессии с короткими десятиминутными выступлениями о достижениях индустрии, шел блок из 6 лекций.

Deep Learning в банках

Мне всегда была интересна тематика применения глубоких сетей не для очевидных картинок и текста, а для более «традиционных» структурированных данных, поэтому первой лекцией я выбрал рассказ Эрика Грина из Wells Fargo AI Labs об анализе транзакционных данных в банках.

«Продвинутные» банки давно делают глубокую аналитику для прогнозирования будущих транзакций, сегментации, выявления мошенничества и т.д., но пока мало кто может похвастаться работающим решением на базе глубоких сетей.

Идея предложенного подхода очень простая – сначала история транзакций записывается в неком структурированном формате, после этого каждый атрибут транзакции кодируется определенным числом (word embedding), а затем к получившимся векторам применяются глубокие сети (CNN или RNN). Такой механизм универсален и позволяет решать как задачу классификации, так и задачи прогнозирования и кластеризации транзакций. К сожалению, с точки зрения подачи материала лекция оказалась довольно слабой, и у автора выудить детали по качеству данного решения не удалось.

Зато следующий рассказ о совместном проекте Teradata и датского Danske Bank по внедрению антифрод-решения на базе глубокого обучения получился куда лучше. Задача была повысить качество обнаружения мошеннических транзакций. Ребята описывали довольно интересное решение, связанное с представлением транзакций в виде «псевдокартинки» и последующим применением сверточной нейронной сети.

Ниже приведен пример такой псевдокартинки, где по горизонтали отложены атрибуты транзакции, а по вертикали моменты времени. Кроме того, вокруг каждого атрибута (выделены светло-синим) по часовой стрелке отложены наиболее коррелированные с ним атрибуты. Такое представление позволяет легко находить аномальные паттерны в поведении клиентов.

Если верить их цифрам, по качеству это решение оставило далеко позади даже всеми любимый градиентный бустинг. Я не всегда доверяю цифрам в презентациях, но даже если качество сопоставимо, это очень интересный результат. Я планирую обязательно попробовать данный подход где-нибудь в наших задачах.

Правда на вопрос «Как такое решение будет проходить европейские требования GDPR по интерпретируемости модели» ребята так и не ответили. Будь он задан мне, я бы отослал к такой замечатльной штуке как LIME - интерпретатору сложных нелинейных моделей.

Дальше я пошел на панельную дискуссию с тремя девушками, владельцами AI-ориентированных стартапов. Дискуссия была о том, как выстроить эффективный бизнес в сфере AI. По факту сессия оказалась самой бесполезной: несмотря на обещанный «no fluff» в названии, никаких секретов раскрыто не было, а «общие» вопросы чередовались «общими» ответами. Единственное, что запомнилось из лекции, это выступавшая там девушка с необычным именем Коко (по совместительству профессор MIT).

Что там в Amazon

Далее меня заинтересовала лекция от Amazon про фреймворк распределенного глубокого обучения Apache MXNet . Я рассчитывал на мини-туториал по данному фреймворку, но по факту 90% рассказа были посвящены рекламе сервисов Amazon, а в оставшиеся 10% MxNet была упомянута просто как основная платформа для глубокого обучения, использующаяся во всех сервисах Амазона.

Среди достижений народного хозяйства компании были представлены:

голосовой помощник Alexa ,
телепомощник Amazon Show - вариант Alexa с камерой и дисплеем,
Amazon X-Ray – встроенный в видеоплеер помощник, который по стопкадру может показать биографию актера, а также вывести информацию о сюжете и персонаже,
а также Amazon - магазин без кассовых аппаратов (мечта гопника) – просто набираешь продукты в корзину и идешь на выход, магазин сам определяет состав продуктов в корзине и списывает деньги со счета. Магазин сейчас работает в beta-режиме (только для сотрудников).

Во всех перечисленных выше проектах в том или ином виде используется глубокое обучение и, в частности, фреймворк Apache MxNet.

«Железная» логика

Далее выступал представитель Numenta – компании, которая занимается разработкой систем, моделирующих работу Неокортекса (части мозга человека, отвечающей за высокоуровневую интеллектуальную деятельность и обучение). Идея – построить обучающиеся структуры, более близкие по своей архитектуре мозгу человека, чем сегодняшние нейронные сети. В основе лежит теория иерерархической темпоральной памяти (Hierarchical Temporal Memory), которая описывается в книге Джефа Хокинса 2004 года «Об интеллекте». Собственно, он же и основал компанию Numenta.

Сами авторы позиционируют свой проект как исследовательский и, несмотря на то, что алгоритм может решать разные задачи, пока нет результатов, подтверждающих, что подход работает лучше традиционных глубоких нейронных сетей. У выступавшего Мэта Тейлора есть канал на YouTube (HTMSchool), но он мне, честно говоря, не понравился и для ознакомления я бы рекомендовал все-таки печатные материалы.

Тема «железа» (AI acceleration) на конференции поднималась достаточно часто. Многие компании занимаются разработкой высокопроизводительных вычислительных комплексов, оптимизированных специально под обучение нейронных сетей. Известные примеры это процессоры Google TPU (tensor processing units), GPU дата-центры от Nvidia, или созданный в 2014 году компьютер TrueNorth от IBM, своей архитектурой повторяющий модель неокортекса. С ростом объемов данных скорость обучения становится важным конкурентным преимуществом.

Когда роботы захватят людей

Далее был интересный доклад Кэти Джордж из McKinsey о потенциале автоматизируемости профессий. Частично о результатах можно почитать на McKinsey (к сожалению, в виде единой pdf у них не нашел).

Каждую профессию они рассматривали как комбинацию определенных действий и смотрели, какой процент этих действий может быть автоматизирован с учетом текущих технологий. Результаты меня удивили! Несмотря на то, что потенциал для автоматизации есть почти во всех профессиях, полностью автоматизированы могут быть всего 5% позиций. Что немножко расходится с популярной риторикой о том, что через год роботы поработят всех юристов (или как там было...).

Наибольшим потенциалом обладает предсказываемая физическая деятельность – это те же конвейеры на производстве, а также сбор и хранение данных, наименьшим – непредсказуемая физическая активность – например, игра в футбол (впрочем, насчет непредсказуемости болельщики сборной России могут поспорить).

Любопытно, что зависимость автоматизируемости от оплаты труда имеет форму треугольника – высокооплачиваемые профессии мало автоматизируются, а вот среди низкооплачиваемых разброс намного больше.

Интересно, что если смотреть потенциал по разным индустриям, то на первое место авторы поставили горячо любимую в нашей компании задачу персонализированного маркетинга (personalized advertizing).

День второй

Если глубокая аналитика давно перестала быть чисто академической дисциплиной и стала вполне себе прикладной (любой ларек с шаурмой умеет строить модели), то в области искусственного интеллекта дела обстоят чуть по-другому. Область активно развивается, и люди пытаются находить все новые точки применения, среди которых есть и абсолютно бесполезные с практической точки зрения.

Генерация искусства

Даг Эк из Google рассказывал о проекте Google Magenta – открытом репозитории моделей для создания музыки и рисунков.

Затем был рассказ про сеть sketch-RNN, электронного художника, работающего на базе автоэнкодера и умеющего перерисовывать нарисованные от руки картинки и символы.

Автоэнкодер – сеть, сначала переводящая картинку в некое сжатое представление, а затем восстанавливающая его изначальную размерность. Таким образом, сеть работает как высокочастотный фильтр и способна убирать шум с картинки (шум в широком смысле, например, недорисованный ус).

Слева – котэ, нарисованный человеком, а справа - сгенерированный машиной образ.

Понять, где рисует машина, где человек – невозможно. В целом, становится все больше областей, где машины проходят тест Тьюринга (тест Тьюринга не обязательно формулируется для диалоговых систем, это может быть, например, распознавание или генерация картинок).

Авторы сами признаются, что конкретной цели у проекта нет, но это нормально, если вспомнить, что многие выдающиеся изобретения были разработаны безо всякой цели. По крайней мере, для рынка поп-музыки потенциал, мне кажется, очевиден.

Покер и теория игр

Другое известное применение искусственного интеллекта – это соревнование с человеком в азартных (и не очень) играх. Томас Сендхолм из Carnegie-Melon University рассказывал об игре в покер. Все знают, что машина давно обыгрывает человека в шахматы, слышали про недавнюю победу в Go, но выигрыш искусственного интеллекта в покерном турнире в этом году не получил большой огласки.

В теории игр игра с неполной информацией – та, в которой игрок не видит карт соперника. Из-за этого на каждом шаге ему приходится иметь дело не с детерминированным деревом игры, а с вероятностями и их матожиданием. Такие игры сложнее, так как необходимо просчитывать большее количество комбинаций. Решить игру означает найти оптимальную стратегию. Если упрощенные версии покера с помощью брут-форса были решены относительно давно, то более сложный вариант noLimit texas Holdem содержит 10^161 (больше числа атомов во Вселенной) вариантов игры, и прямое решение здесь невозможно.

Для решения использовался мощный суперкомпьютер, в реальном времени обрабатывающий поступающую информацию от игрового стола (Libratus), а в качестве математического алгоритма метод Monte-Carlo Counterfactual Regret Minimization.

Турнир я не видел, но говорят, вопреки ожиданиям AI играл довольно «тайтово», делал большие ставки, «давил банком» и брал «на понт».

Для индустрии азартных игр это означает перспективу роботизации, сравнимую с роботизацией рынка ценных бумаг.

Беспилотные авто

Одна из топовых тем, имеющих отношение к искусственному интеллекту, – это, конечно, беспилотные авто. Она не только популярна, но еще и весьма «широка». Разработчики таких машин вынуждены иметь дело не только с технологиями компьютерного зрения, но еще и с теорией оптимального управления, многочисленными системами позиционирования и решать множество прогностических задач. Не так сложно научить машину распознавать сцену и поворачивать руль в нужном направлении. Гораздо сложнее создать полностью автономного агента, способного безопасно передвигаться в потоке вместе с обычными водителями и координировать с ними свои действия.

Анка Драган из Berkley рассказывала о проблемах поведения беспилотных авто на дорогах. Для «затравки» было приведено два примера.

Первый пример: в штатах тестируемая гугломашина простояла два часа на перекрестке, пропуская другие машины, поскольку не могла вклиниться в поток. Вторым примером было показано видео а-ля телепередача «Водить по-русски», в котором где-то на просторах Миннесоты грузовик не дает перестроиться машине в свой ряд и «отжимает» легковушку обратно.

Сейчас разрабатываемые беспилотники воспринимают другие машины как препятствия, от которых нужно держаться подальше: если робот видит, что машина не уступает дорогу, он не будет к ней соваться. Но такая модель поведения (defensive behavior) будет крайне неэффективной: на перекрестке такие беспилотники могут пропускать другие машины до бесконечности, а на дороге не смогут даже перестроиться на съезд.

С другой стороны, как показывает второй пример, рассчитывать на разумное поведение водителей тоже нельзя. Отсюда и одно из главных опасений – сумеет ли беспилотник правильно повести себя в нестандартных ситуациях. Поэтому авторы предлагают при разработке использовать некий сбалансированный подход – начинать маневр, исследовать реакцию водителя, и в зависимости от нее корректировать свои действия.

Про Doom, или что еще умеют глубокие сети

Далее была лекция Руслана Салахутдинова из Carnegie-Melon University и Apple с обзором возможностей глубокого обучения для решения различных задач. С точки зрения подачи материала, на мой взгляд, это была одна из лучших лекций. Вообще, интересующимся глубоким обучением рекомендую ознакомиться с лекциями данного товарища, коих в интернете достаточно (например, ). Приведу несколько примеров.

За последние несколько лет глубокие сети совершили прорыв, не только количественный, но и качественный – начали появляться новые задачи, комбинирующие визуальную и текстовую аналитику. Если 2-3 года назад сети умели только классифицировать тематику картинки, то теперь они легко могут дать словесное описание всей сцены на естественном языке (задача caption generation).

Кроме того, подобные системы умеют явно выделять на картинке объекты, соответствующие каждому отдельному слову из описания (так называемые Visual Attention Networks).

Основной вектор развития рекуррентных сетей связан с переходом к более совершенным механизмам запоминания контекста. В свое время в сфере рекуррентных сетей подобный прорыв совершили LSTM (long short-term memory) сети. Сейчас также разрабатываются сети с разными моделями памяти и один из таких вариантов - это сети MAGE, memory as acyclic graph enconding, способные моделировать долговременные ассоциации в тексте.

Или совсем поражающая воображение штука - сети с динамической памятью (Dynamic Memory Networks), которые не просто анализируют картинки или текст, но еще умеют отвечать на любой заданный вопрос касательно этой картинки или текста.

Далее был интересный блок про обучение с подкреплением (reinforcment learning). С появлением глубокого обучения данный подход получил всплекс интереса. Новые алгоритмы также пытаются задействовать механизм памяти.

В двух словах, Reinforcment Learning – это обучение оптимальному поведению. Какие-то действия системы поощряются, какие-то штрафуются, и задача системы научиться правильно действовать. Основное отличие от обучения с учителем в том, что система получает поощрение не при каждом действии, а довольно редко, поэтому она должна самостоятельно выстраивать весьма сложные стратегии поведения.

Для обучения с подкреплением идеально подходит виртуальная среда, в частности компьютерные игры. Она позволяет создавать бесконечное количество экспериментов, давая возможность без ограничений обучаться алгоритму, что невозможно сделать в реальности.

Результат работы традиционного RL (без памяти) был продемонстрирован на примере игры Doom. Для обучения использовались несколько классических карт. За найденный ключ или убитого врага следовало поощрение, а например, за падение в лаву – наказание. Если на первых итерациях обучения бот упирался лбом в стену, то спустя 8 часов обучения, он с полоборота сносил игроков так, что те не успевали ничего понять. Система отлично обобщала получаемые знания и одинаково хорошо играла как на старых, так и на новых картах.

Если для шутеров классический RL вполне подходит, то для более сложных игр с логическими заданиями уже требуется запоминание контекста, т.е. наличие памяти. Для этого был разработан класс алгоритмов Reinforcment Learning with Structured Memory.

Про компьютерное зрение

Исторически самое первое применение глубоких сетей – это анализ изображений. Лекция от Microsoft была посвящена технологиям компьютерного зрения. Тимоти Хейзен выделил четыре основные задачи:

классификацию изображений,
поиск объектов на картинке (object detection),
сегментацию - выделение связных областей,
определение схожести.

Если до 2012 года бал правили традиционные подходы, когда генерация фичей для обучения модели выполнялась вручную (HOG, SIFT и прочее), то в 2012 году прорыв в качестве распознавания совершила глубокая нейронная сеть AlexNet. В дальнейшем глубокие архитектуры стали стандартом.

В области компьютерного зрения бенчмарком является конкурс ImageNet , на котором тестируются все новые архитектуры. В 2016 году первое место заняла сеть от Microsoft ResNet, содержащая больше 150 слоев. На картинке ниже приведено сравнение точности известных сверточных сетей. Тенденнция к увеличению количества слоев на лицо, однако вместе с ней актуальной становится проблема «убывающего градиента» - обучать такие сети все сложнее. Можно предположить, что дальнейшие улучшения будут связаны с изменением архитектуры сетей, а не в увеличении числа слоев.

В качестве примера приводилось четыре любопытных проекта, которые Microsoft делал в качестве консультантов.

Трекинг передвижения снежных леопардов в условиях дикой природы (подробнее )
Умный холодильник – когда заканчивается пиво, он отправляет владельцу срочную смску с предупреждением или сам делает заказ в магазине.
Распознавание аэрофотоснимков для анализа развития территорий ().
Избитая идея для Fashion-стартапа, когда по картинке определяется, что надето на человеке, и ищется максимально похожая одежда в ближайших магазинах. Кстати, если кому-то интересно, есть открытый датасет со шмотками.

Разумеется, не обошлось без рекламы двух своих продуктов: Cognitive Toolkit (CNTK) и Custom Vision – облачного сервиса для классификации изображений.

Я решил протестировать функционал Custom Vision и попробовал научить бинарную модель классификации отличать хипстеров от гопников. Для этого загрузил около 1000 изображений, из поиска Google Images. Никакой предобработки не делал, загружал как есть.

Модель обучалась несколько минут и в целом результаты получились неплохие (Precision: 78%, Recall: 89%). Да и на новых примерах классификатор работает корректно (см. ниже).

Антихайп

Интересно, что на конференции много докладов было связано с развенчанием мифов. Поскольку тема хайповая, пишут о ней много и не всегда по делу.

Очень часто звучала такая мысль: существующие сегодня нейронные сети нельзя назвать полноценным интеллектом. Пока это лишь его очень грубая модель, частично обладающая свойством обучаемости, но очень плохо обобщающая и лишенная того, что называют «common sense». Многие спикеры сходились в том, что для разработки действительно «умного» интеллекта потребуется не один десяток лет. Пока что мы даже толком не знаем, как работает мозг, не говоря уже о том, чтобы создать его полноценный искусственный аналог.

Сегодня не существует однозначного определения понятия «искусственный интеллект», но большинство экспертов сходится, что такой интеллект должен обладать набором базовых способностей, присущих человеческому, в частности умением:

обучаться,
планировать и решать поставленные задачи,
обобщать,
коммуницировать с людьми.

Определенных успехов мы добились, пожалуй, только в способности обучения, а все остальное остается на очень базовом уровне. Потенциал развития искусственного интеллекта в ближайшие годы видится как раз в развитии этих характеристик.

Про One-shot Learning и Transfer Learing

Обучение с учителем – стандартный подход сегодня, однако он все чаще критикуется. Несколько раз звучала интересная мысль о том, что будущее машинного обучения за обучением без учителя, или по крайней мере роль учителя будет уменьшаться.

Ведь чтобы понять, что не стоит совать пальцы в розетку, человеку в отличие от нейросети не нужно 10 тысяч раз повторять этот опыт, и обычно он запоминает с первого (хотя не все, конечно). Помимо базовых инстинктов человек обладает неким здравым смыслом, предобученной базой знаний, которая позволяет ему легко делать обобщения. Есть гипотеза, что она заложена в сформировавшийся за годы эволюции неокортекс – присущую только высшим млекопитающим часть мозга, отвечающую за обучение.

Поэтому одно из направлений развития ИИ, которым сейчас активно занимается сообщество, – продвижение подхода One-shot Learning – вида обучения, при котором алгоритм способен делать обобщения, анализируя очень небольшое количество обучающих кейсов (в идеале один). В перспективе машины при принятии решения должны будут моделировать возможные ситуации, а не просто повторять решение на основе опыта. Способность обобщать – неотъемлемая черта любого интеллекта.

Чтобы проиллюстрировать сказанное, найдите в двух наборах ниже объекты, аналогичные выделенным. В отличие от компьютерной программы, человек, как правило, довольно легко справляется с этой задачей.

Еще одна близкая тема – это использование так называемого Transfer Learning – модели обучения, при которой предварительно обучается некая универсальная «грубая» модель, а затем для решения более специфических задач она дообучается уже на новых данных. Главное преимущество в том, что процесс обучения в этом случае выполняется в разы быстрее.

Чаще этот термин употребляется в контексте компьютерного зрения, но на самом деле идея легко обобщается на любые задачи ИИ. В качестве примера – многочисленные предобученные сети для распознавания изображений от Google или Microsoft. Эти сети натренированы распознавать базовые элементы изображения, для решения же конкретных задач необходимо дообучить всего несколько выходных слоев такой сети.

Вместо заключения

В целом поездка оказалась весьма поучительной и дала немало пищи для размышлений. Всегда приятно оказаться в компании профессионалов, которые занимаются примерно тем же, что и ты. Резюмировать мои впечатления от конференции, наверное, можно так: несмотря на то, что до создания настоящего искусственного интеллекта человечеству еще далеко, тема сегодня развивается семимильными шагами и находит все новые точки приложения в совешенно разных и порой неожиданных областях. Технологии, которые пару лет назад считались экзотикой, постепенно становятся новым стандартом.

Следующая конференция данной серии планируется в апреле 2018 года.

Теги:

искусственный интеллект
O’Reilly
Strata Artificial Intelligence
CleverDATA

Добавить метки

Будущее, которое мы так долго ждали, о котором с интересом читали в научной литературе и которое представляли в сюжетах фантастических фильмов, уже наступило. Что же будет дальше? В этом материале мы публикуем мнение визионеров лаборатории Microsoft Research о текущем положении дел в сфере развития технологий искусственного интеллекта (ИИ) и о его трендах на ближайшие несколько лет.

Ждем появления социально-культурного искусственного интеллекта

В следующем году и ближайшие несколько лет очередной стимул развития получат технологии лингвистической обработки. Так, в частности, функционал инструментов распознавания речи будет пополняться все новыми языками. Появится больше систем, позволяющих понимать, обрабатывать и генерировать языки. Эти решения откроют пользователю новые возможности легко переключаться с одного языка на другой, более того, возможны даже будут мультиязычные беседы.

В перспективе ближайших нескольких лет появятся системы искусственного интеллекта, которые смогут без труда общаться с людьми и даже будут адаптироваться к различным социальным ситуациям, будь то переговоры, жаркие дискуссии или философские рассуждения. Поэтому в следующие 10 лет нам стоит ожидать появления такого явления, как социально-культурный искусственный интеллект.

Этика машинного интеллекта

Мы научились создавать машины, которые способны взаимодействовать с человеком, понимать его потребности и помогать в решении повседневных задач. Алгоритмы глубинного машинного обучения сегодня способны генерировать результат, который нужен человеку, обнажая зачастую то, что в приличном обществе принято осуждать. Другими словами, мы научили искусственный интеллект пониманию и удовлетворению ежедневных потребностей человека, но пока не научили хорошим манерам и этике . Значит ли это, что дисциплины морали и нравственности не являются приоритетом современного человека, его ежедневной необходимостью? Совсем нет.

Поэтому задача следующих ближайших лет – разработать правила для ИИ и алгоритмы машинного обучения, исключающие воспроизводство результатов, содержащих дискриминационные и пренебрегающие этическими нормами данные. Прорывом в этом направлении станет появление алгоритмов, которые являются справедливыми, ответственными и более устойчивыми к манипуляциям с вводом ложных данных.

Фото- и видеоконтент научатся искать информацию

В следующем году продолжится совершенствование алгоритмов машинного интеллекта в области поиска. Уже через несколько лет нам стоит ожидать трансформации логики работы всего направления. Будет появляться все больше систем, способных работать под командным голосовым управлением и распознавать речевые запросы, а также запросы, состоящие из картинок , звука, видео, геолокационных и других метаданных. Это приведет к тому, что поисковые запросы пользователей будут все более ситуативными, в рамках существующего контекста (местоположение, доступность информации, визуальное или звуковое окружение и т. п.). Эта тенденция будет ускоряться.

Мир на пороге появления новых профессий

Оператор машинного интеллекта уже существующая реальность. В ближайшие несколько лет таких необычных профессий станет больше . По данным исследовательского центра Microsoft, к 2027 году треть работоспособного населения будет занято в сфере услуг, которые будут оказывать системы на базе искусственного интеллекта (например, налоговое консультирование, поддержка здравоохранения и т. п.). Это говорит о том, что в искусственном интеллекте – источник повышения рабочей силы.

Интернет вещей

В 2017 году мы увидим первые решения на базе интернета вещей для сельского хозяйства. Такие решения будут строиться на объединении функциональности компьютерного зрения и облачных технологий. Это позволит фермерам диагностировать, контролировать, анализировать, планировать состояние своих хозяйств на всех этапах производства. Фермеры с помощью искусственного интеллекта смогут поддерживать рентабельность своих производств независимо от изменения климата, засухи и стихийных бедствий.

Будущее пищевой промышленности зависит от нашей способности сохранить и улучшить использование основных ресурсов нашей планеты, уменьшить истощение почвы путем перехода от традиционной сельскохозяйственной практики к альтернативной с малыми энергозатратами. Для окружающей среды и экологии упор будет сделан на сохранение наших лесов с помощью измерительных технологий.

Компьютерное зрение

В следующем году будет продолжен быстрый прогресс в области компьютерного зрения на основе алгоритмов глубинного машинного обучения. Мы уже можем наблюдать, как запущенный недавно проект Iceberg позволяет по-новому взглянуть на хоккейные матчи. Алгоритмы компьютерного зрения предоставляют возможность обрабатывать объекты на видеокадрах в реальном времени для анализа и принятия решений – в данном случае со стороны тренера играющей команды. А родоначальник «уберизации», компания Uber, использует когнитивные сервисы для верификации водителя в автомобиле, сравнивая фотографию, сделанную на телефон, с информацией из зарегистрированного профиля. Достоверность водителя повышает безопасность поездок, лояльность пользователей и в конечном итоге напрямую влияет на растущий бизнес компании.

К 2027 году способность компьютеров «видеть» будет повсеместной, так как мы будем иметь высокоразвитые устройства обработки изображений, мощные вычислительные ресурсы и комбинированные методы обучения машинного интеллекта. Достижения этих методов приведут к расширению отраслей применения этой технологии: от производства и здравоохранения до финансов и безопасности.

Цифровая трансформация традиционных отраслей

Эффективность традиционного бизнеса регулируется за счет роста продаж или сокращения издержек производства. Искусственный интеллект позволяет по-новому взглянуть на традиционные бизнес-задачи, видоизменить бизнес-модели и обнаружить ранее скрытый экономический потенциал целых отраслей. Мы это видели и раньше на примере так называемой «уберизации».

Сбор, обработка и анализ больших данных с помощью алгоритмов машинного обучения позволяет компаниям экономить миллионы долларов ежегодно, демонстрируя себе и рынку потенциал решений на базе искусственного интеллекта для разных отраслей в ближайшем будущем. Речь идет о внедрении систем, позволяющих компаниям принимать взвешенные, долгосрочные бизнес-решения и своевременно реагировать на ситуацию в отрасли в зависимости от экономического, физического и географического контекста.

Алгоритмы искусственного интеллекта доступны многие десятилетия, но именно сейчас вычислительные облачные мощности и бизнес-ценность позволили им стать в центр ежедневных переговоров.

Самоуправляемые автомобили, решения для борьбы с раковыми опухолями, прогнозирование поведения рынков и многое другое – все это открывает новые возможности для бизнеса каждый день. Еще никогда такие сложные технологии не были доступны каждому, а значит, у нас есть все шансы застать золотой век четвертой индустриальной революции – век искусственного интеллекта.

Искусственным интеллектом принято называть раздел информатики, который занимается изучением возможностей обеспечения разумных действий и рассуждений при помощи вычислительных систем и других искусственных устройств. В большинстве случаев, при этом, заранее известен алгоритм решения задач.

Необходимо отметить, что в научных кругах не существует точного определения данной науки, потому как решения вопроса о статусе и природе человеческого мозга также не существует. Точно также отсутствует и точный критерий достижения вычислительными машинами «разумности», несмотря на то, что на первых этапах развития искусственного интеллекта использовались определенные гипотезы, в частности, тест Тьюринга (цель – определить, умеет ли машина мыслить).

Данная наука имеет тесные взаимосвязи с психологией, трансгуманизмом, нейрофизиологией. Подобно всем компьютерным наукам, она пользуется математическим аппаратом. Искусственный интеллект является довольно молодой областью исследований, начало которой было положено в 1956 году. В данный момент времени развитие этой науки находится в состоянии так называемого спада, когда достигнутые ране результаты применяются в различных областях науки, промышленности, в бизнесе и повседневной жизни.

В настоящее время существует четыре основных подхода к изучению построения систем искусственного интеллекта: логистический, структурный, эволюционный и имитационный. Логистический подход в своей основе содержит так называемую Булеву алгебру, хорошо знакомую программистам. Большинство систем искусственного интеллекта, построенных по логистическому принципу, представляют собой определенную машину доказательства теорем: исходная информация содержится в виде аксиом, а логические выводы формулируются по правилам отношений между этими аксиомами. В каждой такой машине есть блок генерирования цели, причем система вывода доказывает эту цель как теорему. Эта система больше известна под названием экспертной системы.

Структурный подход в качестве основы системы искусственного интеллекта использует моделирование структуры мозга человека. Среди первых подобных попыток необходимо отметить перцептрон Розенблатта. Основная структурная моделируемая единица – нейрон. Со временем возникли новые модели, которые в настоящее время известны, как нейронные сети.

В случае использования эволюционного подхода при построении систем искусственного интеллекта, основная часть внимания уделяется, как правило, построению начальной модели, а также тем правилам, по которым эта модель может эволюционировать. Классическим примером эволюционного алгоритма является генетический алгоритм.

Имитационный подход в основном используется в кибернетике. Одно из базовых понятий данного подхода – это объект, поведение которого имитируется, то есть, так называемый «черный ящик». Таким образом, моделируется способность человека копировать действия других, не вдаваясь в подробности, зачем это нужно (что экономит массу времени, особенно в самом начале жизни человека).

В современном мире развитие искусственного интеллекта происходит весьма бурно. Многие ученые делают самые разнообразные и невероятные прогнозы относительно того, как будет развиваться эта наука в ближайшем будущем, однако большинство из них уверены в том, что все новые открытия будут основаны на существующих на данный момент разработках. Среди основных технологий, которые будут определять жизнь человека в будущем, необходимо, в частности, отметить:
— нанотехнологии (качественный переход на новый уровень технологий);
— дальнейшее развитие искусственного интеллекта (которое в скором будущем вполне возможно сможет опередить своих создателей по умственным возможностям);
— развитие глобальных, в первую очередь, сетевых коммуникаций (в частности, так называемая «коммуникационная кожа», то есть глобальная информационная сеть, которую планируют создать к 2025 году, и которая будет обладать способностями чувствовать все, что угодно);
— роботизация (роботы будут заниматься выполнением сложных задач, в том числе строительством домов);
— генная инженерия (человеческая цивилизация начнет массово покорять вселенную, массово летать в космос).

Какими бы ни были прогнозы на будущее, уже сейчас существуют некоторые проекты, на которые необходимо обратить внимание. Речь, в частности, идет о проекте по созданию искусственного мозга под названием «Голубой мозг». Разработкой проекта занимаются ученые-исследователи, представители Федеральной политехнической школы (Лозанна). Они сумели создать модель-схему расположения синапсов в головном мозге крыс. Как заявил директор проекта Генри Макрам, результаты оказались выше всяческих ожиданий. Вполне возможно, что исследователи в скором времени смогут ответить на многие вопросы, которые до настоящего времени беспокоили умы ученых: придет ли на смену человеческому разуму искусственный и будет ли он более высокоразвитым? Является ли человек замыкающим звеном в цепочке эволюции планеты?

Для тех, кто не слышал о данном проекте, вкратце напомним: проект «Голубой мозг» является широкомасштабной и весьма смелой исследовательской программой, которая стартовала еще в 2005 году. Основная цель проекта заключалась в создании модели структуры и функционирования мозговой активности различных животных с целью дальнейшего моделирования человеческого неокортекса. Перед исследователями стояло непростое задание: разработать новые подходы в процессе исследований патологий головного мозга. Новаторство исследования заключалось в том, что ученые попытались интегрировать все научные достижения в области нейробиологии, дополнить их своими эмпирическими данными, и на основе всех этих данных смоделировать мозговую активность при помощи Blue Gene – сверхмощного компьютера.

Миллионы нервных клеток, которые заключены в человеческом мозге, для передачи импульсов соединяются между собой. Таким образом, перерабатывается информация, поступающая в мозг. Такая связь между нейронами называется синаптической. Однако ученые не могли определить, как на практике материальные предметы преобразуются в мысли. До недавнего времени существовала теория о существовании химических связей между нервными клетками, однако результаты проекта «Голубой мозг» свидетельствуют о том, что связи между нейронами, в большинстве своем, создаются случайно. По мнению одного из исследователей, нейроны существуют независимо друг от друга и вступают во взаимодействие лишь после столкновения. Более того, большинство синаптических связей, смоделированных виртуально, предсказывают расположение таких же связей, но в живом мозге. Таким образом, можно говорить о том, что виртуальная модель очень близка к реальности.

Несмотря на столь значимые результаты, нашлось немало ученых, которые подвергли критике проект. По их мнению, полученные результаты могут свидетельствовать только о структуре синапсов, но не об их функциональности. Дело в том, что в виртуальной модели содержится ограниченное количество нервных клеток, что не может отразить всю многогранность нейронов в человеческом мозге. Таким образом, все полученные результаты могут помочь проанализировать деятельность головного мозга на локальном уровне, но не в масштабах всей его работы.

В 2013 году в Лозанне планируется к запуску еще один аналогичный проект — Human Brain Project. В его рамках к 2023 году ученые из 13 стран собираются создать самый крупный в мире компьютерный мозг, в котором будет работать столько же нейронов, сколько и в человеческом мозге – сто миллиардов. На первый взгляд может показаться, что подобную задачу решить невозможно, однако исследователи преследуют благие цели – изучение болезней головного мозга с целью дальнейшей разработки необходимых лекарственных препаратов. По мнению директора проекта профессора Маркрама, создание компьютерной модели мозга просто необходимо, ведь благодаря этому можно унифицировать ход исследований и проводить эксперименты, совершенствуя и исправляя ее.

Еще одним проектом, который стартовал в 2010 году, является проект компании DARPA совместно с SRI International. Суть его заключается в разработках прорывного искусственного интеллекта, который будет способен обрабатывать и передавать данные, копируя механизмы работы человеческого мозга. Электронная адаптивная нейроморфная масштабируемая система SyNAPSE, по замыслу разработчиков, должна превзойти традиционные алгоритмы обработки данных и будет способна автономно заниматься изучением сложной среды.

На данный момент военные пользуются искусственным интеллектом для обработки большого количества информации, в частности, данных разведки и видео. Вся эта информация должна быть быстро расшифрована и проанализирована. Для новой системы это не составит большого труда. Она будет использовать математическую логику, будет заниматься решением простых теорем на основе данных сенсоров, принимать решения и выполнять необходимые действия.

Более того, Пентагон намерен использовать данную модель искусственного интеллекта в качестве виртуального личного помощника, который сможет реагировать на голосовую команду и выполнять функции секретаря. Напомним, ранее DARPA совместно с SRI International уже занимались разработками персонального помощника под названием CALO. Проект был завершен в 2009 году. Программа способна рассуждать, понимать инструкции, узнавать, объяснять свои действия, адекватно реагировать на неизвестную ситуацию и обсуждать проведение операции после ее завершения. Данная программа берет необходимые данные из контактов пользователя, его электронной почты, проектов и задач. Затем создается реляционная модель окружения пользователя, происходит обучение. В итоге Искусственный интеллект может вести переговоры и урегулировать конфликты от имени пользователя. К сожалению, данная программа работает только на персональном компьютере, не будучи интегрированной в робота.

В 2011 году в Японии был разработан первый прототип искусственного мозга. Искусственный интеллект может обрабатывать огромное количество информации, однако роботы еще не наделены способностью мыслить. Разработчики пока с этим не спешат…

По мнению исследователей, роботы ближайшего будущего во многом будут похожи на людей: они смогут ходить на двух ногах, смогут различать лица, поддерживать беседу, выполняют просьбы, однако по своей сути – это всего лишь машины, подобные человеку. Все их действия подчинены заранее подготовленному алгоритму, а потому – примитивны. И только в том случае, если удастся реализовать технологию бимолекулярного вычисления, машины смогут мыслить и получат способность к творчеству. По словам разработчиков, новый механизм обработки информации очень напоминает работу человеческого мозга. В голове человека находятся миллионы нейронов, которые вступают в постоянное взаимодействие друг с другом. Суть новой технологии заключается в том, что каждая молекула может иметь до трех сотен направлений взаимосвязей. Таким образом, благодаря новой технологии машины смогут решать те задачи, которые в данный момент недоступны для них. По словам исследователей, новые разработки предполагается применить в области диагностики и лечения онкологических болезней: программируемые молекулярные системы будут вводиться в раковые клетки и трансформировать их в здоровые.