16 марта 2016Наука

«Игнорировали мозг как источник алгоритмических идей»

Зачем искусственному интеллекту Google, который победил мастера го, дрессировщик-нейробиолог. И пульсирующие собаки

В 1965 году режиссер Жан-Люк Годар взял и снял — хотя от него такого не ждали — научно-фантастический фильм «Альфавиль». Главного героя зовут Alpha60: пишется почти неотличимо от AlphaGo, названия искусственного интеллекта Google, который только что обыграл с разгромным счетом корейского мастера го Ли Седоля (всего партий было пять, Седоль победил компьютер только в одной, четвертой).

По совпадению, Alpha60 тоже искусственный интеллект, и у Годара это страшный тоталитарный диктатор. В городе, где он правит, запрещено все «очень человеческое»: эмоции, поэзия, нелогичные поступки. Антиутопии приучили нас, что мыслящие машины именно такими и должны быть: чем дальше от человека с его слабостями в сторону чистых логических конъюнкций и дизъюнкций — тем лучше.

AlphaGo отличается тем, что мыслит, наоборот, слишком по-людски.

Так было не всегда. Суперкомпьютер DeepBlue, выигравший в шахматы у Гарри Каспарова в 1997-м, действовал методом брутфорса, грубой вычислительной силы. Он по порядку перебирал все возможные ходы, бессмысленные наравне с осмысленными, а потом те, которые могут последовать за ними, и на каждый навешивал что-то вроде ценника. Трех минут времени хватало на механический перебор 100—200 миллиардов комбинаций, после чего суперкомпьютер, свершившись с наилучшим из ценников, двигал фигуру.

Суперкомпьютер DeepBlue, выигравший в шахматы у Гарри Каспарова в 1997-м, действовал методом грубого перебора. А AlphaGo пытается думать по-человечески.

Когда 10 мая 1997 года IBM объявила о «победе компьютера над человеком» (с перевесом в одну партию, счет был 2,5:3,5), никто и не думал утверждать, будто бы создал модель мышления гроссмейстера. Чтобы одолеть лучшего в мире боксера, достаточно одной автоматной очереди, но так вы не добьетесь ответа на вопрос, что делает боксера боксером. Просто еще в 1990-е стало понятно, что шахматы — неудачный выбор для сравнения искусственного интеллекта с человеческим, раз доска слишком маленькая и варианты поддаются перебору. Значит, надо взять поле размером побольше, и го — как раз то, что нужно: игру ведут на гобане, доске, расчерченной 19 линиями по вертикали и 19 по горизонтали, — всего на ней 361 позиция для черных и белых камней.

Брутфорс бессилен перед взрывным ростом числа комбинаций, а способность интеллекта угадывать паттерны и мыслить ассоциациями никуда не девается. У живого мозга нет чисто физиологической возможности пропустить сквозь себя 100—200 миллиардов ходов — и он пытается всеми правдами и неправдами сократить перебор, выхватывая из беспорядка паттерны и закономерности. Причем дело не только в цугцвангах, вилках и вскрытых шахах.

В 1944 году психологи Фриц Хайдер и Марианна Симмель записали полутораминутный беззвучный киноролик. Два треугольника, маленький черный круг и жирная ломаная линия совершают движения по белому пространству фона. Но если спросить зрителей, что происходит на экране, они начинают рассказывать примерно такую историю: большой треугольник заперся от маленького, маленький его начинает донимать, большой его атакует, круг мечется — и так далее. Не нужно большой фантазии, чтобы увидеть у фигур человеческие мотивы и поступки. Наоборот, трудно помешать мозгу их увидеть.

Если мы проецируем свои представления о человеческом поведении на кино про треугольники — то шахматная доска с 32 фигурами дает для этого безграничные возможности. Чемпион мира Эмануэль Ласкер в своем «Учебнике шахматной игры» прямо в комментариях к партиям начинает проговаривать куски таких внутренних проекций («Эта узкая улица ужасна, — думает король. — Но нет худа без добра, здесь никакой конь не пройдет»), а для менее стерильных и более жизнеподобных примеров, когда ради осмысления ситуации на доске мобилизуется весь личный опыт, есть рассказ «Победа» Василия Аксенова («Весь левый фланг пропах уборной и хлоркой, кислым запахом казармы, мокрыми тряпками на кухне, а также тянуло из раннего детства касторкой и поносом» и «Гроссмейстер спрятал ферзя в укромный угол за террасой, за полуразвалившейся каменной террасой с резными подгнившими столбиками, где осенью остро пахло прелыми кленовыми листьями. Здесь можно отсидеться в удобной позе, на корточках»).

Если мы проецируем свои представления о человеческом поведении на кино про треугольники — то шахматная доска с 32 фигурами дает для этого безграничные возможности.

На вопрос, почему проецирование своих личных историй на деревянные фигуры помогает выиграть, есть несколько ответов. Хайдер и Симмель считали свой ролик сильным аргументом в пользу гештальт-теории: с этой точки зрения сознание шахматиста просто жонглирует гештальтами, абстрактными заготовками идей, которые служат общим знаменателем и для рассуждений про справедливость-несправедливость в мире людей, и для анализа баланса сил в мире фигур.

Другое возможное объяснение: «истории о других людях» (в противовес «фактам о треугольниках») — базовая единица сознания, для их обработки наш мозг приспособлен лучше всего. Согласно популярной гипотезе антрополога Робина Данбара, эволюции пришлось раздуть мозг макаки до человеческих размеров, только чтобы тот мог справляться с бóльшим размером группы, выдерживать 150 социальных связей вместо 30 и конструировать более сложные «истории о других». Значит, лучший способ справиться с задачей другого сорта — обманным способом мобилизовать эту, самую развитую, способность мозга.

Поэтому неудивительно, что главным разработчиком AlphaGo стал человек, который пришел в компьютерные науки из нейробиологии, а в нейробиологию — из шахмат.

Демис Хассабис, вундеркинд из Лондона, стал гроссмейстером в 13-летнем возрасте. Окончил Кембридж c «двойным отличием» (Double First). Заработал первый миллион на компьютерных играх (например, руководил в 2003-м разработкой Republic: The Revolution. По сюжету игры в вымышленном государстве Новистрана, возникшем после распада СССР, власть захватывает жестокий диктатор, и нужно дать ему отпор).

Демис Хассабис© Souvid Datta/Backchannel

Начал изучать нейробиологию в Университетском колледже Лондона и получил докторскую степень в 2009-м: главными темами его исследований были связь страха с автобиографической памятью и связь амнезии со способностью фантазировать. Самая цитируемая работа Хассабиса (про нее писала New York Times, а журнал Science внес в десятку главных открытий года) прямо перекликается с сюжетом фильма «Вечное сияние чистого разума»: если там злой профессор стирает пациенту память, а пациент сопротивляется при помощи фантазии, то Хассабис наблюдал обратную связь. Амнезия, доказал он с коллегами в 2007 году, отбирает у человека не только прошлое, но и будущее. Воображаемый мир становится плоским, потому что фантазия активно использует автобиографическую память со всеми ее незначительными деталями в качестве строительного материала — как у аксеновского гроссмейстера, которому ощущение «полуразвалившейся каменной террасы с резными подгнившими столбиками, где осенью остро пахло прелыми кленовыми листьями» помогает подыскать на доске место для ферзя.

Программа для игры в го — разработка компании DeepMind, основанной Хассабисом в 2010-м с амбициозным намерением создать свой собственный искусственный интеллект (соучредителей было еще двое: лаборант-нейрофизиолог Шейн Легг и бывший лондонский полицейский Мустафа Сулейман, который когда-то бросил Оксфорд, чтобы организовать службу телефонной поддержки для студентов-мусульман).

Когда в 2012-м журнал Nature готовил спецвыпуск к столетию Алана Тьюринга, классика компьютерной науки, к Хассабису обратились за комментарием уже как к одному из главных в мире экспертов по искусственному интеллекту. «До сих пор исследователи искусственного интеллекта, ИИ, игнорировали мозг как источник алгоритмических идей. Хотя во времена Тьюринга у нас не было способа заглянуть в этот биологический черный ящик, сейчас у нас есть для этого целый набор инструментов, от функционального магнитного резонанса до оптогенетики», — написал Хассабис в своей программной колонке.

В 2013-м группа Хассабиса вывесила видеоролики, где их ИИ учится проходить восьмибитные аркады 1980-х и с каждым разом справляется все лучше. Научную статью с описанием, как это работает, опубликовал Nature. На первый взгляд, авторы не изобрели ничего радикально нового, потому что воспользовались самым известным классом алгоритмов, подражающих мозгу, — нейронными сетями.

Компьютерные нейросети как класс имитируют мозг на самом базовом уровне — уровне нервных клеток. То есть воспроизводят мышление человека в той же степени, что и мышление плоского червяка: у обоих нервная система состоит из связанных между собой нейронов. Более сложные когнитивные процессы, которые у человека есть, а у червя отсутствуют, — от языка до зрительных галлюцинаций — рассуждениями про отдельные нейроны уже не объяснить.

Создатель AlphaGo пришел в компьютерные науки из нейробиологии, а в нейробиологию — из шахмат: лондонский вундеркинд Демис Хассабис стал гроссмейстером в 13 лет.

Те эффекты, которые описывает Хассабис, — скорее, высшая нервная деятельность. Больше всего это похоже на условные рефлексы у Павлова и дрессировку дельфинов у Кэрин Прайор: свой способ тренировки нейронных сетей он вслед за биологами называет «обучением с подкреплением». Настоящая проблема в случае аркад была научить нейронные сети не столько правильно думать (это они и так к тому моменту умели), сколько правильно воспринимать. Как стоит знакомить компьютер с видеоигрой 1980-х, чтобы урок не прошел для него даром? Эта задача имеет мало общего с простой задачей «компьютерного зрения», когда видеокамера над шоссе превращает мутную фотографию номерного знака автомобиля в набор цифр и букв. Камера знает, что именно ей надо увидеть, — а искусственному интеллекту DeepMind предстояло разобраться во всем самому: понять, что среди групп пикселей на экране одни герои, а другие препятствия, что первым надо перепрыгивать вторых и что за это начисляют очки.

Спустя считанные месяцы после публикации Google приобрел компанию DeepMind за 650 миллионов долларов. Это была самая большая покупка, которую Google когда-либо делал в Европе. С тех пор ничего конкретного про свои исследования DeepMind, новое отделение Google, не сообщало, и AlphaGo — редкое исключение: перед турниром с Ли Седолем, в январе, научную статью с новыми объяснениями опубликовал Nature. В основе алгоритма — все те же глубокие сверточные нейронные сети, что и в случае аркад. Их активно используют для анализа изображений: прошлым летом невероятное число перепостов собрали промежуточные результаты работы таких сетей — психоделические панорамы, где на фоне спиралей радужного света через каждую деталь картинки пробиваются пагоды и собачьи глаза.

Слово «глубокий» применительно к компьютерным нейронным сетям означает «многослойный». Нейроны располагаются слоями, первый принимает какую-то информацию на вход, последний выдает ответ. Между ними — та самая «глубина», критически важные промежуточные слои, работа которых не поддается интерпретации. Именно тут зачем-то появляются пульсирующие глазами собаки и башни из удодов, когда поиск Google по картинкам решает рутинную задачу, к какому классу отнести фото счастливого семейства на фоне памятника Пушкину.

Что происходит на промежуточных нейронных уровнях у AlphaGo, никто специально не изучал (или изучали, но пока не пишут). Не исключено, что там и прячутся ближайшие аналоги запаха мокрых тряпок и касторки, резные подгнившие столбики и слишком тесная для коня улица. Эта возможность для человеческого интеллекта, наверное, даже обиднее, чем умозрительная перспектива, что кибердиктатор Alpha-сколько-нибудь во имя аристотелевой логики заставит нас маршировать по улицам строем. Одно дело — быть жертвой железной неодолимой силы, и совсем другое — если эта сила даже с ролью жертвы справится лучше нас.

Понравился материал? Помоги сайту!

Поделиться ссылкой / Share

twitter вконтакте