16 марта 2016Наука
4602

«Игнорировали мозг как источник алгоритмических идей»

Зачем искусственному интеллекту Google, который победил мастера го, дрессировщик-нейробиолог. И пульсирующие собаки

текст: Борислав Козловский
Detailed_picture© Getty Images

В 1965 году режиссер Жан-Люк Годар взял и снял — хотя от него такого не ждали — научно-фантастический фильм «Альфавиль». Главного героя зовут Alpha60: пишется почти неотличимо от AlphaGo, названия искусственного интеллекта Google, который только что обыграл с разгромным счетом корейского мастера го Ли Седоля (всего партий было пять, Седоль победил компьютер только в одной, четвертой).

По совпадению, Alpha60 тоже искусственный интеллект, и у Годара это страшный тоталитарный диктатор. В городе, где он правит, запрещено все «очень человеческое»: эмоции, поэзия, нелогичные поступки. Антиутопии приучили нас, что мыслящие машины именно такими и должны быть: чем дальше от человека с его слабостями в сторону чистых логических конъюнкций и дизъюнкций — тем лучше.

AlphaGo отличается тем, что мыслит, наоборот, слишком по-людски.

Так было не всегда. Суперкомпьютер DeepBlue, выигравший в шахматы у Гарри Каспарова в 1997-м, действовал методом брутфорса, грубой вычислительной силы. Он по порядку перебирал все возможные ходы, бессмысленные наравне с осмысленными, а потом те, которые могут последовать за ними, и на каждый навешивал что-то вроде ценника. Трех минут времени хватало на механический перебор 100—200 миллиардов комбинаций, после чего суперкомпьютер, свершившись с наилучшим из ценников, двигал фигуру.

Суперкомпьютер DeepBlue, выигравший в шахматы у Гарри Каспарова в 1997-м, действовал методом грубого перебора. А AlphaGo пытается думать по-человечески.

Когда 10 мая 1997 года IBM объявила о «победе компьютера над человеком» (с перевесом в одну партию, счет был 2,5:3,5), никто и не думал утверждать, будто бы создал модель мышления гроссмейстера. Чтобы одолеть лучшего в мире боксера, достаточно одной автоматной очереди, но так вы не добьетесь ответа на вопрос, что делает боксера боксером. Просто еще в 1990-е стало понятно, что шахматы — неудачный выбор для сравнения искусственного интеллекта с человеческим, раз доска слишком маленькая и варианты поддаются перебору. Значит, надо взять поле размером побольше, и го — как раз то, что нужно: игру ведут на гобане, доске, расчерченной 19 линиями по вертикали и 19 по горизонтали, — всего на ней 361 позиция для черных и белых камней.

Брутфорс бессилен перед взрывным ростом числа комбинаций, а способность интеллекта угадывать паттерны и мыслить ассоциациями никуда не девается. У живого мозга нет чисто физиологической возможности пропустить сквозь себя 100—200 миллиардов ходов — и он пытается всеми правдами и неправдами сократить перебор, выхватывая из беспорядка паттерны и закономерности. Причем дело не только в цугцвангах, вилках и вскрытых шахах.

В 1944 году психологи Фриц Хайдер и Марианна Симмель записали полутораминутный беззвучный киноролик. Два треугольника, маленький черный круг и жирная ломаная линия совершают движения по белому пространству фона. Но если спросить зрителей, что происходит на экране, они начинают рассказывать примерно такую историю: большой треугольник заперся от маленького, маленький его начинает донимать, большой его атакует, круг мечется — и так далее. Не нужно большой фантазии, чтобы увидеть у фигур человеческие мотивы и поступки. Наоборот, трудно помешать мозгу их увидеть.

Если мы проецируем свои представления о человеческом поведении на кино про треугольники — то шахматная доска с 32 фигурами дает для этого безграничные возможности. Чемпион мира Эмануэль Ласкер в своем «Учебнике шахматной игры» прямо в комментариях к партиям начинает проговаривать куски таких внутренних проекций («Эта узкая улица ужасна, — думает король. — Но нет худа без добра, здесь никакой конь не пройдет»), а для менее стерильных и более жизнеподобных примеров, когда ради осмысления ситуации на доске мобилизуется весь личный опыт, есть рассказ «Победа» Василия Аксенова («Весь левый фланг пропах уборной и хлоркой, кислым запахом казармы, мокрыми тряпками на кухне, а также тянуло из раннего детства касторкой и поносом» и «Гроссмейстер спрятал ферзя в укромный угол за террасой, за полуразвалившейся каменной террасой с резными подгнившими столбиками, где осенью остро пахло прелыми кленовыми листьями. Здесь можно отсидеться в удобной позе, на корточках»).

Если мы проецируем свои представления о человеческом поведении на кино про треугольники — то шахматная доска с 32 фигурами дает для этого безграничные возможности.

На вопрос, почему проецирование своих личных историй на деревянные фигуры помогает выиграть, есть несколько ответов. Хайдер и Симмель считали свой ролик сильным аргументом в пользу гештальт-теории: с этой точки зрения сознание шахматиста просто жонглирует гештальтами, абстрактными заготовками идей, которые служат общим знаменателем и для рассуждений про справедливость-несправедливость в мире людей, и для анализа баланса сил в мире фигур.

Другое возможное объяснение: «истории о других людях» (в противовес «фактам о треугольниках») — базовая единица сознания, для их обработки наш мозг приспособлен лучше всего. Согласно популярной гипотезе антрополога Робина Данбара, эволюции пришлось раздуть мозг макаки до человеческих размеров, только чтобы тот мог справляться с бóльшим размером группы, выдерживать 150 социальных связей вместо 30 и конструировать более сложные «истории о других». Значит, лучший способ справиться с задачей другого сорта — обманным способом мобилизовать эту, самую развитую, способность мозга.

Поэтому неудивительно, что главным разработчиком AlphaGo стал человек, который пришел в компьютерные науки из нейробиологии, а в нейробиологию — из шахмат.

Демис Хассабис, вундеркинд из Лондона, стал гроссмейстером в 13-летнем возрасте. Окончил Кембридж c «двойным отличием» (Double First). Заработал первый миллион на компьютерных играх (например, руководил в 2003-м разработкой Republic: The Revolution. По сюжету игры в вымышленном государстве Новистрана, возникшем после распада СССР, власть захватывает жестокий диктатор, и нужно дать ему отпор).

Демис ХассабисДемис Хассабис© Souvid Datta/Backchannel

Начал изучать нейробиологию в Университетском колледже Лондона и получил докторскую степень в 2009-м: главными темами его исследований были связь страха с автобиографической памятью и связь амнезии со способностью фантазировать. Самая цитируемая работа Хассабиса (про нее писала New York Times, а журнал Science внес в десятку главных открытий года) прямо перекликается с сюжетом фильма «Вечное сияние чистого разума»: если там злой профессор стирает пациенту память, а пациент сопротивляется при помощи фантазии, то Хассабис наблюдал обратную связь. Амнезия, доказал он с коллегами в 2007 году, отбирает у человека не только прошлое, но и будущее. Воображаемый мир становится плоским, потому что фантазия активно использует автобиографическую память со всеми ее незначительными деталями в качестве строительного материала — как у аксеновского гроссмейстера, которому ощущение «полуразвалившейся каменной террасы с резными подгнившими столбиками, где осенью остро пахло прелыми кленовыми листьями» помогает подыскать на доске место для ферзя.

Программа для игры в го — разработка компании DeepMind, основанной Хассабисом в 2010-м с амбициозным намерением создать свой собственный искусственный интеллект (соучредителей было еще двое: лаборант-нейрофизиолог Шейн Легг и бывший лондонский полицейский Мустафа Сулейман, который когда-то бросил Оксфорд, чтобы организовать службу телефонной поддержки для студентов-мусульман).

Когда в 2012-м журнал Nature готовил спецвыпуск к столетию Алана Тьюринга, классика компьютерной науки, к Хассабису обратились за комментарием уже как к одному из главных в мире экспертов по искусственному интеллекту. «До сих пор исследователи искусственного интеллекта, ИИ, игнорировали мозг как источник алгоритмических идей. Хотя во времена Тьюринга у нас не было способа заглянуть в этот биологический черный ящик, сейчас у нас есть для этого целый набор инструментов, от функционального магнитного резонанса до оптогенетики», — написал Хассабис в своей программной колонке.

В 2013-м группа Хассабиса вывесила видеоролики, где их ИИ учится проходить восьмибитные аркады 1980-х и с каждым разом справляется все лучше. Научную статью с описанием, как это работает, опубликовал Nature. На первый взгляд, авторы не изобрели ничего радикально нового, потому что воспользовались самым известным классом алгоритмов, подражающих мозгу, — нейронными сетями.

Компьютерные нейросети как класс имитируют мозг на самом базовом уровне — уровне нервных клеток. То есть воспроизводят мышление человека в той же степени, что и мышление плоского червяка: у обоих нервная система состоит из связанных между собой нейронов. Более сложные когнитивные процессы, которые у человека есть, а у червя отсутствуют, — от языка до зрительных галлюцинаций — рассуждениями про отдельные нейроны уже не объяснить.

Создатель AlphaGo пришел в компьютерные науки из нейробиологии, а в нейробиологию — из шахмат: лондонский вундеркинд Демис Хассабис стал гроссмейстером в 13 лет.

Те эффекты, которые описывает Хассабис, — скорее, высшая нервная деятельность. Больше всего это похоже на условные рефлексы у Павлова и дрессировку дельфинов у Кэрин Прайор: свой способ тренировки нейронных сетей он вслед за биологами называет «обучением с подкреплением». Настоящая проблема в случае аркад была научить нейронные сети не столько правильно думать (это они и так к тому моменту умели), сколько правильно воспринимать. Как стоит знакомить компьютер с видеоигрой 1980-х, чтобы урок не прошел для него даром? Эта задача имеет мало общего с простой задачей «компьютерного зрения», когда видеокамера над шоссе превращает мутную фотографию номерного знака автомобиля в набор цифр и букв. Камера знает, что именно ей надо увидеть, — а искусственному интеллекту DeepMind предстояло разобраться во всем самому: понять, что среди групп пикселей на экране одни герои, а другие препятствия, что первым надо перепрыгивать вторых и что за это начисляют очки.

Спустя считанные месяцы после публикации Google приобрел компанию DeepMind за 650 миллионов долларов. Это была самая большая покупка, которую Google когда-либо делал в Европе. С тех пор ничего конкретного про свои исследования DeepMind, новое отделение Google, не сообщало, и AlphaGo — редкое исключение: перед турниром с Ли Седолем, в январе, научную статью с новыми объяснениями опубликовал Nature. В основе алгоритма — все те же глубокие сверточные нейронные сети, что и в случае аркад. Их активно используют для анализа изображений: прошлым летом невероятное число перепостов собрали промежуточные результаты работы таких сетей — психоделические панорамы, где на фоне спиралей радужного света через каждую деталь картинки пробиваются пагоды и собачьи глаза.

Слово «глубокий» применительно к компьютерным нейронным сетям означает «многослойный». Нейроны располагаются слоями, первый принимает какую-то информацию на вход, последний выдает ответ. Между ними — та самая «глубина», критически важные промежуточные слои, работа которых не поддается интерпретации. Именно тут зачем-то появляются пульсирующие глазами собаки и башни из удодов, когда поиск Google по картинкам решает рутинную задачу, к какому классу отнести фото счастливого семейства на фоне памятника Пушкину.

Что происходит на промежуточных нейронных уровнях у AlphaGo, никто специально не изучал (или изучали, но пока не пишут). Не исключено, что там и прячутся ближайшие аналоги запаха мокрых тряпок и касторки, резные подгнившие столбики и слишком тесная для коня улица. Эта возможность для человеческого интеллекта, наверное, даже обиднее, чем умозрительная перспектива, что кибердиктатор Alpha-сколько-нибудь во имя аристотелевой логики заставит нас маршировать по улицам строем. Одно дело — быть жертвой железной неодолимой силы, и совсем другое — если эта сила даже с ролью жертвы справится лучше нас.


Понравился материал? Помоги сайту!

Сегодня на сайте
Как оставаться социофобом там, где это не приветствуетсяМолодая Россия
Как оставаться социофобом там, где это не приветствуется 

«В новом обществе как таковых болезней нет, не считая расстройства настроения или так называемого мудодефицита. Страны Западного и Восточного конгломератов даже соревнуются за звание самой мудостабильной страны». Рассказ Анастасии Ериной

15 ноября 20211583
Всадники СвободыColta Specials
Всадники Свободы 

Фотограф Артем Пучков проехал от Брянска до Мурманска вместе с трейнсерферами — путешественниками на грузовых поездах

10 ноября 20215604