Ознакомительная версия. Доступно 21 страниц из 105
Вследствие недоступности ключевых знаний и неэффективного моделирования прогресс у программистов, занимавшихся го, шел медленно. Давая характеристику нынешней ситуации с компьютерами, играющими в го, и ожидаемым перспективам, профессор философии Алан Левиновиц заключил в мае 2014 года в журнале Wired: «Может оказаться, что появление в течение десяти лет компьютера-чемпиона – слишком оптимистичный прогноз»[13]. Статья в Wall Street Journal, написанная в декабре 2015 года профессором психологии Крисом Чабрисом, ведущим в журнале колонку об играх, называлась «Почему го по-прежнему не дается компьютерам».
ПРЕОДОЛЕНИЕ ПАРАДОКСА ПОЛАНИ
В научной статье, опубликованной буквально в следующем номере Wall Street Journal (в январе 2016 года), рассказывалось о компьютере, который уже нельзя одурачить. Группа из лондонской компании DeepMind, принадлежащей Google и специализирующейся на машинном обучении (эту область искусственного интеллекта мы обсудим в главе 3), опубликовала статью «Освоение игры го с помощью нейронных сетей и поиска по дереву»[14], и престижный журнал Nature сделал ее темой номера. Статья описывала программу AlphaGo, которую создатели научили играть в го, обойдя парадокс Полани.
Они не пытались напичкать программу лучшими стратегиями и эвристическими правилами. Вместо этого они создали систему, самообучающуюся в ходе анализа игровых позиций во множестве партий. AlphaGo должна была замечать в большом количестве данных мельчайшие паттерны и связывать действия игроков, например постановку камня на конкретное место, с результатами, скажем с выигрышем[15].
Дав программе доступ к тридцати миллионам позиций, записанных в онлайновом хранилище, ей, по сути, сказали: «Используй их и выясни, как выигрывать». AlphaGo также сыграла множество партий против самой себя, сгенерировав еще 30 миллионов позиций, которые затем проанализировала. Во время игры система вела моделирование, однако весьма узкое: она использовала знания, полученные от изучения миллионов позиций, чтобы моделировать только те ходы, которые, по ее мнению, вели к победе с наибольшей вероятностью.
Работа над AlphaGo началась в 2014 году[16]. К октябрю 2015 года она была готова к тестированию. AlphaGo – какое-то время это держалось в тайне[17] – сыграла матч из пяти партий с Фань Хуэем, который тогда был чемпионом Европы, и выиграла со счетом 5:0.
Победа компьютера в го на таком высоком уровне, оказавшаяся для всех неожиданной, произвела впечатление на сообщество ученых и разработчиков в области искусственного интеллекта. Практически все аналитики и комментаторы назвали достижение AlphaGo настоящим прорывом. Однако начались споры о масштабе победы. Нейробиолог Гэри Маркус заметил: «В Европе го едва ли является спортом, и этот чемпион занимает в мировом рейтинге всего 633-е место. Победу робота над 633-м в рейтинге профессиональным теннисистом тоже назвали бы впечатляющим достижением, однако неверно было бы говорить, что он достиг мастерства в игре»[18].
Команда DeepMind, очевидно, сочла замечание справедливым, поскольку бросила вызов Ли Седолю, предложив сыграть матч из пяти партий в Сеуле в марте 2016 года. Многие считали Седоля лучшим игроком в го на планете[19] и одним из лучших, которых помнят современники. Его стиль характеризовали как «интуитивный, непредсказуемый, творческий, напряженный, неистовый, запутанный, глубокий, стремительный, спонтанный»[20]. Эти качества, по мнению самого Седоля, давали ему преимущество перед любым компьютером. Он говорил: «В игре го есть красота, и я не думаю, что машины ее понимают… Я считаю, что человеческая интуиция слишком совершенна, чтобы искусственный интеллект мог достичь чего-то подобного»[21]. Седоль предположил, что выиграет минимум четыре партии из пяти, заметив: «Что касается матча в октябре, мне кажется, что уровень AlphaGo не соответствует моему»[22].
Партии между Седолем и AlphaGo привлекли огромное внимание общественности в Корее и других странах Восточной Азии. AlphaGo выиграла первые три партии, обеспечив себе победу во всем матче. Седоль взял верх в четвертой встрече. Его победа дала кое-кому из наблюдателей надежду, что человеческий ум обнаружил недостатки цифрового противника, которые Седоль мог бы использовать в дальнейшем. Если это и было правдой, то все равно не помогло Седолю в следующей партии. AlphaGo снова выиграла, завершив матч со счетом 4:1 в свою пользу.
Седоль счел матч изматывающим и после поражения сказал: «Я ощущаю своего рода бессилие… У меня огромный опыт игры в го, но никогда не было случая, чтобы я чувствовал такой напор со стороны противника»[23].
Ознакомительная версия. Доступно 21 страниц из 105