Журнал Ого, номер 13
Дорогие ценители игры Го!
Александр Динерштейн и Российская Федерация Го представляют вам 13-й выпуск журнала Ого.
Тема номера: Компьютерное Го и предстоящий матч Ли Седоля с программой AlphaGo
Оглавление:
Как Цукерберг Гугл рекламировал
История компьютерного Го
Каспаров vs DeepBlue, как проходил этот матч и в чем его отличия от предстоящего матча Ли Седоля с AlphaGo?
Прогнозы экспертов – создатели компьютерных программ
Прогнозы экспертов – программисты и математики
Прогнозы экспертов – ведущие мастера Го России и Украины
Прогнозы экспертов – азиатские профессионалы Го
Матч и букмекеры
Компьютеры и настольные игры. Кто пока еще способен бороться с машиной и выигрывать?
Альтернативный подход к матчу
Где посмотреть предстоящий матч?
Как Цукерберг Гугл рекламировал
Первые программы, играющие в Го, были созданы в 70-х годах. С начала 80-х проводятся чемпионаты мира среди компьютерных программ. Долгое время компьютеры проигрывали людям на форе в 9 камней и более.
Инг Чангки, тайваньский миллионер, предлагал приз в миллион долларов тому, кто сможет написать программу, которая обыграет профессионального игрока Го. Приз так никому и не достался, а самого Инга давно уже нет в живых.
Программы становились все сильнее и сильнее, над их созданием работали десятки лучших программистов мира, многие из которых имели за плечами успешное создание шахматно-шашечных программ.
Наивысшим достижением компьютерной программы считалась победа над топ-профессионалом Го на 4 камнях форы. Ожидалось, что в этом году программа сможет побороться на 3 камнях, но неожиданно в спор вмешались гиганты: Фэйсбук и Гугл.
Гугл не просто вышел победителем в этой схватке. Он смог заставить главного конкурента рекламировать свою программу!
26-го января в 23:00 по московскому времени основатель Фейсбука Марк Цукерберг (на фото) опубликовал статью о том, что они работают над созданием программы, играющей в Го, и демонстрируют успехи в этом направлении: https://www.facebook.com/zuck/posts/10102619979696481
Спустя пару часов вышла статья Гугла, в которой рассказывалось о победе программы над чемпионом Европы Fan Hui (партии: http://www.go4go.net/go/node/55133 ) со счетом 5-0, а еще через день – печатный журнал Nature.
Что любопытно, дата написания статьи в журнале: 11 ноября 2015 года.
Рекламные гении компании Гугл несколько месяцев ждали громкого заявления от Цукерберга, чтобы утереть ему нос. В итоге пост Марка в Фэйсбуке набрал 6000 репостов, 84 тысячи лайков, 4000 комментариев, в которых … вместо слов восхищения писали о том, что он опоздал.
Ну а дальше последовала целая серия статей в крупных изданиях под громким названием: «Гугл одолел Фейсбук»
Хотя на самом деле вопрос еще остается открытым. Многие эксперты подозревают, что матч с Фаном мог быть договорным, и мы о нем никогда не узнали бы, если бы программа AlphaGo его проиграла.
Гугл не остановился на достигнутом и бросил вызов одному из сильнейших профессионалов мира – Ли Седолю (Ю.Корея). Матч из 5 партий пройдет в Сеуле 9, 10, 12, 13 и 15 марта. В случае победы Ли Седоль (на фото) получит 1 млн долларов США (+20 тысяч долларов за каждую выигранную партию), а в случае его поражения деньги пойдут на благотворительность в ЮНЕСКО
И здесь Гугл выбрал дату, не забывая про главного конкурента.
В середине марта в Японии должен пройти компьютерный чемпионат мира (UEC cup) – http://jsb.cs.uec.ac.jp/~igo/eng/. В нем впервые примет участие программа Фейсбука. Ожидается, что она сможет одолеть основных конкурентов (Zen, Crazy Stone и других) и завоевать первое место. Дальше, по условиям турнира, программу ждет приз – матч с легендой японского Го Кобаяси Койчи (на фото). Мастеру уже за 60, и он сейчас играет объективно слабее Ли Седоля. Ожидалось, что эта партия пройдет на форе в 3-4 камня.
Многие уверены, что Фэйсбук будет настаивать на игре без форы, но японцы на такое не пойдут. Зачем им терять лицо? Да и приз в миллион долларов на кону стоять не будет.
В итоге, чем бы не закончился матч бота от Гугла с Ли Седолем, – они уже вышли победителями в схватке, хотя программы Фэйсбука и Гугла никогда не встречались между собой, и мы не можем однозначно утверждать, какая из них на текущий момент играет сильнее.
История компьютерного Го
Расскажем о том, как протекали прошлые встречи человека с компьютером (на доске 19-19)
1989 год. Программа Goliath, созданная Марком Боном, 5-ым даном из Амстердама (на фото), регулярно выходила победителем в компьютерных турнирах, но в матче против любительского 6-го дана она не смогла победить даже на 17 камнях форы!
1991 год. Goliath стала играть сильнее. На 17 камнях форы человек был обыгран, но на 15 камнях программа уступила 0-3.
1993 год. HandTalk, созданная китайским программистом Chen Zhixing, проиграла 1-2 в матче на 15 камнях форы. В то время она входила в число сильнейших программ в мире
1994 год. Go Intellect, победительница нескольких компьютерных олимпиад, проиграла человеку 3 партии подряд на 15 камнях форы
1995 год. Усиленная версия HandTalk одолела человека на 13 и 15 камнях форы
1996 год. HandTalk попыталась сократить фору до 11, но безуспешно. Человек победил 3-0
1998 год. Martin Muller, 5d обыграл Many Faces of Go на 29 камнях форы. Запись партии: http://www.computer-go.info/h-c/sgf/mueller-mf-29.sgf
Примерно в это же время Андрей Хмыров, 6-дан из Москвы, загоняет эту программу аж на 36 (!) камней форы, используя ее неумение играть ко борьбу.
1999 год. Go4++ проигрывает человеку 0-3 на 9 камнях форы
2000 год. Японская программа Wulu тоже не смогла одолеть человека на 9
2001 год. Many Faces of Go обыгрывает корейского инсея на 15 камнях форы
2005 год. Many Faces of Go обыгрывает еще одного игрока приличной силы игры на 15 камнях
2008 год. MoGo- первая Го программа, использующая метод Монте-Карло ( http://bit.ly/1R8lJim ), проигрывает Каталину Тарану на 9 камнях форы, но уже через 5 месяцев берет реванш. 7 августа 2008 года можно считать днем первой победы компьютера над профессионалом на 9 камнях форы. Чуть позже Crazy Stone, созданная программистом из Франции, закрепляет этот успех и понижает фору до 8 камней. В этом же году программы делают попытки обыграть человека на 7 форы, но безрезультатно. Однако к концу года Crazy Stone покоряется этот рубеж.
2009 год. MoGo впервые побеждает профессионала на 6 камнях
2010 год. Еще несколько побед компьютера над человеком на 6 камнях форы
2011 год. Козо Хаяши, 6-дан про из Японии проигрывает японской программе Zen на 5 камнях. Другие программы играют с профессионалами на 6-7 с переменных успехом
2012 год. Zen обыгрывает 9-го дана на 4 камнях форы. Crazy Stone закрепляет успех, сыграв 1-1 с Каталином Тарану на 4 камнях форы. В этом же году Zen побеждает еще нескольких профи на 4 камнях
2013 год. Crazy Stone обыгрывает на 4 форы Исиду Йосио, легенду японского Го
2014 год. Даже сам Йода Норимото не может одолеть Crazy Stone на 4 камнях форы. Позднее программа выигрывает одну партию из 4 у Дикхута, чемпиона Германии и европейского 6-го дана. На этот раз совсем без форы. Эта победа стала сенсацией.
2015 год. Корейская программа DolBaram легко обыгрывает Чо Чикуна на 4 камнях форы. Чувствуется, что этот рубеж уже пройден и фору надо уменьшать и вдруг, неожиданно … действующий чемпион Европы Fan Hui проигрывает 0-5 AlphaGo. Совсем без форы!!!
Это сенсация! Где победы на 3 камнях? На 2 камнях? Программисты из Google смогли опередить время?
Другие программы все еще играют с профессионалами на 3-4 камнях форы!
В начале февраля 2016 года в Японии прошла партия между обладателем титула Дзюдан Идой Атсуши и японской программой Zen, одной из сильнейших в мире. Нихон Киин выступила спонсором поединка.
Играли на 4 камнях форы. Кифу: http://gokifu.com/share/2ine
Ида проиграл, но совсем чуть-чуть. По ощущениям, из-за слишком уж мирного фусеки. Редко кто так играет на большой форе.
Как будто из далекого прошлого партия … 4 камня, равные шансы.
Ли Седоль, наверное, ее сейчас разбирает и смеется во весь голос. Но надо же ему как-то к матчу с AlphaGo готовиться?
В начале марта командой программистов японского Zen было принято решение о разработке программного обеспечения, использующего (как и AlphaGo) нейронную сеть. Цель: одолеть AlphaGo в течении 6-12 месяцев. Спонсором проекта выступала одна из японских телекоммуникационных компаний.
Уже сейчас их программа играет в силу 7д КГС и входит в топ-100 на сервере. Но что будет дальше предсказать сложно.
Каспаров vs DeepBlue, как проходил этот матч и в чем его отличия от предстоящего матча Ли Седоля с AlphaGo?
Начнем с перевода статьи Гарри Каспарова, опубликованной на сайте newscientist.com в марте 2016 года
Мои два матча против шахматного суперкомпьютера Deep Blue в 1996 и 1997 годах были названы «последний шанс человеческого мозга» . Их сравнивали с первой высадкой человека на луну или даже с фильмом о терминаторе. Я выиграл первый матч и проиграл матч – реванш через год, после чего IBM закрыл свой проект.
Каждый раз, когда подобная проблема попадает в заголовки новостей, я вспоминаю те дни.
Последний шквал новостей связан с предстоящим матчем Google против Ли Седоля из Южной Кореи после того, как со счетом 5-0 был побежден лучший игрок Европы. Я не играю в эту древнюю китайскую игру и не квалифицирован , чтобы предсказать результат на следующей неделе, но я знаю , что результат будет очень сильно влиять на будущее игры Го
Компьютеры преуспели в сложных расчетах, планировании и стали быстро приспосабливаться к изменениям. Это дает им равные шансы против лучших мастеров, как и тогда, 20 лет назад в шахматах , так и в игре Го сегодня.
Ранние шахматные машины имели слепые пятна и годные для использования слабости, которые нам хотелось использовать, вместо того, чтобы играть в нормальные шахматы, как с человеком. Я не мог сдержать себя и не попытаться применить специальную антикомпьютерную стратегию против Deep Blue. Интеллектуальные виды спорта, такие как шахматы и Го, требуют интенсивной концентрации, и когда фокус нарушается в попытке обмануть компьютер, вы можете в конечном итоге обмануть самого себя, делая сомнительные ходы. Машины становятся всё сильнее и не прощают такие ошибки.
Но главное отличие человека от машины в том, что программы не теряют концентрацию. Компьютеры не делают больших ошибок, по крайней мере, играя в шахматы, в то время как человек им подвержен. Машина не страдает самодовольством, беспокойством и усталостью. Когда я проиграл решающую шестую игру Deep Blue в 1997 году, я был под огромным давлением и поэтому играл слабо. Это была худшая игра в моей карьере.
Несмотря на это, это был захватывающий матч, такой же, как предстоящий матч Ли Седоля с AlphaGo
Ли Седоль в настоящий момент может быть намного сильнее, чем AlphaGo, так что даже его человеческие слабости не скажутся на результатах матча. Го также имеет гораздо больше возможных ходов, чем шахматы, и эта игра менее динамична – это те факторы, которые работают против машинного успеха. Но я боюсь, что это всего лишь вопрос времени. Сегодня приличный ноутбук с бесплатной шахматной программой раздавит Deep Blue и любого гроссмейстера. Скачок от шахматных машин, являющихся предсказуемыми и слабыми, до машин гигантской силы игры занял всего лишь десяток лет.
Продолжая тему компьютерных шахмат …
Обычно компьютеры играли в турнирах со смешанным составом. Профи стали играть матчи только тогда, когда компьютеры набрали достаточную силу, т.е. где-то в конце 90-х. Победа Дип Блю над Каспаровым по сути была первой победой над профессиональным шахматистом в матче.
Если придерживаться чуть менее строгих критериев, то можно все же выделить некоторые матчи, состоявшиеся раньше:
1989 — Дип Сот победил в матче с международным мастером Дэвидом Леви (рейтинг на тот момент около 2300) со счетом 4:0.
1989 — Ничья 2:2- Дип Сот с гроссмейстером Робертом Бирном (ок. 2400)
1990 — Дип Сот играет вничью 1:1 с гроссмейстером Хельмутом Пфлегером.
1992 — Гроссмейстер Давид Бронштейн проигрывает товарищеский матч Дип Сот в быстрые шахматы. Но матч проводился в достаточно неформальной обстановке.
1993 — Дип Сот выигрывает у сборной Дании, состоявшей из гроссмейстеров и международных мастеров.
1993 — Победа Дип Сот над Юдит Полгар (№1 в женских шахматах) в быстрые шахматы. Счет матча 1,5:0,5
1994 — Каспаров проигрывает программе Чесс Гениус 1,5:0,5 в быстрые шахматы на Интел Гран При в Лондоне
Известно, что в команде Deep Blue работала целая группа сильных гроссмейстеров, которые отвечали за дебютную подготовку
Возможно, что и к матчу с Ли Седолем такая команда будет собрана, но по матчу с Fan Hui видно, что работа в этом направлении не велась в принципе. Aja Huang (на фото), сильнейший игрок в Го из команды Google играет в силу пятого любительского дана. Это уровень четырёх камней форы с Ли Седолем. А сам Демис Хассабис, главный разработчик AlphaGo играет на первый дан.
Во всех партиях с Fan Hui программа играла в точку 4-4. С точки зрения дебютных новинок программа не показала ничего нового. В этом отношении она играла очень примитивно, и этого уровня дебютной подготовки может не хватить в предстоящем матче
Дебюты, которые применял Fan, просто были забиты в ее базу. Ничего нестандартного он не использовал. Для меня остается большим вопросом – как будет действовать программа, если с первых же ходов свернуть с дебютных справочников. На пустой доске вариантов столько, что никаким методом Монте-Карло их не просчитать. В этом Го выгодно отличается от шахмат. В шахматах всё давно изучено на глубину 20-30 ходов, а в Го, при желании, уже первым ходом можно создать позицию, которая не встречалась в истории профессионального Го. Программе придется играть самостоятельно, а не вытаскивать варианты из готовой базы.
Единственное, что меня тревожит … Каспаров хорошо представлял, с кем имеет дело. У него были под рукой программы подобного уровня. А Ли Седоль никогда в жизни не играл в Го с компьютером. Непонятно, как он будет себя чувствовать, если сила игры программы окажется гораздо сильнее ожидаемой. Пока же сам Ли Седоль уверен в победе со счетом 5-0 или в худшем случае 4-1. О его уверенности в победе говорит и то, что Ли Седоль не попросил себе гонорара за поражение в матче. Каспаров в этом отношении оказался более предусмотрительным. Он готов был сыграть на условиях “победитель забирает все” в третьем матче с Deep Blue – уж очень хотелось отыграться (матч в итоге не состоялся), но в первых двух матчах даже проигравшая сторона получала приличный гонорар в сотни тысяч долларов.
Прогнозы экспертов – создатели компьютерных программ
Нами были заданы такие вопросы:
Александр Мельников, 1-дан, Москва
- Почему-то не рад, если честно. Наверное, хотелось, чтобы сохранялась интрига, что человека не удастся обойти. Или, может быть, потому что не мне удалось написать эту программу. В 1990 году я был третьим на олимпиаде в Лондоне со своей программой по Го, играющей на 15-ый кю.
- Судя по отзывам, больше не по чему, наверно не совсем честный. Раз эксперты видят, что не во всю силу играл человек.
- Думаю, будет равная игра, то есть счёт 3:2 , но неизвестно в чью пользу.
Виктор Иванов, 4-дан, Санкт-Петербург
- Вполне закономерное событие, учитывая открытия в области Го и нейронных сетей в прошлом году. Я даже удивлен, что для этого прорыва понадобилось так много времени. Событию, конечно, рад, ведь это открывает много возможностей как в AI, так и в прикладных областях.
2. С точки зрения условий матч был абсолютно честным. А слухи о том, что игры были подставные, считаю лишь слухами, не вижу смысла и выгоды от такого рода вещей и для Google, и для Фана.
3. Однозначно Lee Sedol. Когда я занимался своей программой, играющей в Го, было очень сложно повысить ее уровень даже на полкамня. Так что я не верю, что нейронная сеть сможет значительно повысить свою силу, играя лишь сама с собой, без каких-либо дополнительных вмешательств в алгоритмы со стороны разработчиков.
Владимир Кузнецов, профессор, доктор технических наук, Петрозаводск
- Как человек, который в свое время также занимался программированием Го, считаю прорыв от Гугла существенным достижением в направлении создания ИИ. И здесь дело дело не только в результате, но и в средствах, которые использовались при разработке и реализации программы. Не стоит ревностно относиться к “непрограммируемости” Го. Рано или поздно компьютер (программисты) решат любую задачу. Успешная Го программа означает значительное расширение средств моделирования и реализации алгоритмов в распоряжении человека.
- В настоящее время в Петрозаводске 180 сильнейших программистов из 9 стран готовятся к чемпионату Мира АСМ. Проходят 35-е сборы, среди участников много состоявшихся и будущих сотрудников Гугла, Яндекса, Майкрософта и других коренных компаний, многие играют в Го, и я не сомневаюсь в честности олимпиадных программистов.
- Кто бы не победил в предстоящем поединке – победит Человек. В наших сборах, не смотря на определенную напряженность в отношениях, как и обычно участвуют представители Украины, Польши, Грузии, Англии и др. стран. В своих интервью я часто говорю, что те люди, которые совместно решают творческие задачи, в решающий момент никогда не окажутся по разные стороны…
Прогнозы экспертов – программисты и математики
Владимир Медведев, создатель шахматной программы GreKo, играющей в силу 2600 ЭЛО (гроссмейстер среднего звена), 2-кю Российской Федерации Го, Москва
- Прорыв оцениваю как колоссальный. В то же время, предпосылки наметились уже давно – глубокое обучение делает серьёзные успехи года с 2012-го. Вспоминается синхронный перевод с разговорного английского на китайский, результаты по распознаванию кошек и собак на картинках (пресловутый уровень трёхлетнего ребёнка, вроде бы, взят с запасом), голосовой ввод в системах типа Google Now и Siri. Наконец-то удалось совместить многослойные нейросети с методом Монте-Карло (алгоритм поиска MCTS), который также на слуху последние лет 10. Программа MoGo начала показывать когти на доске 9×9 ещё в 2006-м…Событию я, безусловно, рад. С нетерпением ожидаю мартовского матча. Приятно также, что игра Го получила свои “15 минут славы” в СМИ – даже в таких далёких от интеллектуально-игровой и компьютерной тематики, как “Ведомости”.Как любитель Го, предвкушаю что-то вроде “эпохи новых фусеки” – когда программы в своём самообучении уйдут от первоначальных шаблонов, взятых из человеческих игр, и начнут творить “в полный рост”. Вот тут-то наше представление о принципах стратегии Го может целиком перевернуться – как это, например, недавно произошло в одной из разновидностей лимитного покера.Ну и, конечно, приятно будет иметь на компьютере или в телефоне “персонального Сая”. Хотя и нынешние программы для игрока уровня кю уже могут выполнять роль авторитетного эксперта, всё, что они могут сказать – “этот ход в данной позиции лучший, потому что обеспечивает наибольшую вероятность победы”. Я надеюсь, что нейросетевые технологии позволять генерировать новые знания и концепции для обучения, и давать комментарии, приближённые к человеческому пониманию игры.
- Да, матч был честным. В конспирологические теории не верю. Гуглу нет никакой необходимости рисковать своей репутацией ради сиюминутного успеха. Так или
иначе, понятно, что программы превзойдут человека в Го в ближайшее время.Что касается качества игры… Моя игровая квалификация не позволяет по имеющимся партиям оценивать силу противников, поэтому остаётся полагаться на оценки
профессионалов. Думаю, что слабая, по их аргументированному мнению, игра Фана обусловлена в первую очередь психологическими моментами. Впечатляет не только
результат против Фана, но и уровень относительно других программ – Zen, Crazy Stone… Одна из впечатливших меня деталей, упомянутая в статье, – сила игры
нейросети вообще без поиска Монте-Карло, чисто на оценке позиции. Эта сила сравнима с лучшими современными Го-движками – т.е. уровень любительского дана!Вся эта статистика вполне проверяема, и, не сомневаюсь, станет доступна для проверки вскоре после матча с Ли Седолем. Кстати, психология играет свою роль и в другом: выискивая слабости в игре машины (незнание дзёсеки, шаблонная игра в фусеки, непонимание сенте и т.п.) человечество в лице своих сильнейших в Го представителей пытается делать хорошую мину при плохой игре. Отрицается факт, что, по существу, Го – задача счётно-комбинаторная. Принципиальной разницы с шахматами, чекерсом, реверси здесь нет. Что будет стоить знание стратегических концепций, если твой соперник обладает на несколько десятков ходов большей глубиной расчёта? Да, алгоритмы приходится использовать несколько другие, прямолинейный поиск по дереву не работает. Так ведь и в шахматах от brute force давно отказались.Полагаю, с компьютерным Го в ближайшие годы произойдёт то же самое, что с другими играми. Сначала программы будут “покусывать” профессионалов, причём каждое поражение будет выглядеть как-то “по-дурацки”: то зевок тактики в выигранной позиции, то потеря концентрации в йосе… Люди будут продолжать надувать щёки и говорить о своём более глубоком понимании игры. А потом вдруг окажется, что компьютеры дают лучшим из них от 2 до 4 камней форы. - Борьба будет равная, всё решится в двух последних партиях, победит с минимальным перевесом компьютер. А вот кто из двоих окажется этим компьютером – вопрос остаётся открытым!Главное, чтобы победителя не постигла судьба машины Deep Blue, разобранной после победы над Каспаровым в 1997-м году на запчасти…
Сергей Николенко, математик, Санкт-Петербург
- Конечно! AlphaGo — это очередное яркое применение глубокого обучения,
той революции в машинном обучении, которая в последние десять лет уже
привела к огромным успехам в, например, обработке изображений и
распознавании речи. Мне кажется очень характерным и важным то, что
прорыв случился не в результате какой-то напряжённой работы по
оптимизации именно умения игры в го, а из-за достаточно общей
идеи (модификации обучения с подкреплением в сочетании с обычным
поиском по дереву), которую просто хорошо реализовали с учётом
современных достижений глубокого обучения. И хотя в команде DeepMind,
конечно, были специалисты по компьютерному го, сильных профессионалов
там не было. Для меня это означает, что прорыв был не
локально-бессмысленный, а концептуальный, и схожие идеи могут
в дальнейшем послужить не только делу обыгрывания корейских
профессионалов.Минус вижу только один: через несколько лет на турнирах по го придётся
устраивать такие же драконовские меры безопасности, как на шахматных
турнирах. В остальном же шахматы не умерли, и с го тоже ничего
страшного не случится.2. Не могу говорить с уверенностью, я не разбираюсь в тонкостях и не
следил за ними, но вроде бы был авторитетный арбитр, который должен
был за честностью проследить. В целом мне кажется, что это не очень
важно: если компьютер победит сегодня в не очень честном матче, завтра
он всё равно победит уже за явным преимуществом, прогресс здесь идёт
только в одну сторону.3. Сложно сказать. С одной стороны, Fan Hui очевидно гораздо ниже
уровнем, а счёт 5-0, как мне показалось из комментариев, не вполне
отражает содержание игры. С другой стороны, тот матч был полгода
назад, и кажется, что этот матч не стали бы широко анонсировать и
вообще проводить, если бы шансов у AlphaGo не было. Полагаю, что будет
борьба, а сам факт наличия борьбы — это уже огромная победа для
AlphaGo. Рискну предположить, что Ли Седоль, даже если он всё же
окажется выше классом, может поначалу недооценить AlphaGo и проиграть
одну из первых партий, психология здесь тоже важна.
Александр Крайнов, руководитель службы компьютерного зрения компании Яндекс, Москва
- И рад, и нет. Как человек, чья профессиональная деятельность посвящена нейронным сетям, я рад успехам коллег. С точки зрения алгоритмов, в том, что сделано в AlphaGo нет ничего нового. Но это прекрасная демонстрация последних достижений ученых. Технологии глубокого обучения искусственных нейронных сетей сейчас переживают бурный рост. И игра го является прекрасной демонстрацией того, насколько огромным потенциалом обладают эти технологии. Особенно интересно то, что тут в полной мере используется Reinforcement Learning — алгоритм учится сам, на своих ошибках. Нет того, кто подсказывает — компьютер играет партии сам с собой, и результаты позволяют ему учиться “чувствовать” позицию. Ведь в данном случае основа игры высокого уровня- это не столько перебор, сколько способность алгоритма интуитивно предположить лучшие варианты продолжения и способность оценить позицию после расчета варианта. И я очень рад тому, что в результате успехов AlphaGo поднялась волна интереса к го. А грустно от того, что возможность говорить что “компьютер не может обыграть человека в го” скоро пропадет. И болеть я буду за Седоля.
- Я уверен, что матч с Фаном был честный. Хотя я готов разделить мнение, что Фан недооценил соперника и, в результате этого, сыграл в далеко не лучшее свое го. Но у меня нет ни малейших сомнений, что и игра с Фаном, и будущая игра с Седолем являются абсолютно честными. Никто не заинтересован в репутационных рисках.
- Я полагаю, что программа начнет обыгрывать сильнейших людей в течении года. Но не уверен, что это случится в марте.Пока слишком мало известно: мы знаем, как AlphaGo играла в октябре (слабее Седоля). Но мы не знаем, как она играет сейчас. Одной точки слишком мало, чтобы спрогнозировать кривую обучения.
Дополнительные комментарии Александра Крайнова с форума РФГ:
В 2012 году в области машинного обучения в целом произошел качественный скачок. Количество данных для обучения, уровень алгоритмов и мощности для обучения вышли на такой уровень, что искусственные нейронные сети (разработанные как принцип довольно давно) стали давать фантастические результаты.
Принципиальное отличие обучения на нейронных сетях заключается в том, что им не надо давать на вход факторы (в случае Го, объяснять, например, какие формы являются хорошими). Им даже правила можно не объяснять.
Главное дать большое количество положительных (ходы выигрышной стороны) и отрицательных (ходы проигравшей стороны) примеров. И сеть научится сама.
Как только алгоритм выходит на высокий уровень игры, программа может играть сама с собой огромное количество партий, обучаясь на результате. Причем не обязательно партии доигрывать.
Можно делать так: берется любая позиция, сеть предсказывает несколько хороших ходов, ходы просчитываются (используя традиционные алгоритмы перебора по дереву решений) на сколько возможно, результат добавляется в обучающую выборку.
Тимур (Санкин), я бы не рекомендовал тебе ставить на Седоля, ориентируясь на игру программы с Фаном.
Мы, грубо говоря, наблюдая за игрой программы, наблюдаем за игрой талантливого 4-летнего ребенка. К моменту игры с Седолем в марте он может сильно прибавить.
Нейросетевые модели сейчас очень быстро обучаются при достаточном количестве данных. А в случае с го данных очень много. Плюс, как я сказал раньше, их можно генерировать.
На фото: Ли Седоль, 9-дан с дочкой
Александр Садовский, руководитель поисковых сервисов Яндекса, Москва
1. Я рад тому, что развиваются технологии, которые позволяют принимать решения высокого качества без участия человека. Они меняют мир, делая труд человека наиболее востребованным в новых областях, где еще не накоплен опыт и данные, с которыми может работать компьютер. Игра в Го — это еще один непростой вызов для глубоких нейронных сетей. Если они справятся с ним, мир не рухнет, как не рухнул, когда в шахматы был обыгран Каспаров. Но сами технологии станут чуть-чуть совершеннее и доверия к ним чуть больше.
2. Мой уровень игры в Го не позволяет судить о том, играл ли Фан в полную силу. Но я придерживаюсь презумпции невиновности. Тем более, смысла в нечестном матче не вижу — от победы или поражения АльфаГо судьба Гугла не сильно изменится, а от скандала с подкупом компания может потерять очень много.
3. Уверен, что через несколько лет программы смогут победить в Го человека. Весь вопрос в том, случится ли это в марте. Скорость обучения АльфаГо известна только его разработчикам, поэтому любой прогноз сейчас — это гадание.
Виктор Кочеганов, инженер по программному обеспечению компании Intel, Нижний Новгород
1.Корпорация Google сегодня считается одним из лидеров в области искусственного интеллекта (ИИ). Да и вообще является негласным лидером IT-индустрии. Google вливает миллионы долларов на революционные, порой кажущиеся безумными, проекты своего тайного научно-исследовательского подразделения. Поэтому приятно осознавать, что такой гигант как Google заинтересовался игрой Го и связал один из проектов именно с ней: AlphaGo. Прорыв очевиден: AlphaGo способна обыграть любую современную программу, даже дав ей фору в 4 камня. В результате такого стратегического поведения корпорации весьма закономерно, что этот прорыв осуществил именно Google.
Я рад этому событию, поскольку оно совершило сногсшибательную рекламу игре Го. Многим моим знакомым наконец захотелось, чтобы я им объяснил правила игры.
2. Не вижу причин думать иначе.
3. Основываясь на статье Google в Nature об алгоритме AlphaGo, я бы отдал предпочтение Lee Sedol.
Да, AlphaGo достигла небывалых успехов. Но судя по тому, что из 10 матчей с Fan Hui программа два раза проиграла, напрашивается вывод, что уровень игры у них достаточно близок.
Lee Sedol —- это другой уровень, новые ходы и качественно другая игра, с которыми AlphaGo пока не сталкивался.
Так или иначе, остается много неучтенного при оценке AlphaGo. Поэтому на вопрос: “Кто победит?”, ответ судьи матча Fan Hui и AlphaGo мне кажется самым приемлемым: “Я бы поставил деньги на победу человека… но не очень много денег.”
Прогнозы экспертов – ведущие мастера Го России и Украины
Олег Межов, 6-дан, Москва
- Робот играет хорошо, сильно и ровно. Впрочем, за 5 партий ничего и не сделал ни плохого, ни хорошего. Ровная игра ещё один шаг, но никак не прорыв. Zen играет тоже сильно и запросто одолеет 6 дана в быстрой партии.
- У меня сложилось впечатление, что играют блиц. Фан совершал ошибки, видимые невооруженным взглядом, но ничего такого, чего бы я сам не сделал в быстрой партии.
Что удивило, компьютер выжидал. А человек продолжал играть активно и ошибаться. Очень не похоже на китайского профи, который привык играть с людьми слабее себя на 2 камня почти на всех турнирах. Думаю, дело в настрое.
Не вижу причин сомневаться в честности матча, хотя конкретный игрок проявил себя не лучшим образом в компьютерных матчах. - Показанной силы игры достаточно для игры на 2 камнях форы. АльфаГо самопрогрессирует согласно заявлениям разработчиков. Однако на таком уровне прогресс очень медленный, мы все это знаем.
4-1 в пользу человека.
Иван Детков, 6-дан, США
1. Был потрясен последними новостями про AlphaGo. Я не был уверен, что доживу до того, что появится программа, способная обыграть меня, я уже не говорю о профи. Это было абсолютно неожиданно и это – реальный прорыв. Шахматные программы “сжульничали”, победив за счет мощности. Как в точности устроен AlphaGo я не знаю, надо почитать побольше, но в основу были заложены принципы самообучения, характерные для искусственного интеллекта. Это просто фантастика!
2. Не могу сказать, был ли матч честным. Он определенно был вялым. Сильный игрок должен был попытаться перестроиться, раскачать игру, но этого не произошло. Было ли это сделано специально, был ли договор на определенный стиль, мне сказать трудно. Для Фана такое поражение должно быть болезненным, и я сомневаюсь, что он просто поддавался.
3. Ли Седоль такую программу порвет, но вот что будет через несколько лет я сказать уже не берусь. Еще год назад я уверенно утверждал, что в ближайшие сто лет компьютер сильнейшего профессионала не обыграет. Смешное заявление, скромнее надо быть.
В.Соловьев, 6-дан, Казань
1. Думаю, никто не ожидал такого результата. Я тоже считал, что научить компьютер играть в го на таком уровне в обозримом будущем не удастся и не рассчитывал дожить до такого события. Так что я не просто рад, а счастлив. Вероятно, это одно из крупнейших научных достижений года. Фактически, сделан очень серьезный шаг на пути создания “настоящего” искусственного интеллекта. АльфаГо построена на нейронных сетях. Их придумали и начали изучать более полувека назад, но многие десятилетия в этой области наблюдался застой. И лишь в самые последние годы был предложен сразу целый комплекс новых идей по архитектуре нейронных сетей, алгоритмам их самообучения. Это направление получило специальное название Deep learning (глубокое обучение). В рамках этого подхода достигнуты прорывы и в других областях, в частности, в распознавании образов. Полагаю, что в ближайшее время Deep learning подарит нам сенсации и еще в ряде областей. Важно то, что нейронная сеть (как и ребенок) может научиться практически всему, было бы много обучающих данных.
2. Я не смотрел партии и не могу оценить, играл ли чемпион Европы в свою обычную силу. Мне кажется, что матч был честным. Он вполне мог играть немного слабее обычного (на 1 камень) в силу ряда чисто психологических причин: недооценка соперника (это уж наверняка), непривычный контроль времени (возможно, контроль 3 часа на партию окажется лучше для человека), отсутствие явных стимулов (денежных призов, титулов). Создателям программы нет смысла покупать одну победу и потом опозориться. Google серьезная компания.
3. Все еще невозможно поверить, что программа победит одного из сильнейших игроков мира (да еще хорошо мотивированного). Полагаю, что на этот раз Ли Седоль выиграет. Но в любом случае это не надолго. Если Google продолжит целенаправленно работать в этом направлении, то пообучав нейронную сеть еще с год, она не оставит шансов и чемпиону мира. Будет интересно лишь, сколько очков она у него будет выигрывать или сколько камней форы давать.
Андрей Кульков, 6-дан, Казань
- Конечно же это прорыв. Программы, которые были 10-15 лет назад, играли в силу уровня кю. Го, как и шахматы, постепенно решаются компьютером.
- Матч скорее всего был честным. Объективных причин нет, чтобы Фан поддавался (в этом никто на самом деле не заинтересован).
3. Объективно матч должен выиграть Ли Седоль, так как игра программы, как я понял, строится на большом массиве сыгранных партий. Однако партии в го не повторяются, и в оценке новых позиций она может запутаться.
Игорь Немлий, 6-дан, Казань
- “Прорыв” – потому что нам показали программу, когда она уже “созрела”, могли показывать по мере роста, только тогда бы не было сенсации. Но факт есть факт – сейчас АльфаГо играет сильно и её ходы похожи на ходы человека – может, её соперник “недостаточно сильно играл, не в свою силу”, но программа-то от этого хуже не стала. Как к этому относиться? – видимо, как к факту. Могут быть плохие последствия, например, строгости с использованием электронных устройств во время турниров, но это будет уже тогда, когда сильные программы станут доступны каждому телефону. А сейчас пока нельзя просто так прийти и сыграть с АльфаГо, хотя хотелось бы. Интересно, как она играет и реагирует на разные тактики. И вопрос: “Если несколько копий программы тренировать по одним и тем же базам, станут ли они играть одинаково?”,- тоже интересует, кстати.
- Фан делал ошибки, но это может быть и просто “человеческий фактор”, утверждать ничего нельзя. Всё равно АльфаГо хорошо играет, если это действительно играла она, а победа над одним конкретным человеком – это, скорее, демонстрация ради сенсации. Интереснее, как программа играет не против конкретного соперника, а вообще.
- Ли Седоль победит.
Никита Барыкин, 5-дан, Екатеринбург
1. Прорыв феноменальный. Прогресс ожидаемый, хоть и не настолько быстро. А к неизбежности можно относиться только спокойно.
2. Не верю в теории заговора. Это для нас, посвятивших игре годы, победа компьютера над еврочемпионом – эпохальная такая веха. А для Гугла – лишь небольшой шаг в рамках всего лишь одного из многих глобальных проектов. Заниматься подкупом в этом разрезе, во-первых, мелко, во-вторых – неприемлемые репутационные риски.
3. Думаю, счет в матче не будет сухим. Уровень игры, показанный против Фана, не достаточен для победы над Седолем, но до марта программа сможет подрасти еще на камень-полтора, и, возможно, победит в борьбе.
Артем Качановский, 1-дан про, Ровно
- Никак не оцениваю, мне все равно
- Думаю, что матч был честным.
- Ли Седоль победит.
Аркадий Богатский, 5-дан, Киев
- Как бывший математик и программист я потрясен этим событием. Как игрок в Го – конечно же не рад, я думал лет 10 у нас еще есть, но как человека такой прогресс компьютера в сфере ИИ меня вдохновляет.
- То, что Фан играл не в полную силу – это факт. Но, по-моему, если бы он поддавался, то счет был бы другим: 2-3 или 1-4. Скорее всего, причины такого проигрыша чисто психологические – он оказался не готов играть с соперником такого уровня.
- Я уверен, что весной Ли Седоль победит и, скорее всего, со счетом 5-0, но, увы, это только отсрочка.
Прогнозы экспертов – азиатские профессионалы Го
Начнем с мнения самого Ли Седоля. Интервью, посвященных матчу, было несколько. Самое первое – еще до того, как он просмотрел партии, проигранные Фаном. Что любопытно, Ли Седоль дал согласие на матч, даже не удосужившись их проанализировать.
Мы приведем его самые последние слова, из интервью от 5-го марта:
Ошибки, которые я допускал сегодня в партии с Ке Жие, не повлияют на результат будущего матча – уж очень большая у нас разница в силе.
Я посмотрел партии AlphaGo с Фаном и вижу, что могу дать им обоим 2 камня форы.
Ничего не помешает мне победить 5-0.
В следующий раз, когда Гугл захочет взять реванш, я попрошу у них гонорар в 3 миллиона долларов.
Через пару лет, если программа будет усиленно тренироваться, она и правда может приблизиться к моему уровню.
Сюжет с Ариранг ТВ, на англ. языке (5 марта 2016 года):
http://www.youtube.com/watch?v=FUoS4AIvKEA&sns=tw
Ким Менгван, 9-дан про (Корея-США, на фото):
АльфаГо разыгрывает Фусеки в “японском” стиле: мягче, медленнее, менее активно, чем современные корейские и китайские игроки.
АльфаГо похожа на игрока, который не профессионал, но имитирует игру профессионала, то есть делает некоторые ходы, которые профессионал мог бы сделать, но при немного другой ситуации.
АльфаГо не понимает цены сохранения сенте – подробно разобраны последствия излишне спокойного хода АльфаГо в первой партии, который позволил Фану вести до середины игры.
АльфаГо не может точно оценить, кто выигрывает в текущей позиции, и соответственно, не может выбрать, как играть – на усложнение или на упрощение игры.
АльфаГо не понимает, что надо оставлять адзи, и разыгрывает некоторые позиции раньше времени, позволяя противнику получить преимущество.
На продемонстрированном уровне игры АльфаГо не имеет никаких шансов против Ли Седоля.
Ким Чанво, 6-дан про, бывший чемпион мира среди любителей (Ю.Корея, на фото):
3 главные слабости AlphaGo:
1. Устаревшие схемы в фусеки
2. Неумение наказывать соперника за ошибки
3. Неумение играть ко борьбу
Ким Чанво не сомневается, что Ли Седоль выйдет победителем в матче со счетом 5-0.
Полное интервью Кима (на корейском)
Другие мнения (одной строкой):
“Пока мы не видим слабостей программы, потому что ее соперник играл слишком плохо” Ке Жие, 9-дан про (Китай)
“Ли Седолю предстоит тяжелый матч. AlphaGo уже умеет играть в силу профи” Ши Юэ, 9-дан про (Китай)
“AlphaGo играет в силу сильного любителя, но практически не допускает больших ошибок” Лю Хинг, 7-дан про (Китай)
“AlphaGo на уровне, показанном в матче против Фана, способна бороться с Ли Седолем на обратном коми. Об игре на равных речи пока не идет” Ли Же, 7-дан про
“Бот Гугла может выиграть 1-2 партии, но он не сможет обыграть Ли Седоля в матче” Янг Чехо, 9-дан про (Корея)
“Я посмотрел все партии матча с Фаном. Согласен с тем, что никогда еще программы не играли так сильно. Но все же это уровень 7-8 дана на Тайджеме, и Ли Седоль программу такого уровня может обыграть на 2-3 камнях форы. На равных шансов у компьютера нет.” Парк Сонгчоль, 7-дан про (Корея).
Любопытно мнение одного из корейских специалистов:
“Я уверен, что Ли Седоль проиграет все 5 партий матча. Даже одну единственную игру ему будет очень сложно выиграть. Ну а если Ли Седоль выиграет две, то я предлагаю считать это огромным достижением”
Ким Чинхо, профессор Seoul School of Integrated Sciences & Technologies
“I would bet that Lee Sedol will lose to Google bot, but I am not sure.” – Remi Coulom (Франция), из личной переписки.
Реми (на фото слева) – создатель одной из сильнейших в мире игровых программ по Го – Crazy Stone. А начинал он в начале 90-х с создания шахматной программы, играющей в силу гроссмейстера – Crazy Bishop. Известно, что Aja Huang, один из разработчиков AlphaGo был учеником Реми
Другой эксперт компьютерного Го, Като Хидеки (Япония), работающий над программой Zen, про которую мы уже писали, считает, что Ли Седоль победит со счетом 5-0. Привожу небольшой фрагмент из его письма:
I’ve already bet Lee Sedol 5-0 with my friends :). Majority is 4-1, though. The skill of top pro is far from our imagination.
Surely the team has significantly improved the level of its play but, still, the big problems which are very hard
to solve using MCTS (completely bottom-up) framework, such as detecting double ko and solving complex L&D or semeai of
strongly related multiple (more than two) groups. I strongly believe that top-down approach is necessary to solve these problems.
Матч и букмекеры
Существует возможность сделать ставку на исход матча: https://bitbet.us/bet/1249/alphago-will-defeat-lee-sedol-overall-in-march/
Принимаются только биткоины. На сегодняшний день общее число ставок составляет примерно 3 миллиона рублей, при этом количество денег , поставленных на Ли Седоля, примерно равно количеству денег, поставленных против него.
Эта статистика сильно контрастирует с опросами на специализированных Го ресурсах и Го группах в социальных сетях. В этих опросах 85-90% любителей Го считают, что Ли Седоль выйдет победителем в мачте. Очень многие верят в результат 5:0 в пользу Ли Седоля.
Пример подобного опроса (406 любителей Го ВКонтакте)
Компьютеры и настольные игры. Кто пока еще способен бороться с машиной и выигрывать?
Отелло (реверси)
Во время первого поединка человека с компьютером в 1980 году уверенно победил действующий чемпион мира по «Отелло» Хироси Иноуе: из шести партий он уступил программе Moor только одну (5:1). Через девять лет компьютеры взяли реванш в командном турнире в Лондоне. Пять программ обыграли пятерых профессиональных игроков (трое из них входили в мировой топ-4) со скромным счетом 12:8. Со временем в компьютеры была помещена информация обо всех возможных положениях фишек, и машины стали просчитывать игру примерно на 25 ходов вперед — по сути, появилась мощнейшая стратегия без слабых мест. Уже в 1997 году стало ясно, что даже сильнейшим игрокам бессмысленно тягаться с компьютерами: чемпион мира Такеси Мураками проиграл программе Logistello с разгромным счетом 0:6.
Чекерс (Английские шашки)
Систему для игры в чекерс разработали в канадском Альбертском университете. Машина весила около 540 килограмм и за минуту могла обработать 12 миллионов различных игровых вариантов. В 1992 году Chinook заслужила встречу с Тинсли (на фото справа), но матч остался за человеком: 4 поражения программы, 2 победы, 33 ничьих. Интересно, что один раз программа проиграла только из-за технических проблем — компьютер просто завис, и разработчикам пришлось сдаться.
Уже в 1994-м состоялся матч-реванш. В первых шести партиях были сплошные ничьи, а потом Тинсли снялся из-за проблем со здоровьем — победа автоматически досталась компьютеру. Через неделю у чемпиона нашли рак, менее, чем через год он умер. Компьютеры с тех пор набрали такую силу, что люди вряд ли будут с ними соревноваться. В 2007 году в Канаде объявили о создании идеальной системы, которая вообще не может проиграть. Даже если ее соперник проведет безупречный матч, ему достанется в лучшем случае ничья. Программа проанализировала все возможные варианты развития игры и знает идеальный ход в каждой ситуации.
Русские шашки
Ни в русские, ни в тем более в международные шашки (шашки 100) искусственный интеллект ведущих игроков пока победить не в состоянии.
Лучшие программы в шашки на сегодня имеют обширные дебютные базы (в стоклетки это мало помогает – там, как и в Го, игра идет больше на понимание), эндшпильные базы – 8-10 фигурные, но до полного просчёта ещё весьма далеко.
В матчах против мастеров из топ-20 компьютер пока терпит поражения, хотя имеет успехи в отдельных партиях.
Пока компьютеры “угробили” заочную игру. В интернете ничего серьёзного уже не проводится.
Сёги
Федерация сёги запретила играть несанкционированные матчи, чтобы не упускать прибыль. А так уже состоялось 4 Дэносэна, в котором федерация потихоньку повышает ставки. В последнем матче в 2015 команда профи обыграла команду программ 3-2. http://ex.nicovideo.jp/denou/final/ Пока удается поддерживать интерес (зарабатывать на событии), не привлекая топ профи, но никто уже не сомневается, что это лишь дело времени и денег.
Альтернативный подход к матчу
Многие, как я понимаю, собираются болеть за Ли Седоля в предстоящем матче с AlphaGo.
А что если подумать в другом ключе?
Что такое AlphaGo? Это программа, которая училась на наших партиях. Известно, что авторами был скачан архив КГС партий игроков от 6-го дана и выше в количестве 160 тысяч штук. Дальше программа просматривала их и училась на наших с вами ошибках.
Кстати, могли бы ради такого дела и архивы с других серверов достать. Из той же базы BiGo ( http://bigo.baduk.org/ ) при желании можно извлечь 2.5 млн партий игроков 5д+
Может быть стоит расценивать предстоящий матч как встречу Ли Седоля с коллективным разумом игроков КГСа? И если программа выиграет матч, то это будет и нашей победой?
Где посмотреть предстоящий матч?
Трансляция первой партии матча: на Ютубе канале РФГ http://www.youtube.com/c/GofederationRu и в русской комнате на сервере КГС http://www.gokgs.com/ с комментариями А.Динерштейна
Список альтернативных трансляций с комментариями:
https://www.youtube.com/watch?v=vFr3K2DORc8 Комментатор: Майкл Редмонд, 9-дан про (англ. язык)
http://www.youtube.com/watch?v=aKIRw4WkqGE Бадук ТВ (на корейском, комментатор неизвестен)
http://www.everyon.tv/view/?chNum=90 К-Бадук (на корейском, комментатор неизвестен)
http://www.tygem.com/ Пек Дэхён, 8-дан про, Ким Чанво, 6-дан про (на корейском)
http://www.pandanet.co.jp/event/dmcm/index_e.htm Мимура, 9-дан (на японском)
http://afreeca.com/goingceo Чо Ёнву, 1-дан про (на корейском)
Трансляция от одной очень симпатичной корейской девушки (играет в силу 6-го любительского дана – на фото): http://afreeca.com/yoonmandu
Расписание партий: 9, 10, 12, 13 и 15 марта, начало каждой игры в 07:00 по московскому времени.
*****************************************************************************************************************