情報処理 2014年8月号 [将棋]
ミニ特集「第3回将棋電脳戦を振り返って」と題して、習甦の竹内さんが書かれているということで購入してみた。
興味深い記述が1つあった。「6スレッドなのでそれぞれのスレッドが読んだところ、○○が4つ、○○が2つ返してきた」というようなことが書いてあった。Bonanzaなどは、ある候補手の確かさを確かめるためにその候補手より深いレベルでは並列処理すると思うが、一番上の部分で分けるというのはないはず。(表示の問題だけで内部的にはちがうかもしれないが)
習甦はRootでSplitするようなことをしているのかもしれない(知ったか)。
2008年頃に探索を模索していたYSS掲示板ではRootで分けることはあまり意味がなかったというような書き込みと関係あるかも。
それ以外は、ほとんど想定の範囲内だったが、Twitterでも流れていたヒストリーヒューリスティックによる影響でいい方向に読み手が進んでいたというような記述があった。自分が散々GPSFishと戯れていた時は、あんまり強くかけ過ぎると読み抜けが出て逆転されやすい気がしていたが、それは3秒対局の話。一手4分程度ではうまく働いたのだろう。
リベンジマッチもそうだが、時間が伸びると人間が読み抜けがなくなるという楽観視も多いが、コンピュータもある程度以上は選択探索しているので、時間が伸びれば読み抜けも減る。人間が読んでも無駄だと思っている時に読むので無駄だなと思われる読みがある反面、読み抜けは確実に減る。
そのため、時間を短くした練習対局で癖を見つけても、時間が変われば中盤の怪しい局面で指し手が変わり、(バグがなければ)素直にレーティングが上昇するのがコンピュータ。一方で、時間が伸びてもレーティングが伸びるとは限らないのが人間で、リベンジマッチは人間の体力的な限界が先に来てしまったと思う。
習甦の評価関数は重いので短時間ではあまり勝率が上がらないというようなことを度々耳にするが、一方で評価関数が重いなりの正確さはあるわけで、リベンジマッチに習甦を選んだというのは長時間に向いている習甦をわざわざ強くなるレギュレーションで戦ったので負けて当然であるような気もする。
コメント 0