やねうら王とかいろいろ [将棋]
やねうらお
・2008~2009年頃に頑張ってx86的な高速化していた
・トップチームがクラスタ化の流れになり、GPSは800台とかやってやる気を失った
・賞金付き大会として電王戦が出てきて急にやる気が出た模様
やねうら王のコンセプトの印象
・世界最速の指し手生成ルーチン搭載
指し手生成祭りとかを2008年頃にやっていた気がする
高速化の理由は元々ボナンザのビットボードをさらにアルゴリズムレベルで改善している点にある。
この課程で見つけた不具合はボナンザにも取り入れられている。
・必勝!やね裏定跡
これは謎。対コンピュータ用の定跡なんだろうか。
確かに中盤などでぶっぱしやすい局面に誘導しやすいようにするっていうのはあるかもしれない。
定跡というからには特定の局面をbookに大量に突っ込んでると予想
・究極進化!やね裏学習メソッド
これはボナンザだと学習時間が異常に長いので改良しづらいという点を補っている
ただ、ボナンザの評価関数のままだと、コンパイル時に最適化される高速化が聞いているので、弱くなる
あとNDFはとにかく棋譜を集めて差分学習みたいなことをやってた気がするので
ヘタするとNDFの劣化版みたいな感じもある
・超軽量!やね裏評価関数
というので、上記のデメリットを補っているのがこれになる
習甦も評価する部分がGPSほど増やしていないのに、それでも勝てているようなので、たくさん読むほうが中盤では特に重要っぽい。
評価関数を軽量にして精度が下がった分を定跡と逐次学習で補う感じだろうか
調べてみると結構どれも似たようなことやってるので、最終的に速度に行き着くというのが2009~の展開だったので、単一マシンでの最高速を目指したソフトウェアがどれぐらいレートが高いのかは気になるところ
あと一人じゃないのはなんでだろうか。
他のソフトについての印象
・Selene
主にチェスで出た成果をとにかく取り入れ自己対戦を繰り返し、有効なものはどんどん取り入れる方向で進化させるという意欲的なソフト。
でも高速化のためにデータ構造変えたりするとあまり意味が無いんじゃとか思ったり。
floodgateでも上位に来ているので強豪ではある。
・ponanza
神がかり的な強さはクラスタリングから来ていた面が強いので、本大会ではどうしても一段落ちると予想
・習甦
第2回電王戦でぶっぱしたソフト。
結構普段から連絡を取り合っているようなので、練習対局などで修正が入っているのだろうか
少ない評価項目の評価関数と3層パーセプトロン的な構造が面白い
パーセプトロン的な構造をいれることで、最初の特徴量から新しい特徴量を出力することができる
ぶっぱが修正できていれば普通にCPUにも人にも勝てる強豪だろう。
・Bonanza
前にTwitterでも書いたが、コンピュータ将棋のヒクソン・グレイシー。(ナレーションもあの人だし)
グレイシー柔術=機械学習 みたいな。 「寝技・マウントなんてだれでもできるだろう」というところもよく似ている。
それまで、機械学習は難しいとされていた風潮を一気に消し飛ばした。2005年当時のマシンパワーでは機械学習の成果を出すためにはかなりの実装テクニックを要したので、理論と実践の融合された素晴らしい結果だった。
本業が化学(合成とか?)の最適制御法らしく単に機械学習というだけでなく保木オリジナルともいうべきコツが入っているので、詳しく見れば見るほど謎の制御方法が入っている。
また、仮に予選で敗退しても「出場ソフトはみなボナンザメソッドで強くなった(キリッ)」と言える存在。
まさにグレイシー。
・大合身くじらちゃんα
元々のコンセプトは視聴者のマシンパワーを拝借してクラスタリングすることだったので、今回の大会では力が出ない(はず)
・ツツカナ
元々、単一マシンでプロに勝った唯一のソフトウェアなので、今回の大会では優勝候補かなと。
読む深さを機械学習でやっているというが、実現確率によって読む深さを変えているソフトは他にもあるようなので、もう一味何かが違う要素がある気がする。
・Calamityとか
元々大会には出ているソフトだが、一般参加な普通の人はマシンがしょぼいので成果が出ていなかった面もあった。
確かこの人の場合AMDのノートで参加していたと思う。今回ハードウェアが統一されるので、性能が一気に数倍あがるので、意外に強くなるかもしれない。
ツツカナとかポナンザとかは元々良いハードでどれぐらい強くなるかというのがわかっているが、元々大会でハードウェア的にデメリットがあって下位にいたソフトが強くなる可能性は大いにある
ただ、今回はどうやってもGPSのクラスタリングよりは強さが落ちるというのがわかっているので、若干もやもやする
↓はゆるい話と難しい話が混在しているが、トップチームが何を考えていたかがわかる本。
最近のコンピュータ将棋の主要な概念は全て網羅されている。
GPSとBonanzaの人は大学で研究をしているので論文書いてるため、古い論文は読むことができるが、他のソフトの人は社会人だったりするので大会のコンセプト文章ぐらいしかどういうソフトウェアか知る術がない。
習甦のパーセプトロンの概念図も入っている。
コメント 0