第2回 将棋電王トーナメント 決勝トーナメント最終日 決勝・準決勝 [将棋]
昨日はでかけていて、あまり見れなかったが大体順当な結果だった
今日は昨日の影響でダウンしていたので流し見だったが、最後のPonanza-Awakeで目が覚めた
いやー、中段玉で何を間違ったんだろうか。
学習しづらい局面はPonanzaぐらい学習をやってても何かあるんだろうか。
・AwakeはKPPならぬKPAを導入しているらしいが、KPAってなんだろう。効きだろうか。
・大会前にFloogdateに参加して安定度を検証。しかもマシンも電王戦モデル。
・FloodgateのPonanzaのログに2手目32金が定跡に入っていたので対策はしていた
とかなりの気合の入れよう。
昨年5位になれなかったAperyも初手は2五歩だけはやって振り飛車にならないようにしていたらしい。
横歩模様からの力戦の将棋が多かったのはそういう理由だろう。
Awakeは去年よりレーティングが500あがったという。
Ponanzaでも150ぐらいあがっていたらしい。
今回の大会はちゃんと見ていないが、ほぼBonanzaのクジラちゃんやほぼBonafishのnozimiがいたことから強さの度合いがわかりやすかった気はする。去年はBonanzaそのままがいたんだが。
Awake、Ponanza>Apery、やねうら王>Selene>Bonafish>Bonanza
「>」1つがR100~200ぐらいだろうか。
上げ方
・高速化
Bonanzaの評価関数がそのままだとしても、高速化する余地がまだあるらしい
37項目化とか
PonanzaはMagicBitboardが初期の基本思想だった。(今はどうかしらないが)
・評価関数
項目数の増加
・評価関数の学習時の相対評価
別の見方をすると次元を減らすことに繋がるので結果として高速化にもなる(やり方しだいだが)
今年レーティングが激しく上がった理由はNDFがこれによってすごい強かったからではなかろうか。
相対によって棋譜が少ない局面での安定性が上がったため、力戦でもぽかしにくくなったような気がする。
・定跡の選択
振り飛車の勝率は悪いのでAperyは初手は26歩らしい
いい勝ち方をした場合はそれを記録しておく(やねうら定跡)
・探索
Stockfishは最低限。ただ、自分の調査およびやねうらおのBlogからも、最新版は弱い。Seleneの人も一時期(2012年ごろ、Ver.3~4ぐらい?)は弱かったと言っていた。
今回のAwakeは2分ぐらいで56までいっていたらしい。5960Xを使っていたとはいえすごい数字。
電王戦のときは他のソフトが選択探索30ぐらいのときにツツカナが40ぐらいですげぇなと思っていたが、それをうわ待っている。やねうら王が40ぐらいらしく、深く読みが入ると斬り合いで負けたらしい
この選択探索にヒットするような調整というのが上位ソフトはどれもやっているように思うのだが、単に学習時にうまく調整できているのだろうか。
しかし、去年より強くできなかったという習甦がここに来て敗退とか、インフレがすさまじい。
去年の電王戦は対コンピュータなYSSだけが穴を点かれて負けたが、もう今年は誰も勝てない気がする。
<追記>
・KPAのAはAttackで効きだった。Aperyの人はEffectでKPEのほうがよいと主張していたが、やねうらおBlogではKPAのままだったので、そのままKPAが流行りそうな予感
・やねうらおBlogによるとSeleneの人が作った評価関数の高速化がされていないBonafishにSeleneは6割ぐらい勝てるらしいので、強さ比較は概ねあっていたといえるだろう。
・Aperyの人が居飛車しかやらないと対策されるので、振り飛車もがんばるようなことをTwitterで言っていた。期待したいが、やねうらお流で「やっぱ勝率のでやめました」とか言い出しそうな気はしている(笑)
・やねうらおBlogの情報ばっかりだが、5960Xは4771よりも2割遅いらしい。100万nps -> 80万npsだったようだ。コア数がその分多いので、電王戦トーナメントではより並列度でスケールするようなプログラムが有利であったと思われる。ますますStockfish全盛であったのかと思う。
・PonanzaのAkiさんのBlogがプライベートモードになった。はてなにBlog持ってる人は飽きてくるとプライベートモードにする印象。数少ないコンピュータ将棋の知見が部分的にでもわかるBlogだったのに残念である。
・Floodgateにいた謎のTestもAWAKEだった。
今日は昨日の影響でダウンしていたので流し見だったが、最後のPonanza-Awakeで目が覚めた
いやー、中段玉で何を間違ったんだろうか。
学習しづらい局面はPonanzaぐらい学習をやってても何かあるんだろうか。
・AwakeはKPPならぬKPAを導入しているらしいが、KPAってなんだろう。効きだろうか。
・大会前にFloogdateに参加して安定度を検証。しかもマシンも電王戦モデル。
・FloodgateのPonanzaのログに2手目32金が定跡に入っていたので対策はしていた
とかなりの気合の入れよう。
昨年5位になれなかったAperyも初手は2五歩だけはやって振り飛車にならないようにしていたらしい。
横歩模様からの力戦の将棋が多かったのはそういう理由だろう。
Awakeは去年よりレーティングが500あがったという。
Ponanzaでも150ぐらいあがっていたらしい。
今回の大会はちゃんと見ていないが、ほぼBonanzaのクジラちゃんやほぼBonafishのnozimiがいたことから強さの度合いがわかりやすかった気はする。去年はBonanzaそのままがいたんだが。
Awake、Ponanza>Apery、やねうら王>Selene>Bonafish>Bonanza
「>」1つがR100~200ぐらいだろうか。
上げ方
・高速化
Bonanzaの評価関数がそのままだとしても、高速化する余地がまだあるらしい
37項目化とか
PonanzaはMagicBitboardが初期の基本思想だった。(今はどうかしらないが)
・評価関数
項目数の増加
・評価関数の学習時の相対評価
別の見方をすると次元を減らすことに繋がるので結果として高速化にもなる(やり方しだいだが)
今年レーティングが激しく上がった理由はNDFがこれによってすごい強かったからではなかろうか。
相対によって棋譜が少ない局面での安定性が上がったため、力戦でもぽかしにくくなったような気がする。
・定跡の選択
振り飛車の勝率は悪いのでAperyは初手は26歩らしい
いい勝ち方をした場合はそれを記録しておく(やねうら定跡)
・探索
Stockfishは最低限。ただ、自分の調査およびやねうらおのBlogからも、最新版は弱い。Seleneの人も一時期(2012年ごろ、Ver.3~4ぐらい?)は弱かったと言っていた。
今回のAwakeは2分ぐらいで56までいっていたらしい。5960Xを使っていたとはいえすごい数字。
電王戦のときは他のソフトが選択探索30ぐらいのときにツツカナが40ぐらいですげぇなと思っていたが、それをうわ待っている。やねうら王が40ぐらいらしく、深く読みが入ると斬り合いで負けたらしい
この選択探索にヒットするような調整というのが上位ソフトはどれもやっているように思うのだが、単に学習時にうまく調整できているのだろうか。
しかし、去年より強くできなかったという習甦がここに来て敗退とか、インフレがすさまじい。
去年の電王戦は対コンピュータなYSSだけが穴を点かれて負けたが、もう今年は誰も勝てない気がする。
<追記>
・KPAのAはAttackで効きだった。Aperyの人はEffectでKPEのほうがよいと主張していたが、やねうらおBlogではKPAのままだったので、そのままKPAが流行りそうな予感
・やねうらおBlogによるとSeleneの人が作った評価関数の高速化がされていないBonafishにSeleneは6割ぐらい勝てるらしいので、強さ比較は概ねあっていたといえるだろう。
・Aperyの人が居飛車しかやらないと対策されるので、振り飛車もがんばるようなことをTwitterで言っていた。期待したいが、やねうらお流で「やっぱ勝率のでやめました」とか言い出しそうな気はしている(笑)
・やねうらおBlogの情報ばっかりだが、5960Xは4771よりも2割遅いらしい。100万nps -> 80万npsだったようだ。コア数がその分多いので、電王戦トーナメントではより並列度でスケールするようなプログラムが有利であったと思われる。ますますStockfish全盛であったのかと思う。
・PonanzaのAkiさんのBlogがプライベートモードになった。はてなにBlog持ってる人は飽きてくるとプライベートモードにする印象。数少ないコンピュータ将棋の知見が部分的にでもわかるBlogだったのに残念である。
・Floodgateにいた謎のTestもAWAKEだった。
コメント 0