Qhapaqさんに計測の部分で協力させていただきましたのでずっとQhapaqさんのソフトを応援しながらの観戦でした。
Qhapaq di molto(QDM)の最終結果は5位でした 本当にお疲れ様でしたと申し上げたいです
定跡戦略のワクワクする構想をQhapaqさんから直接お聞きしながら検証していくのは本当に面白かったです
さて、大会後の世界でどのソフトを今後検討に使っていけばよいか検証する必要があります
そこでCore i9 7980XEを用いて18スレッド1秒探索(1手1500万局面程度)でレーティング測定を行いました
計算資源に限りがありますので網羅的なものではなくSOTA周りのみの検証とします
測定設定→Hash=4GB,Book,PonderOff,Resign3000,MaxMovestoDraw=320
最新のRRate(単一環境の自家計測のみでレーティングサイトと同じ統計処理を施したレーティング表)
現在の最強ソフト(SOTA)はKristallweizenです

【R4400付近に発生している3すくみの図解】

【測定結果】(画像の下のリンクは棋譜ファイルの圧縮ファイルへのリンクです)
Kristallweizen WCSC29 2位


※Kristallweizenはorqha1018に負け越しでレーティングを下げる結果となった




illqha4

orqha1018_dolphin1_vs_illqha4_dolphin1_18T1Sec.7z



Qhapaq di molto(QDM)=Qhapaq_WCSC29=Qh0426 WCSC29 5位

orqha1018_dolphin1_vs_Qh0426_dolphin1_18T1Sec.7z
elmo WCSC29 4位

※elmo2019(0506)はWCSC29後に作成されたバージョン 強さはelmo_WCSC29(0501)が勝るとみられる

大合神クジラちゃん(GodWhale_WCSC29) WCSC29 11位

探索部にdolphin1を用いて評価関数のみを評価 dolphin1を使用した方が高いレートを示した

狸王(tanuki-_WCSC29) WCSC29 3位
①狸王のみ定跡ON 探索部は付属の"0"を使用(1スレッド10秒で探索部パラメータ調整の方)

②狸王は評価関数のみ使用。探索はどちらもdolphin1 BookOff

水匠 WCSC29 7位


振電(水匠の作者が作った振り飛車評価関数。NNUEkaiXFの後継)

illqha1.1相手に奮わず、レーティングはNNUEkaiXFを下回る結果になりました
【評価関数の入手先】
Kristallweizen WCSC29 2位
改めて。
— たま@Kristallweizen(24参戦中) (@mm_Tamachan_mm) 2019年5月9日
第29回世界コンピュータ将棋選手権準優勝のKristallweizenの評価関数を公開しました。https://t.co/waUgqtzYg6
水匠 WCSC29 7位
WCSC29にて7位となった水匠の評価関数及び定跡ファイル等を公開いたします!https://t.co/09rtGcuF7r
— たややん@水匠+NNUEkai (@tayayan_ts) 2019年5月9日
なお、探索部として、めきっとさんのdolphin1.01を同梱させていただきました(本番ではYO4.83を使用いたしました。)。ソースコード等は、WCSC29フォルダに置きましたので、ご興味があればぜひ。
illqha4
https://t.co/JkTFyky36L
— めきっと@鵺日々成長中 (@_illqha) 2019年5月3日
illqhaシリーズ最後の評価関数『illqha4』を公開します。
WCSC29後にもっと良いものが公開されると思われるので、公開はやめようかとも思ったのですが、せっかく学習させたので一応・・・。
Qhapaq di molto(QDM)=Qhapaq_WCSC29 WCSC29 5位
QDMの評価関数を公開します。レートはorqhaに近い(プラスマイナス20ぐらい?)と思いますが、終盤の評価がより正確になるように学習しています https://t.co/Mz609T4sf1
— Ryoto_Sawada🌒Qhapaq (@Qhapaq_49) 2019年5月5日
狸王(tanuki-_WCSC29) WCSC29 3位
『狸王』(tanuki- 第29回世界コンピュータ将棋選手権バージョン)のバイナリ・評価関数ファイル・定跡データベースを公開しました。不具合等あればお知らせください。 #csalive #wcsc29https://t.co/xGrjc82quT
— nodchip@tanuki- (@nodchip) 2019年5月6日
elmo WCSC29 4位
elmoの評価関数を公開します。デフォルトのNNUEです。大会版の他に今朝作成した評価関数も同梱しています。強くなっている気がするのですが有意差は無いかもです。https://t.co/i0UdwIbZku
— 瀧澤 誠@elmo (@mktakizawa) 2019年5月6日
大合神クジラちゃん WCSC29 11位
http://garnet-alice.net/
振電
水匠を基に追加学習した、定跡なしでも飛車を振り、振り飛車をしっかり評価する振り飛車党評価関数「振電」を公開いたします!https://t.co/09rtGcuF7r
— たややん@水匠+NNUEkai (@tayayan_ts) 2019年5月11日
SOTA(State Of The Art、評価関数レーティング首位)は取れませんでしたが、TAKESHI(振り飛車評価関数首位)は奪取してみせます!笑
WCSC29の結果
http://www2.computer-shogi.org/wcsc29/
統計処理について
統計処理スクリプトはQRLのものを統計処理部分以外を少しだけ改変(出力HTMLの整形など)して用いています
つまり基本的には同じものです
RRateの基準レートはdolphin1/illqha1.1でここのレートをQRLに合わせています
測定条件について
今回より引き分け手数をWCSCと同じ320手とし、Max Moves to Drawも320に設定することとしました
320手に伸ばすことで目に見えて手数制限の持将棋が減少し測定のS/N比が向上しました
またQhapaqさんのお手伝いをしている中でResignを5000にしてみたところ
平均手数が134手→143手とおよそ10手ほど伸びることが分かりました
これは1棋譜当たりの所要時間が10秒伸びることを意味しています
数百の計測を行うことを考えるとやはり無視できない数値ですので
短い時間でより多くの計測を行いたいレーティング測定ではResignは3000のまま据え置くことにしました
謝辞
素晴らしい将棋ソフトを開発し公開して下さった作者の皆様に謝意を表します
この記事へのコメント
だき
個人的にwcsc29のもので、大会ではなかった、対振りに対して強いもの、独自の対策なども気になります。
具体的には、NNUEkaiXFとの勝率とかも面白そうだなぁと思いコメントさせていただきました。検討していただければ幸いです!
ロタ
新しい振り飛車関数も出てくると思いますのでそちらを計測するつもりでいます(たややんさんの振電など)
振り飛車関数のSOTAが何なのかは見てみたいと思っています
kisk
最近のソフトの中で、vs振り飛車のとき居飛車側ではillqhaが勝率が高く、バランス型に特化している、等の意見を目にし、検証を試みようと考えたのですが、振り飛車側は定跡で振らせるのか、自ら振り飛車を指すソフトどちらが適していると思われますでしょうか。
ロタ
元から振り飛車を指す評価関数が良いのではないかと思いますが
どちらがいいかは分からないです