『AlphaKeiba』はなぜ賞金30万を獲得できたのか

50 %
50 %
Information about 『AlphaKeiba』はなぜ賞金30万を獲得できたのか
txt

Published on June 16, 2016

Author: data_sciesotist

Source: slideshare.net

1. AlphaKeibaはなぜ賞金30万を 獲得できたのか? 東工大ブライアンズトウコウ リーダーのぬくい twitter: @heartz2001 1

2. 自己紹介 名前: 貫井 駿 競馬歴: 10年 好きな馬: ハーツクライ 所属: 東京工業大学 情報理工学研究科 計算工学専攻 サークル: 東工大競馬研究会 部長 専門: ネットワーク解析・機械学習 2

3. メンバー紹介 チーム名: ブライアンズトウコウ 貫井 (データ解析担当) 中条 (競馬マニア) 小峰 (エンジニア) 3

4. 今日の内容 • 電脳賞について • 『AlphaKeiba』の構成 • データ成形 • 予想ロジック • 馬券最適化 • デモ 4

5. 電脳賞(春)について • (株)ドワンゴ主催競馬予想アルゴリズム大会 • 回収率の部と1着予想の部で競う • 通算回収率100%越えると賞金30万円 • 50R/50R的中させると20万円(?!) 5

6. 電脳賞ルール • 1ヶ月間計50レースが対象 • 毎開催日5レース選出 • ソフトのみを使ってレース結果を予想 • 12,000pt/Rを使い切る • JRA-VANが提供するData Lab.のデータを使用す る 6

7. 電脳賞成績 7

8. 30万への道のり データ成形 アルゴリズム選択 馬券最適化 モデルチューニング 8

9. AlphaKeibaとは • 機械学習アルゴリズムによる馬券予想システム • JRA-VAN公式データを利用 • α指数の計算と馬券最適化ができる 9

10. AlphaKeibaの構成 JV-Data VC++ 生データ (txt) sqlite3 Python (py2exe) 予測結果 (csv) 集計 JV-Link 10

11. データ成形 11

12. データ取得 • JV-Link APIを利用 • 月額2,052円(税込)で利用可 • データを使える形にするためにいろんな困難が待ち受けている ※JRA-VAN HPより 12

13. 困難その1 13 ・Visual C++ (or C#)を使わなくてはならない(マニュアルがVS 2005)

14. 困難その2 SE72016060620160604050301011012013101990クリノリーズ 00210103101031伊藤伸一970006栗本 博晴 緑,黒袖 520000000115100000井上敏樹 20422+01201313001283134 0000040625861500000000000000000000000003902013105546 ミッキーオフィサー 0000000000 0000000000 +024031295100240007153 SE72016060620160604050301011022013104867プラウドフェロー 00210103101052菊川正達013803ディアレストクラブ 薄紫,青一本輪,袖青縦縞 540000000068900000江田照男 00424-048014140012862 0000161517171300000000000000000000000003822013105546 ミッキーオフィサー 0000000000 0000000000 +027031285900240007124 ... 14 ・固定長テキスト形式で提供されるデータ

15. データのパース 15 ・定義書(excel)をパースしてそれを基に生データをパースする (後にデータをパースするSDKが提供されていることを知りました)

16. Python+Pandasで成形 16

17. Data Lab.の提供データ 提供されているデータの例 ・1990年以降の中央レース成績 – ハロンタイム,着順,着差,脚質 etc ・オッズ – 最終オッズ,速報オッズ,時系列オッズ ・血統 ・速報データ(馬場状態, 天気など) ・調教タイム 17

18. 予想ロジック 18

19. ロジックの流れ 馬Xの特徴量 馬Xの特徴量 馬Xの特徴量 馬Xの特徴量 Random Forest 馬Xの特徴量 馬Xの特徴量 馬Xの特徴量馬Xの推定 連対確率 オッズ補正 馬Xの特徴量 馬Xの特徴量 馬Xの特徴量馬Xの 連対確率 馬券最適化 馬連 買い目 19

20. 主な特徴量 • 出走頭数 • 当該馬の出走回数 • 過去3レースの着順 • 過去3レースの人気 • 過去3レースの着差 • 過去3レースの脚質 • 過去3レースの距離 • 過去3レースのクラス • 出走馬の平均脚質 • 調教タイム • 騎手の平均着順 • 騎手の平均脚質 オッズは入力しない 20

21. Random Forest 21 • 出走頭数 • 当該馬の出走回数 • 過去3レースの着順 • 過去3レースの人気 • 過去3レースの着差 • 過去3レースの脚質 • 過去3レースの距離 • 過去3レースのクラス • 出走馬の平均脚質 • 調教タイム • 騎手の平均着順 • 騎手の平均脚質 多数決

22. 連対率の推定 • 馬連に最適化するために連対率を推定 推定連対率 推定連対率 Random Forest 推定連対率 推定連対率 独立 22

23. 連対率の推定 • 馬連に最適化するために連対率を推定 推定連対率 推定連対率 推定連対率 推定連対率 補正連対率 Random Forest 連対率の和を 2に正規化 補正連対率 補正連対率 補正連対率 23

24. オッズによる補正 • 馬連の周辺支持率から連対確率を計算 馬連(X-Y)支持率 = 馬連(X-Y)オッズ 0.748 馬X連対確率 = ΣY 馬連(X-Y)支持率 24 控除率

25. 馬券最適化 25

26. 馬券最適化アルゴリズム 入力: 推定連対率{pX} 馬連オッズ{oXY} 最低的中率 pmin 予算 M (=12,000pt) 26 出力: 期待値を最大化する買い目(金額) B={(bXY,mXY)}

27. 試したモデル • ロジスティック回帰 • SVM • 決定木 • Random Forest 27

28. シミュレーション結果 28 • 阪神ダート1800m(1050レース) • 訓練サンプル 約400R/回 104.0% 92.3% 68.1% 64.4% 0.0% 20.0% 40.0% 60.0% 80.0% 100.0% 120.0% RF DT LR SVM 回収率 モデル

29. シミュレーション結果 29 • 中距離ダート(1008レース) • 訓練サンプル 約4500R/回 87.8% 64.8% 81.4% 76.3% 0.0% 10.0% 20.0% 30.0% 40.0% 50.0% 60.0% 70.0% 80.0% 90.0% 100.0% RF DT LR SVM 回収率 モデル

30. デモ 30 AlphaKeiba on Azure

31. まとめ • データ成形は大変 • 今のところRandomForestが1番強い • RandomForest+馬券最適化と組み合わせ たら回収率100%超えた 31

32. 今後の展望 • 馬券最適化を強化学習でやる • 流行りのディープラーニングを使いたい • 可視化ツール作りたい 32

33. さいごに 33

34. ご清聴ありがとうございました 34

Add a comment

Related pages

競馬予測の考え方 - SSSSLIDE

『AlphaKeiba』はなぜ賞金30万を獲得 ... モデルをどう学習させるか モデルの ... 過去10年分のデータ(37万件)を ...
Read more

人工知能の予想ロジックを紹介! : 【電脳賞】人工知能の競馬予想を実際に買ってみた

その予想で本当に馬券が当たるのか ... 「AlphaKeibaの ... 「AlphaKeibaはなぜ賞金30万円を獲得できたの ...
Read more

ウマナリティクス #1 - connpass

... のか。継続的には ... AlphaKeiba』は賞金30万を獲得できた ... はなぜ賞金30万を獲得できたのか. ...
Read more

2016年09月 : 【電脳賞】人工知能の競馬予想を実際に買ってみた

「AlphaKeibaはなぜ賞金30万円を獲得できたのか ?」 ... 「AlphaKeibaの穴馬マイニング」は.
Read more

ウマナリティクス(仮)~競馬×データサイエンス~ - connpass

競馬に関するあれこれを、データ分析の ... 名前の由来は ... 『AlphaKeiba』はなぜ賞金30万を獲得できたのか.
Read more

ウマナリティクス #1 watav[ワタビ]|あなたのイベントコンシェルジュ

... よいのか。継続的には ... の構造は、以下の画像を ... なぜ『AlphaKeiba』は賞金30万を獲得できた ...
Read more