python

競馬AI

【競馬AI-8】学習データに馬の成績情報を追加する

競馬AIの学習データに総合成績や脚質傾向などの馬情報を追加する方法を解説。SQL JOINを避け、Pythonで分割処理しながら安定的に結合する実装の流れとポイントを紹介します。
競馬AI

【競馬AI-7】学習データに調教情報を付加する

競馬AIに欠かせない調教データの取り込み方法を解説。レース結果にウッドチップ・坂路の追い切りを結合し、学習データを拡張する処理の流れやポイントを詳しく紹介します。
競馬AI

【競馬AI-6】過去5走を横持ちにして学習データを整える

競馬AIの学習用データ整形で重要な「過去5走の横持ち化」処理を解説。馬ごとの最新順に並べて直近レースを番号付けし、pandasでシンプルに5走分を付与する方法と、SQLへの安全な書き込み手順を紹介します。
競馬AI

【競馬AI-5】馬ごと最新順に連番を振る理由と処理の流れ

競馬AIの学習データを扱う際に必須となる「馬ごと最新順の連番(race_row)」の付与方法を解説。SQLのウィンドウ関数を用いた処理で、過去5走の結合をシンプルにし、データ処理を安定・高速化するポイントを紹介します。
競馬AI

【競馬AI-3】データ構造を理解する

前回の記事では mykeibadb を使って、JV DataをMySQLに取り込みました。ここまでくると「どのテーブルをどう使えば競馬AIを作れるのか?」が次のテーマになります。 今回は、JV Dataの構造や学習に役立つテーブル・カラムを...
競馬AI

【競馬AI-2】競馬データベースをローカル環境に作成する(続編)

前回の投稿から早9ヶ月弱(笑)。やっとレースを予測できるAIが完成したので投稿を再開します。 前回はEveryDB2を使ってデータベースを作成したのですが、一度エラーを起こすとどうやってもリカバリーができず最新データが取得できなくなってしま...
競馬AI

【競馬AI⑧】パラメーターチューニングでモデルの精度を向上させる

モデルの精度を上げるために今回はパラメーターチューニングを行います。 パラメーターをチューニングすることで、モデルの性能を向上させたり、オーバーフィッティングを避けたり、計算効率を良くすることができます。 ただパラメーターを見ても何が書いて...
競馬AI

【競馬AI⑦】特徴量エンジニアリングでモデルの精度を向上させる

モデルの精度を向上させるにはどうするかというと、「学習するデータ量を増やす」か「特徴量を増やす」「パラメーターチューニングを行う」などの方法があります。 データ量はスクレイピングで取得する年数を増やすだけなので、今回は特徴量を増やす方法につ...
競馬AI

【競馬AI⑥】ほぼコピペだけ!予想するレースデータの作成を簡単にする方法を紹介

こちらの記事にある予想するレースデータの取得方法の更新記事です。 久しぶりの競馬AIの記事になります。 競馬AI④の予想するレースデータの取得まで実施した方は、データの整理が大変だと感じませんでしたか?私自身感じていたので、簡単に取得できる...
競馬AI

【競馬AI⑤】ほぼコピペだけ!作ったモデルを使用して回収率を計算する-2

前回からの続きの記事になります。 前回は回収率を計算するための材料として、スクレイピングを使って払い戻し情報を取得しました。 今回はその払い戻し情報を使って、回収率を計算するプログラムを組んでいきます。 回収率を計算するコード 以下のコード...