scikit-learn 0.20からクロスバリデーションの使い方が変更される模様
機械学習をやるときに結構良く使うところだなと思っていた、クロスバリデーションのスプリッター系モジュールのインターフェースが変わることに気づいたのでメモ。
scikit-learnの従来のクロスバリデーション関係のモジュール(sklearn.cross_vlidation)は、scikit-learn 0.18で既にDeprecationWarningが表示されるようになっており、ver0.20で完全に廃止されると宣言されています。
詳しくはこちら↓
Release history — scikit-learn 0.18 documentation
続きを読む
Kaggle KernelでRegularized Greedy Forestがサポートされました
以前
【機械学習】Regularized Greedy Forest(RGF)で多クラス分類を試してみました - verilog書く人
の記事で紹介させていただいたRegularized Greedy Forest及びそのwrapperであるrgf_pythonがKaggle Kernel (旧Kaggle Scripts)でサポートされました。
Kaggle Kernel上ではインストール作業などなしで、importすれば使うことが出来ます。
試しに作成してみたKaggle Kernelはコチラ↓
https://www.kaggle.com/fukatani/d/uciml/iris/classification-by-regularized-greedy-forest
動いてます。安定のiris。
というわけでぜひぜひお試しあれ。
P.S.
Kaggleのサポートチームにちょっと「RGFどうですか?」と頼んだら、気前よくスピーディにサポートしてくださいました。感謝。
scikit-learnモデルのVotingとキャッシング
先月末まで、Shelter Animal Outcomes | Kaggleに参加していました。
同僚の力も借りつつ、なんとかTOP2%に入り込む結果になりました。
トップはほぼパーフェクトに近いスコアの方もいたり、leak多すぎて実態がよくわからん、という印象。
データの前処理はフォーラムを見つつテキトーに、
最終的にモデルはXGB、Random Forest、Extreme randomized treesの三つのモデルのVoting ensembleを行いました。
続きを読む