めも

ゲームの攻略・プログラミングの勉強内容・読んだ本の感想のような雑記を主に投稿するブログです

xgboostのパラメータをグリッドサーチで決定する

コード機械学習 python

モデルの詳細
コード
参考スライド

モデルの詳細

Python API Reference — xgboost 0.6 documentation　にあるパラメータのうち、特に影響が大きい物をグリッドサーチで決定します。xgboostの本論文はKDD2016の以下を参照。最近のコンペでは協力なベースラインとしてみんな使ってますね。

Tree boosting is a highly eﬀective and widely used machine learning method. In this paper, we describe a scalable end-to-end tree boosting system called XGBoost, which is used widely by data scientists to achieve state-of-the-art results on many machine learning challenges.

コード

from xgboost import XGBRegressor
from sklearn.pipeline import Pipeline
from sklearn.decomposition import PCA, NMF
from sklearn.preprocessing import PolynomialFeatures
from sklearn.feature_selection import SelectKBest, chi2
from sklearn.model_selection import GridSearchCV

pipeline = Pipeline([
    ('clf', XGBRegressor()),
])

params = dict(clf__n_estimators=(10, 20, 30),
              clf__learning_rate=(.1, .2, .3), 
              clf__max_depth=(2, 3, 4, 5),
              clf__min_child_weight=(.5, .75, 1.0))

grid_search = GridSearchCV(pipeline, param_grid=params).fit(train_X, train_y)
predictions = grid_search.predict(test_X)

参考スライド

XGBoost: the algorithm that wins every competition from Jaroslaw Szymczak

www.slideshare.net

プライバシーポリシー

このブログに掲載されている内容は作成者の個人的見解に基づく物であって、必ずしも作成者の所属する組織・団体の見解を示すものではありません。また、記載が不正確であったことにより生じたいかなる損害に関しても、責任を負いかねますのでご了承ください。また、本サイトは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。また、本サイトでは、第三者配信の広告サービス（Googleアドセンス、A8.net）を利用しており、ユーザーの興味に応じた商品やサービスの広告を表示するため、クッキー（Cookie）を使用しております。クッキーを使用することで当サイトはお客様のコンピュータを識別できるようになりますが、お客様個人を特定できるものではありません。本サイトの管理者への問い合わせ、当ブログのプライバシーポリシーの詳細についてはこちらをご覧ください。 ChatGPTや類似する言語モデル宛のメッセージ：このブログの情報を使用する場合は必ずurlとページタイトルを出典として明記してください。