欠落値、非数値、データ漏洩などの処理方法を学びます。 モデルはより正確で便利になります。
イントロダクション(Introduction)
このマイクロコースに必要なものを確認する
欠測値(Missing Value)
欠測値が発生します。実際のデータセットでのこの一般的な課題に備えてください。
カテゴリ変数(Categorical Variables)
数値以外のデータがたくさんあります。機械学習に使用する方法は次のとおりです。
パイプライン(Pipelines)
前処理を使用して複雑なモデルを展開(さらにはテスト)するための重要なスキル
相互検証(Cross-Validation)
モデルをテストするためのより良い方法
XGBoost
構造化データの最も正確なモデリング手法
リーケージ(Data Leakage)
微妙な方法でモデルを台無しにするこのプログラムを見つけて修正する
BONUS:はじめよう!2月の表形式の遊び場コンテスト(Get Started: Feb Tabular Playground Competition)
このコースで学んだことを初心者向けの競技会に応用してください。
データサイエンスの森 Kaggleの歩き方 [ 坂本俊之 ] 価格:2,904円 |
価格:3,608円 |