025.学習不足と過学習(Underfitting and Overfitting)[Kaggle日本語訳]YourTurn

要約

最初のモデルを作成しました。次に、ツリーのサイズを最適化して、より適切な予測を行います。このセルを実行して、前の手順で中断したコーディング環境をセットアップします。

実行結果

関数get_maeを自分で書くことができます。今のところ、それを供給します。これは、前のレッスンで読んだ関数と同じです。下のセルを実行するだけです。

可能な値のセットからmax_leaf_nodesに対して次の値を試行するループを記述します。

max_leaf_nodesの各値でget_mae関数を呼び出します。データで最も正確なモデルを提供するmax_leaf_nodesの値を選択できるように、出力を保存します。

実行結果

あなたは最高のツリーのサイズを知っています。このモデルを実際にデプロイする場合は、すべてのデータを使用し、そのツリーサイズを維持することで、モデルをさらに正確にすることができます。つまり、モデリングに関するすべての決定を行ったので、検証データを保持する必要はありません。

実行結果

このモデルを調整し、結果を改善しました。ただし、最新の機械学習標準ではあまり洗練されていないディシジョンツリーモデルを引き続き使用しています。次のステップでは、ランダムフォレストを使用してモデルをさらに改善する方法を学びます。

ランダムフォレストの準備ができました。

価格:2,904円
(2020/11/25 23:14時点)
感想(0件)

価格:3,608円
(2020/11/24 23:50時点)
感想(0件)

価格:3,520円
(2020/12/10 11:12時点)
感想(1件)