このノートブックでは、表形式のプレイグラウンドシリーズ-2021年2月のコンテストに初めて応募する方法を学びます。
このノートブックを最大限に活用してください!
ページの右上にある[Copy and Edit]ボタンを使用して、このノートブックの独自のコピーを作成し、さまざまなモデルを試すことができます。そのまま実行して、改善できるかどうかを確認できます。

データファイルを読み込む



カテゴリをエンコードする必要があります。
これを達成するためのさまざまな戦略があり、さまざまなアルゴリズムを使用すると、さまざまなアプローチでさまざまなパフォーマンスが得られます。このスターターノートブックでは、単純なエンコーディングを使用します。

ターゲットを引き出し、検証を分割します

完全にナイーブなモデルでどれだけうまくできるでしょうか?
私たちは、どのモデルにもこれよりも(うまくいけばはるかに!)もっとうまくやってもらいたいと思います。

単純な線形回帰
単純な線形回帰は、ダミーの回帰分析よりも優れているわけではありません。 (Alghouth、単純なカテゴリエンコーディングはこのアプローチには実際には意味がありません!)

これは遅くて反復的なようです。少し自動化できますか?






RandomForestが最善を尽くしたようです。すべてのデータでトレーニングして提出しましょう!

次に、ノートブック(右上の青いボタン)を保存し、それが完了したら、ノートブックビューアーに移動して、コンテストに提出する必要があります。 🙂
改善の余地はたくさんあります。より良いスコアを得るために何を試みることができますか?
![]() | データサイエンスの森 Kaggleの歩き方 [ 坂本俊之 ] 価格:2,904円 |

![]() | 価格:3,608円 |

![]() | すぐに使える!業務で実践できる!PythonによるAI・機械学習・深層学習アプリ [ クジラ飛行机 ] 価格:3,520円 |
