このノートブックでは、表形式のプレイグラウンドシリーズ-2021年2月のコンテストに初めて応募する方法を学びます。
このノートブックを最大限に活用してください!
ページの右上にある[Copy and Edit]ボタンを使用して、このノートブックの独自のコピーを作成し、さまざまなモデルを試すことができます。そのまま実行して、改善できるかどうかを確認できます。
データファイルを読み込む
カテゴリをエンコードする必要があります。
これを達成するためのさまざまな戦略があり、さまざまなアルゴリズムを使用すると、さまざまなアプローチでさまざまなパフォーマンスが得られます。このスターターノートブックでは、単純なエンコーディングを使用します。
ターゲットを引き出し、検証を分割します
完全にナイーブなモデルでどれだけうまくできるでしょうか?
私たちは、どのモデルにもこれよりも(うまくいけばはるかに!)もっとうまくやってもらいたいと思います。
単純な線形回帰
単純な線形回帰は、ダミーの回帰分析よりも優れているわけではありません。 (Alghouth、単純なカテゴリエンコーディングはこのアプローチには実際には意味がありません!)
これは遅くて反復的なようです。少し自動化できますか?
RandomForestが最善を尽くしたようです。すべてのデータでトレーニングして提出しましょう!
次に、ノートブック(右上の青いボタン)を保存し、それが完了したら、ノートブックビューアーに移動して、コンテストに提出する必要があります。 🙂
改善の余地はたくさんあります。より良いスコアを得るために何を試みることができますか?
データサイエンスの森 Kaggleの歩き方 [ 坂本俊之 ] 価格:2,904円 |
価格:3,608円 |
すぐに使える!業務で実践できる!PythonによるAI・機械学習・深層学習アプリ [ クジラ飛行机 ] 価格:3,520円 |