コース04-中級機械学習

038.はじめよう!2月の表形式の遊び場コンテスト(Get Started: Feb Tabular Playground Competition)[Kaggle日本語訳]

  • LINEで送る

928 views

     

このノートブックでは、表形式のプレイグラウンドシリーズ-2021年2月のコンテストに初めて応募する方法を学びます。

このノートブックを最大限に活用してください!

ページの右上にある[Copy and Edit]ボタンを使用して、このノートブックの独自のコピーを作成し、さまざまなモデルを試すことができます。そのまま実行して、改善できるかどうかを確認できます。

データファイルを読み込む

カテゴリをエンコードする必要があります。

これを達成するためのさまざまな戦略があり、さまざまなアルゴリズムを使用すると、さまざまなアプローチでさまざまなパフォーマンスが得られます。このスターターノートブックでは、単純なエンコーディングを使用します。

ターゲットを引き出し、検証を分割します

完全にナイーブなモデルでどれだけうまくできるでしょうか?

私たちは、どのモデルにもこれよりも(うまくいけばはるかに!)もっとうまくやってもらいたいと思います。

単純な線形回帰

単純な線形回帰は、ダミーの回帰分析よりも優れているわけではありません。 (Alghouth、単純なカテゴリエンコーディングはこのアプローチには実際には意味がありません!)

これは遅くて反復的なようです。少し自動化できますか?

RandomForestが最善を尽くしたようです。すべてのデータでトレーニングして提出しましょう!

次に、ノートブック(右上の青いボタン)を保存し、それが完了したら、ノートブックビューアーに移動して、コンテストに提出する必要があります。 🙂

改善の余地はたくさんあります。より良いスコアを得るために何を試みることができますか?

データサイエンスの森 Kaggleの歩き方 [ 坂本俊之 ]

価格:2,904円
(2020/11/25 23:14時点)
感想(0件)

Kaggleで勝つデータ分析の技術 [ 門脇大輔 ]

価格:3,608円
(2020/11/24 23:50時点)
感想(0件)

すぐに使える!業務で実践できる!PythonによるAI・機械学習・深層学習アプリ [ クジラ飛行机 ]

価格:3,520円
(2020/12/10 11:12時点)
感想(1件)

  • LINEで送る