現実世界の乱雑なデータをクリーニングするための効率的なワークフローをマスターします。
欠落値の処理(Handling Missing Values)
不足している値を削除するか、自動化されたワークフローで入力します。
スケーリングと正規化(Scaling and Normalization)
数値変数を変換して、役立つプロパティを設定します。
日付の解析(Parsing Dates)
Pythonが日付を日、月、年で構成されるものとして認識するのを助けます。
文字エンコード(Character Encodings)
CSVファイルをロードするときのUnicoodeDecodeErrorsを回避します。
一貫性のないデータ入力(Inconsistent Data Entry)
データのタイプミスを効率的に修正します。
![]() | データサイエンスの森 Kaggleの歩き方 [ 坂本俊之 ] 価格:2,904円 |

![]() | 価格:3,608円 |
