12/17 時点_ポイント最大13倍

データサイエンティストのための特徴量エンジニアリング/SoledadGalli/松田晃一

販売価格
3,938
(税込)
送料無料
出荷目安:
1~3日で発送予定
たまるdポイント(通常) 35

+キャンペーンポイント(期間・用途限定) 最大12倍

※たまるdポイントはポイント支払を除く商品代金(税抜)の1%です。

表示倍率は各キャンペーンの適用条件を全て満たした場合の最大倍率です。
各キャンペーンの適用状況によっては、ポイントの進呈数・付与倍率が最大倍率より少なくなる場合がございます。
dカードでお支払ならポイント3倍

  • 商品情報
  • レビュー
SoledadGalli松田晃一
マイナビ出版
Compass Data Science
ISBN:4839982805/9784839982805
発売日:2023年06月



【内容紹介】
機械学習においてはモデルを作成しデータを与えて学習させますが、その前に生データをモデルが理解できるような形式に変換する「特徴量エンジニアリング」と呼ばる重要なステップがあります。データサイエンティストはモデルの学習に使用する生データを選び特徴量に変換したり、データを組み合わせ新しい特徴量を作成します。うまく設計された特徴量は、機械学習モデルの精度を大幅に向上させ、学習にかかる時間を短縮することができます。

本書は特徴量エンジニアリングの実践的なガイドであり、機械学習のための特徴量を作成するための効果的なテクニックとベストプラクティスを学ぶことができます。Pythonを活用し、70以上の実践的な"レシピ"により特徴量の抽出を手軽に行います。pandas、scikit-learnに特徴量エンジニアリングライブラリであるFeature-engine、Category Encoders、Featuretools、tsfreshを利用し、新しい特徴量を変換・作成します。

欠損データの補完、カテゴリエンコーディング、変数変換、離散化、スケーリング、外れ値の取り扱いなど表形式データに対する特徴量エンジニアリングのほぼすべてのトピックをカバー。日付と時刻、テキスト、時系列、リレーショナルデータセットから特徴量を抽出する方法についても解説。テキストからの特徴量の抽出の付録として日本語モデルでの実例も取り上げます。

1章 欠損値を補完する
2章 カテゴリ変数をエンコーディングする
3章 数値変数を変換する
4章 変数を離散化する
5章 外れ値を扱う
6章 日付と時刻の変数から特徴量を抽出する
7章 特徴量をスケーリングする
8章 新しい特徴量を作成する
9章 Featuretoolsを用いてリレーショナルデータから特徴量を抽出する
10章 tsfreshを使って時系列データから特徴量を作成する
11章 テキスト変数から特徴量を抽出する
付録 日本語を扱う

Packt Publishing Python Feature Engineering Cookbook、 Second Edition の翻訳書。

※本データはこの商品が発売された時点の情報です。

データサイエンティストのための特徴量エンジニアリング/SoledadGalli/松田晃一のレビュー

投稿されたレビューは0件です。

この商品のカテゴリ

同カテゴリのおすすめ商品

別カテゴリのおすすめ商品

ふるさと納税百選のおすすめ返礼品