6/30 時点_ポイント最大10倍

統計的データクリーニングの理論と実践 Rによるデータ編集/欠測補完システム /マーク・ファン・デル エドウィン・デ・ヨン 地道正行

販売価格
6,380
(税込)
送料無料
出荷目安:
1~2営業日で出荷
たまるdポイント(通常) 58

+キャンペーンポイント(期間・用途限定) 最大9倍

※たまるdポイントはポイント支払を除く商品代金(税抜)の1%です。

表示倍率は各キャンペーンの適用条件を全て満たした場合の最大倍率です。
各キャンペーンの適用状況によっては、ポイントの進呈数・付与倍率が最大倍率より少なくなる場合がございます。
dカードでお支払ならポイント3倍

  • 商品情報
  • レビュー
≪商品情報≫

著者名:マーク・ファン・デル・ロー、エドウィン・デ・ヨンゲ、地道正行
出版社名:共立出版
発行年月:2022年02月
判型:B5
ISBN:9784320114630


≪内容情報≫

統計的なデータクリーニングシステムを構築するための包括的なガイド

データクリーニングとは、入手した原データを、分析に耐えうる品質にするために、エラーや矛盾する値を検出・修正し、欠測を補完する作業のことで、データ分析においてしばしば最も時間のかかるプロセスである。公的統計分野において、この分野は「データ編集」とも呼ばれ、この50年余に多くの知見が蓄積されてきたが、一般の統計のコミュニティにおける文献は多くない。
本書は、2013年に開催された世界規模のRユーザーカンファレンスであるuseR!2013において行われたデータクリーニングのチュートリアルがきっかけとなり,オランダ統計局の研究部門に所属する著者によって書かれている。近年のビックデータ時代の到来により、調査集計を行う公的統計部局は行政記録その他の幅広いデータを取り扱うようになるとともに、より広い分野においてもデータの入手が容易になったためにデータクリーニングの要請は広がり、公的統計分野での知見はより多くの分野で役立つ可能性を持っている。
著者は、本書で紹介されるデータ検証やエラーの局所化、エラー修正のための様々な方法や欠測値の補完といった様々なデータクリーニングのためのRのパッケージの多くを開発しており、実際に使用するためのコード例も豊富に掲載され、数値やテキスト、日付等のデータの取り扱いや、数値計算時の留意点など、プログラミングに関する内容も収録されている。

本書の特徴
データ分析を行う際に、しばしば最も手のかかるデータクリーニングに焦点を当て、理論とRによる実装の双方向から解説

アドホックで、データ毎に異なるカスタムメイドのクリーニングシステムではなく、汎用性を重視した構築の方法論も解説

データの矛盾を解消し、欠測を補完するための統計的手法、バッチ処理化やデータ変遷のモニタリングについても解説

〔原著〕Statistical Data Cleaning with Applications in R, Wiley, 2018.

統計的データクリーニングの理論と実践 Rによるデータ編集/欠測補完システム /マーク・ファン・デル エドウィン・デ・ヨン 地道正行のレビュー

投稿されたレビューは0件です。

この商品のカテゴリ

同カテゴリのおすすめ商品

別カテゴリのおすすめ商品