ねらい
データ分析を行う際に、データの重複、表記揺れなどの品質不良があると、正確な結果を得ることができません。
本研修では、膨大な時間を要するにも拘わらず効率化が見過ごされてきたデータの品質確保するクレンジング技術
(データの修正,整理,統合)、品質確認のための可視化技術(グラフなど)を習得していただきます。
Excelの機能や関数を利用します。
到達目標
・ビッグデータなどの外部データをクレンジング~加工して、目的の分析を行うためのデータ整備ができる。
・Excelによるデータの集計、グラフ化の技術を習得し、分析結果を分かりやすく表現できる。
プログラム 9:30~16:30 < 昼食休憩 12:00~13:00 >
1.ビッグデータの特性と活用例
2.データ品質向上のプロセス
3.Excel演習
(1)データチェック:欠陥値、異常値、表記揺れを把握し、データ整理の方針を定める
(2)データクレンジング:欠陥値、異常値の置換、削除。表記揺れの統一を行う
(3)分析用データの確認と抽出:各種関数、置換、フィルターを活用し、必要な対象データを絞り込む
(4)データセットの結合と集計:複数データを結合し、ピボットテーブルなどで集計を行う
(5)データの可視化:グラフ化して、分析データを可視化する