統計学活用支援サイト
・本講座では、最新の統計学の考え方と、用いるべき統計手法について学び、統計学の本質の理解と共に、実践的な統計学の活用能力の習得を目指します。
・統計学の初心者から研究者、及び分析業務担当者までの方を対象に、できる限り数式を用いずに、事例を用い解説致します。
・統計学の範囲は非常に広範であり、様々な分野で活用されていますが、分析結果を統計学の本質を踏まえ正確に解釈した活用力の習得を目指します。
・統計学の実践的な活用において、最初に考慮すべきポイントは、データの吟味(外れ値の有無、データの偏り等)、及びサンプルサイズ(データ量)です。それぞれのデータに合わせた正しい解析(分析)方法について学びます。
・統計学の本質(構造)の理解なくして、様々な統計的手法を学んでも実践的な理解は困難です。
#分析には、EXCEL(2016以降推奨)を使用します。
・統計学の本質的な構造、知識、解析(分析)手法について実践的に学びたい方
・マーケティング(企画、宣伝、予測、調査等)、データ管理業務(営業、経理、人事等)における統計学の活用方法について習得したい方
・教育、研究等において統計学を活用される方(特に数学の知識は必要ありません。)
・統計学の本質の理解、及び統計学の実践的な活用能力の習得
1.統計学の基礎 幾何平均、箱ひげ図、ヒストグラム、分散、標準偏差、Z値、偏差値、正規分布、信頼区間 データの特徴(平均値、偏り、外れ値の有無)の把握方法、バラツキの重要性と判断への活用方法、Z値と正規分布の関係等について学びます。
・目的に応じた平均の使用方法について理解する。 ・バラツキ(分散、標準偏差)の計算方法 ・データの正しい評価は、平均とバラツキを用いたZ値(偏差値)で行う。 ・正規分布は、統計学において最も重要な分布である。 ・箱ひげ図を用いて外れ値の有無についてチェックする。 ・ヒストグラムでデータの全体を把握する。
2.統計的推定と検定 t分布、2標本t検定(対応の有無)、カイ二乗検定、P値(有意確率)、区間推定、効果量、検出力(検定力) データの形式、サンプルサイズ(データ量)に合わせた検定方法及び分析結果の解釈方法について学習します。
・t分布と正規分布の違い ・サンプルサイズが小さい場合は、t分布を利用する。 ・違いの大きさをP値、区間推定で判断する。 ・効果量は、違いの大きさではなく、効果(ズレ)の大きさである。 ・サンプルサイズの異なる分析結果の比較には、P値ではなく効果量を用いる。 ・サンプルサイズが小さい場合は、検出力に注意する。 ・検出力の小さい分析の結果は信頼度が低い。 ・ビッグデータにおいては、P値はまったく参考にならない。 ・対応の有無は、分析者が判断する。 ・対応データは、差に着目した分析である。 ・対応の有無を間違えると正しい分析結果は得られない。
3.相関と回帰分析 散布図、相関関係、積率相関係数、交絡要因 、回帰分析(従属変数、説明変数、偏回帰係数、t検定、決定係数)、ダミー回帰 2つ以上の量の関係について、関係をグラフで把握する方法、及び数値で把握する方法、注目する量(売上高等)と、それに影響を与えると思われる量的データ、及び質的データとの関連を明らかにする方法について学習します。
・散布図の正しい書き方と散布図の種類 ・積率相関係数のしくみ ・積率相関係数の解釈の方法 ・外れ値は、積率相関係数の値に大きな影響を与える。 ・積率相関係数は、効果量である。 ・無相関の検定(P値)はあまり利用されていない。 ・回帰モデルのしくみ ・回帰モデルのチェック方法 ・決定係数は説明力を表し、自由度調整済み決定係数(EXCEL : 補正R2)を参考にする。 ・t検定は、偏回帰係数が0より大きかどうかの検定である。 ・ビッグデータにおいては、t検定は利用されていない。 ・説明変数間の積率相関係数が高いと、回帰モデルの解釈は困難である。 ・説明変数が質的データ(男女…等)の場合はダミー変数を使用する。 ・カテゴリーデータはダミー変数を利用する。 ・外れ値のデータは、ダミー変数で区別し回帰分析を行う。
© (株)データサイエンス研究所 All Rights Reserved.