データ分析

分散の概念が若干理解し難いが、それ以外は独学が平易な分野。
回答が煩雑なだけで、下位層でも得点源にしやすい。

平均、期待値

期待値:これから行う試行に対し、予測される平均値。
平均値:既に試行した結果の平均。


分散、標準偏差

分散:資料の散らばり具合を表す指標。
標準偏差:平均からの平均的離れ具合
高額塾無用・大学受験合格シンプル勉強法【一粒メソッド】

以下に記載したのは、分散と標準偏差を解説した動画。非常にわかりやすい。
分散をサンプルと平均の差を一辺とする正方形の面積と考え、
サンプル毎の正方形の面積の平均が分散、平均化された面積の一辺の長さが標準偏差だとしている。

共分散

Sxy: xとyの二変数の相関を調べたもの、身長と体重。
身長が高い人は体重が重い傾向にある。つまり正の相関がある。


【試験に役立つ左脳型速読術】 受験、ビジネスシーン、さらには英語の速読にも具体的に対応する速読法

相関係数


sx:xの標準偏差、sy:yの標準偏差、sxy:xとyの共分散。
共分散が-1から1の間に収まるように、調整した数値。
相関係数rが1に近づけば右上がりの直線グラフに近づく。
rが0の場合は散布図上のデータの傾向はなく、プロットしたデータの点はまばら。
rが-1に近づけば右下がりの直線グラフに近づく。
0.3~0.5程度なら弱い相関を持つ。
0~0.3ならほとんど相関はない。

変量の変換

E[X]はXの期待値(平均),V[X]はXの分散
Y=aX+b
E[Y]=aE[X]+b
V[Y]=a2E[X]
V[X]=E(X2)-{E(X)}2

以下の京大卒の講師の変量の変換の授業は非常にわかりやすい。


独立の場合
E(XY)=E(X)×E(Y)
V(X+Y)=V(X)+V(Y)

Short Notes

Homeに戻る