A.分布を表す指標
A.1 代表値
平均値
幾何平均
調和平均
中央値
全体のデータ数をN個として順に並べたときの下からN/2番めのデータの値。
Nが奇数ならば(N-1)/2番めのデータと(N+1)/2番めのデータの間の値をとる。
最頻値
一番たくさん出現したデータ。
A.3 二変数の記述
共分散
相関係数
回帰直線
二変数のデータ(X、Y)をプロットしたときにその点が同一の直線上にちかい場所にあると仮定してその直線を
y = a + bx
とする。この直線の係数a,bをデータから推定する。その方法として直線とデータとの間にy軸と平行に直線を引いて、その二乗和が最小になるようなa,bを求める。
となるようにすれば
と求められる。