【 統計学の数式 (By using \({\LaTeX}\))】
【 記号/略号 】
母集団( Population )\(P\)
母平均( Population Mean )\(μ\)
母分散( Population Variance )\(σ^{2}\)
母標準偏差( Population Standard Deviation) \(σ\)
標本数( Sample Size ) \(n\)
標本平均( Sample Mean ) \(\bar{x}\)
標本分散( Sample Variance ) \(s^{2}\)
標本標準偏差( Sample Standard Deviation ) \(s\)
共分散( Covariance ) 変量=2(\(x,y\))\(σ_{xy}\)
相関係数( Correlation Coefficient )(ピアソンのr) \(r\)
相対リスク( Relative Risk )\(RR\)
帰無仮説( Null Hypothesis ) \(H_{0}\)
対立仮説( Alternative Hypothesis ) \(H_{1}\)
有意水準( Significance Level ) \(\alpha\)
正規分布( Normal Distribution ) \(N(μ,σ^{2})\)
( 標準正規分布の場合 \(μ=0\) )標準誤差( SE:standard error ) \(SE\)
【 標本 】
今、標本数( Sample Size )を \(n\) とし、変量を \(x \) とすると
標本平均\[\bar{x}= \frac{\displaystyle\sum^{n}_{i=1}x_{i}}{n} = \frac{1}{n}( x_{1}+x_{2}+ \cdots + x_{n} )\]
標本分散\[s^{2}= \frac{\displaystyle\sum^{n}_{i=1}(x_{i}-\bar{x})^{2}}{n} = \frac{1}{n}\{ ( x_{1}-\bar{x})^{2} + ( x_{2}-\bar{x})^{2}+ \cdots + (x_{n}-\bar{x})^{2} \}\]
標本標準偏差\[s = \sqrt{s^{2}}\]
標準誤差\[SE = \frac{s}{\sqrt{n}} = \frac{\sqrt{\frac{1}{n-1} \displaystyle\sum^{n}_{i=1} (x_{i} - \bar{x})^{2}}} {\sqrt{n}}\]
標準誤差は、一般的に「標本平均の標準偏差」を意味する。
【 母集団 】
母集団についても、平均、分散、標準偏差 の数式は同じ。
各々の記号が異なるだけ。
母平均\[μ= \frac{\displaystyle\sum^{n}_{i=1}x_{i}}{n} = \frac{1}{n}( x_{1}+x_{2}+ \cdots + x_{n} )\]
母分散\[σ^{2}= \frac{\displaystyle\sum^{n}_{i=1}(x_{i}-μ)^{2}}{n} = \frac{1}{n}\{ ( x_{1}-μ)^{2} + ( x_{2}-μ)^{2}+ \cdots + (x_{n}-μ)^{2} \}\]
母標準偏差\(σ = \sqrt{σ^{2}}\)
偏差値\[T = \frac{\displaystyle d_{i} - μ} {σ} \times 10 + 50\]
\((d_{i} \) は個々の値)( 因みに、この偏差値という統計量は、世界では殆ど使われない)
【 多変量 】
二つの変量を、\(x、y\) とし、かつ、
この 二つの変量のサイズは両方とも同じで \(n\) とした時
共分散
\[σ_{xy} = \frac{\displaystyle\sum^{n}_{i=1}(x_{i}-\bar{x})(y_{i}-\bar{y})} {n}\]
\[=\frac{1}{n}\{(x_{1}-\bar{x})(y_{1}-\bar{y})+(x_{2}-\bar{x})(y_{2}-\bar{y})+ \cdots + (x_{n}-\bar{x})(y_{n}-\bar{y})\}\]
この「共分散」を言葉で表すと『\(x の偏差と yの偏差の積の平均\)』となります。
相関係数\[r=\frac{σ_{xy}} {σ_{x}σ_{y}}\]
【 仮説検定( Hypothesis Testing )】
今、標本数( Sample Size )を \(n\) または \(N\) とする。
◆ スタージェスの公式( 適正階級数 )
Sturges' rule\(1 + log_{2}N\)
◆ 相関係数のt検定( \(r\) は相関係数 )
Correlation coefficient ttest\[t=\frac{r\sqrt{n-2}} {\sqrt{1-r^2}} \]
◆ コックス比例ハザードモデル( \(t\) は解析時間、\(x\) は説明変数、\(a\) は各パラメーターの推定値 )
Cox proportional hazard model\(h(t|x)= h_0(t)\exp(a_1x_1 + \cdots + a_nx_n)\)

【 表2 】標準正規分布表
とりあえずは、ここまで なのだワン!
ウータンのブログ


ウータン(03/18)
zom(03/18)
ウータン(03/17)
ウータン(03/17)
ウータン(03/15)