第 3 章 期望均值方差

期望(或均值)是用来描述一组数据中心位置的指标(另一个是中位数 Median)。 对于离散型随机变量 \(X\) (discrete random variables),它的期望被定义为:

\[E(X)=\sum_x xP(X=x)\]

所以就是将所有 \(X\) 可能取到的值乘以相应的概率后求和。这个期望(或均值)常常用希腊字母 \(\mu\) 来标记。

方差 Variance 是衡量一组数据变化幅度(dispersion/variability)的指标之一。方差的定义是:

\[Var(X)=E((X-\mu)^2)\\\text{Where, }\mu=E(x)\]

实际上我们更加常用的是它的另外一个公式:

\[Var(X)=E(X^2)-E(X)^2\]

证明上面两个方差公式相等:

\[ \begin{align} Var(x) &= E((X-\mu)^2) \\ &= E(X^2-2X\mu+\mu^2)\\ &= E(X^2) - 2\mu E(X) + \mu^2\\ &= E(X^2) - 2\mu^2 + \mu^2 \\ &= E(X^2) - \mu^2 \\ &= E(X^2) - E(X)^2 \end{align} \]

3.1 方差的性质:

  1. \(Var(X+b)=Var(X)\)
  2. \(Var(aX)=a^2Var(X)\)
  3. \(Var(aX+b)=a^2Var(X)\)