Processing math: 100%

概率

随机变量与概率

概率密度函数的积分

  • 离散随机变量
    假设随机变量 X 的取值域为 ={xi}i=1,那么对于任何一个 xi,事件 X=xi 的概率记为 P(xi). 对于 的任何一个子集 S={xi}i=1=1,事件 XS 的概率为

    P(S)=i=1P(x1)

    对于离散随机变量,概率为概率函数的求和

  • 连续随机变量
    假设随机变量 X 的取值域为 R,那么对于几乎所有 xR, 事件 X=x 的概率 P(X=x) 都等于 0. 所以我们转而定义概率密度函数 f:R[0,). 对于任何区间 (a,b), 事件 X(a,b) 的概率为

    P((a,b))=baf(x)dx

条件概率与贝叶斯公式

条件概率

条件 A 下事件 S 发生的概率

P(S|A)=P(SA)P(A)

贝叶斯公式

P(A|B)=P(B|A)P(A)P(B)

大数定律和中心极限定理

随机变量的矩

X,Y 为随机变量,则
E(Xk),k=1,2,3. 称为 Xk 阶原点矩,简称 k 阶矩
E((XE[X])k),k=1,2,3. 称为 Xk 阶中心距
E(XkYl),k,l=1,2, 称为 XYk+l 阶混合矩
E((XE[X])k(YE[Y])l)),k,l=1,2,称为 XYk+l 阶混合中心矩

  • n=1 时,E(X) 为随机变量的期望
  • n=2 时,Var(x)=[xiμ]2f(x)dx=E(X2)E(X)2=ni=1x2ipiμ2 为随机变量的方差 特征函数,
  • n=3时,偏度S(x)=[xiμ]3f(x)dx
  • n=4时,峰度K(x)=[xiμ]4f(x)dxσ23
  • 归一化n阶中心矩为 E[(xμ)n]σn
  • 混合矩:混合矩是多个变量的矩,比如协方差,协偏度,协峰度。虽然协方差只有一个,但协偏度和协峰度存在多个

几何意义

  • 一阶矩:矩可以描述随机变量的一些特征,期望是 X “中心”位置的一种 描述,
  • 二阶矩:方差可以描述 X 的分散程度, 特征函数可以全面描述概率分布.
  • 三阶矩:任何对称分布偏态为0,向左偏斜(分布尾部在左侧较长)具有负偏度;向右偏斜分布(分布尾部在右侧较长)具有正偏度
  • 四阶矩:峰度表示分布的波峰和尾部与正态分布的区别。完全符合正态分布的数据峰度值为0,且正态分布曲线被称为基线。如果样本峰度显著偏离0,就可判断此数据不是正态分布。

    切比雪夫不等式

    X 为随机变量,期望值为 µ, 标准差为 σ, 对于任何实数 k>0P(|Xµ|kσ)1k2

随机变量的协方差与相关系数

  • X、Y的协方差: cov(X,Y)=E((Xμx)(Yμy))=E(XY)E(X)E(Y)
    协方差就是衡量两个变量相关性的变量。当协方差为正时,两个变量呈正相关关系(同增同减);当协方差为负时,两个变量呈负相关关系(一增一减)
  • X、Y的相关系数: cov(X,Y)/Var(X)Var(Y)
    协方差的标准化

特征函数

重要极限

limn(1+1/n)n存在,且定义 e=limn(1+1/n)n 于是定义 e=limn(1+x/n)n

大数定律

X 是随机变量,µX 的期望,σX 的方差.{Xk}k=1 是服从 X 的独立同分步随机变量,那么 ¯Xk=nk=1Xkn 依概率收敛于 µ. 也就是说对于任何 ϵ>0

limnP(|¯Xnμ|>ϵ)=0
  • 当大量重复同一个实验时,实验的平均结果会接近于期望值
  • 重复次数越多越接近

中心极限定理

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布

几种常见的分布

  • 离散概率分布(Discrete)
    离散均匀分布(discrete uniform)、伯努利分布(Bernoulli)、二项式分布(Binomial)、泊松分布(Poisson)、超几何分布(Hypergeometric)
  • 连续概率分布(continuous)
    均匀分布(Uniform)、正态分布(Normal/Gaussian)、指数分布(Exponential)、Gamma分布 、Beta分布、Gumbel分布
  • 抽样分布
    卡方分布、F分布、t分布