概率论 复习
一 样本空间
- 样本空间:实验所有可能结果的集合
- 其中,每个结果都是样本空间中的一个样本 / 基本事件
- 样本空间中的任何一个子集都是一个事件。
二 σ-代数
给定一个集合X,若其 子集族 F满足以下条件,则称其为X上的σ代数:
- 包含全集:X∈F。 注意:全集作为一个 元素 包含在其中。
- 对补集运算封闭;
- 对可数个集合的并运算封闭。
关键性质:
- 包含空集
- 对于可数集合的交运算也封闭。
- 对于差集运算也封闭。
三 条件概率
定义
Pr(A∣B)=Pr(B)Pr(A∩B)
链式法则
Pr(i=1⋂nAi)=i=1∏nPr(Ai∣∩j<iAj)
形式化来说,可写成:
Pr(A1∩A2∩⋯∩An)=Pr(A1)⋅Pr(A2∣A1)⋅Pr(A3∣A1∩A2)⋅⋯⋅Pr(An∣A1∩A2∩⋯∩An−1).
全概率公式
P(A)=i=1∑nP(A∣Bi)P(Bi)=i=1∑nPr(A∩Bi)
将某个事件的概率划分为几个互斥事件下的条件概率之和。
贝叶斯公式
Pr(B∣A)=Pr(A)Pr(B)Pr(A∣B)
Pr(Bi∣A)=∑j=1nPr(Bj)Pr(A∣Bj)Pr(Bi)Pr(A∣Bi)
四 独立性
若A和B相互独立,则:
Pr(A∩B)=Pr(A)Pr(B)
若有一组事件J={A1,A2,…,An}满足如下等式:
Pr(i∈J⋂Ai)=i∈J∏Pr(Ai)
则称这一组事件为相互独立。
若有一组事件J={A1,A2,…,An},它的 任意有限子集J 满足以下式子:
∀i,j,i=j,Pr(Ai∩Aj)=Pr(Ai)Pr(Aj)
则称这一组事件为两两独立。
互相独立的事件必定两两独立,两两独立的事件不一定互相独立。
五 离散和连续随机变量
累积分布函数
累积分布函数(Cumulative Distribution Function,CDF)用于描述一个随机变量X取小于或等于某个值的概率。数学表达形式为:
F(x)=Pr(X≤x)
其中,F(x)是累积分布函数,X是随机变量,x是任意实数。
有如下性质:
- limx→−∞F(x)=0,limx→+∞F(x)=1
- 单调递增
如果某个CDF能够被表示为某函数从负无穷到x的积分,则称该随机变量为连续随机变量;其概率密度函数为CDF的导数。
概率质量函数
概率质量函数(Probability Mass Function,PMF)用于描述离散随机变量取某个值的概率。数学表达形式为:
p(x)=Pr(X=x)
其中,p(x)是概率质量函数,X是离散随机变量,x是随机变量可能的取值。
有如下性质:
- p(x)≥0
- ∑xp(x)=1
不同的概率分布
- 古典概型(离散均匀分布)
- 伯努利分布(抛硬币)
- 二项分布(一系列伯努利试验中成功的数量)
- 几何分布(第一次成功时的实验数)
- 期望p1, 方差p21−p
- 无记忆性:Pr(X>s+t∣X>s)=Pr(X>t)
- 唯一离散无记忆分布
- 负二项分布(达到指定次数成功时的失败数)
- 期望rp1−p, 方差rp21−p
- pmf: p(x)=(r−1x+r−1)pr(1−p)x=(−1)k(k−r)(1−p)kpr
- 期望可以被记为是多个几何分布随机变量期望之和
- 超几何分布(从有限样本中不放回的抽取一定数量,其中正面样本的数量)
- pmf: p(X=x)=(nN)(xN)(n−xM)
- 泊松分布(在固定时间 / 空间内,某事件发生次数的离散分布)
- pmf: p(X=x)=x!λxe−λ
- 期望:λ, 方差\lambdasss
- 泊松随机变量的和也满足泊松分布 -azscss 多项分布:有多种结果的二项分布
LOTUS定理
E[g(X)]=∫−∞∞g(x)f(x)dx
E[g(X)]=x∑g(x)p(x)
无需知道函数的分布便能求出函数的期望。
期望的线性性
E[aX+b]E[X+Y]=aE[X]+b=E[X]+E[Y]
全期望定理
E[X]E[X]=E[E[X∣Y]]=y∑E[X∣Y=y]⋅Pr(Y=y)
六 正态分布及相关不等式
马尔可夫不等式
假设X是 非负随机变量。
Pr(X≥a)≤akE[Xk]
变式:逆马尔可夫不等式
Pr(X≤a)=u−au−E[X]
(X≤u)
推广:
Pr(f(X)≥a)≤aE[f(X)]
切比雪夫不等式:用于一阶矩
假设X是 任意随机变量。
Pr(∣X−E[X]∣≥a)≤a2Var[X]
七 方差、协方差
Var[X]=E[(X−E[X])2]
Var[X]=E[X2]−(E[X])2
方差是二次中心矩;因此有
- Var[X+a]=Var[X]
- Var[aX]=a2Var[X]
- Var[X+Y]=Var[X]+Var[Y]+2Cov[X,Y]
- Cov[X,Y]=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y].
有柯西不等式的期望形式:
E[XY]2≤E[X2]E[Y2]
定义相关系数ρ(X,Y)=Var[X]Var[Y]Cov(X,Y),其取值范围为[−1,1]。
八 k阶矩(及不等式)
定义E[X]=μ. 对于任意C>1,k∈Z≥1, 有
Pr(∣X−μ∣≥C⋅E[∣X−μ∣k]k1)≤Ck1
大偏差边界
X~N(μ,σ2),a>0, 有
Pr(∣X−μ∣≥aσ)≤2e−2a2
Chernoff Bound
X1,X2,…,Xn∈{1,2},X=∑i=1nXi, 有
Pr(X≥(1+δ)μ)≤((1+δ)(1+δ)eδ)μ,(δ>0)Pr(X≤(1−δ)μ)≤((1−δ)(1−δ)e−δ)μ,(1>δ>0)
Chernoff-Hoeffding Bound
X1,X2,…,Xn∈{0,1}, Sn=∑i=1nXi, 对于任意t>0, 有
Pr(∣Sn−E[Sn]∣≥t)≤2exp(−n2t2)
扩展:
X1,X2,…,Xn,Xi∈[ai,bi], Sn=∑i=1nXi, 对于任意t>0, 有
Pr(∣Sn−E[Sn]∣≥t)≤2exp(−∑i=1n(bi−ai)22t2)
McDarmaid's Inequality
X1,X2,…,Xn为独立随机变量,Xi∈Xi.
若f=X1×X2×⋯×Xn满足
∀i,x1∈X1,…,xn∈Xnsup∣f(x1,…,xn)−f(x1,…,xi−1,xi′,xi+1,…,xn)∣≤ci
(任意更改一个参数的选择后差别不超过ci)
则对于任意t>0, 有
Pr(∣f(X1,…,Xn)−E[f(X1,…,Xn)]∣≥t)≤2exp(−∑i=1nci22t2)