EM算法
Expectation-Maximization:
最大似然
EM算法推导
GMM(高斯混合模型)
EM算法
最大似然估计
一个栗子:假如你去赌场,但是不知道能不能赚钱,你就在门口堵着
出来一个人就问一个赚了还是赔了,如果问了5个人都说赚了,那么
你就会认为,赚钱的概率肯定是非常大的。
已知:(1)样本服从分布的模型, (2)观测到的样本
求解:模型的参数
总的来说:极大似然估计就是用来估计模型参数的统计学方法
EM算法
最大似然数学问题(100名学生的身高问题)
样本集X={x1,x2,…,xN} N=100
概率密度:p(xi|θ)抽到男生i(的身高)的概率
独立同分布:同时抽到这100个男生的概率就是他们各自概率的乘积
θ是服从分布的参数
EM算法
最大似然数学问题(100名学生的身高问题)
最大似然函数: (对数是为了乘法转加法)
什么样的参数 能够使得出现当前这批样本的概率最大
已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,
参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。
EM算法
问题又难了一步
现在这100个人中,不光有男生,还有女生(2个类别,2种参数)
男生和女生的身高都服从高斯分布,但是参数不同(均值,方差)
求解目标:男生和女生对应的身高的高斯分布的参数是多少
用数学的语言描述:抽取得到的每个样本都不知道是从哪个分布抽取的