首页 >  常识 > 

似然函数通俗理解(如何理解似然函数)

时间:2024-12-12 09:34:40

要理解这个概念,我们先回忆一下概率的含义:

概率是度量偶然事件发生可能性的数值。假如经过多次重复试验(用X代表),偶然事件(用A代表)出现了若干次(用Y代表)。以X作分母,Y作分子,形成了数值(用P代表)。在多次试验中,P相对稳定在某一数值上,P就称为A出现的概率。

我们常说的概率,是在已经知道随机变量某个值出现的可能性大小的情况下,来推测在某次试验中这个值会出现多少次。比如预先知道,一枚正常的硬币,在抛掷的时候,正反两面出现的可能性(概率)都是1/2,那么,如果抛掷100次,可以预测正反两面出现的次数都大概是50次;而似然性则是用于在已知抛掷100次硬币正反两面出现的次数的基础上,反过来推测正反两面出现的可能性(概率),即根据某些观测所得到的结果,对有关事物的性质的参数进行估计。

有一个硬币,它有θ的概率会正面向上,有1-θ的概率反面向上。θ是存在的,但是你不知道它是多少。为了获得θ的值,你做了一个实验:将硬币抛10次,得到了一个正反序列:x=HHTTHTHHHH。

无论θ的值是多少,这个序列的概率值为 θ⋅θ⋅(1-θ)⋅(1-θ)⋅θ⋅(1-θ)⋅θ⋅θ⋅θ⋅θ = θ⁷ (1-θ)³

比如,如果θ值为0,则得到这个序列的概率值为0。如果θ值为1/2,概率值为1/1024。

但是,我们应该得到一个更大的概率值,所以我们尝试了所有θ可取的值,画出了下图:

图一

从图中可以看到,使得表达式θ⁷ (1-θ)³取得最大值的θ为0.7左右,这就是似然值的含义,也就是说,在已经知道试验结果(7次正面,3次反面)的前提下,反过去推测θ值为多少(这里假设硬币正反两面出现的概率都可以不是1/2)才能使得试验结果表达式θ⁷ (1-θ)³的值达到最大。注意这一表达式使用的是乘法原理得到的结果。

清楚这个问题以后,我们就可以提出

图二

图三

图四

接下来以一个例子说明:

图五

这个例子中首先要理解其结果为什么是max{xi},这是因为概率密度函数里就规定了θ必须大于所有的x。然后要理解xi和Xi的不同含义。小写的xi代表确定的样本中某个实体所测试到的确定的值,比如一个样本包含10枚硬币,在一次试验中第3枚硬币出现的是正面,则x3=1。而大写的Xi则代表的是任意一个样本,这个样本并没有实际抽取,样本容量也可以无限大。

上面讲的是只有一个参数待求的例子,那如果是两个呢?

图六

下面以三个例子说明。第一个:

图七

图八

第二个:

图九

图十

第三个:

图十一

图十二

注意这三个例子的不同。最大似然估计量是样本的函数,表达式中的Xi均是大写的。若把样本的观测值x1,..., xn带入到统计量的表达式中,得出的就是最大似然估计值。 前者是个随机变量,后者是一个确定的值,没有随机性。因此,第一个例子得出的是估计值。第二、三个得出的都是估计量。那第二个和第三个不同的地方在哪里呢?第二个例子的样本是不确定的,样本观测值x1,..., xn也是未知的,而第三个例子的样本是确定的,样本观测值x1,..., xn也是已知的,因此