图模型初识

有向图模型

有向图模型是一种常见的图模型，其核心在于通过定义变量间的关系（如因果关系）来表达业务场景。这种模型通常基于已知的变量关系进行建模，例如：

这种结构不仅表达了变量间的因果关系，还体现了一种先后顺序。基于有向图模型，计算联合概率较为直接。假设我们有以下关系：

则其联合概率可以表示为：

[ p(a, b, c, d, e) = p(a) \cdot p(b) \cdot p(c|a, b) \cdot p(d|c) \cdot p(e|d) ]

这里的条件概率形式符合常识，即左侧为结论，右侧为条件。这一表达方式简洁明了，易于理解和应用。

无向图模型的核心在于变量间的关系并无明确方向性。常见的无向图模型可以通过能量函数或其他 scoring 函数来建模变量间的关联性。例如，图像分割任务可以通过无向图来进行聚类，形成若干簇（模块）。

假设我们有以下无向图结构：

为了计算联合概率，我们需要定义一个能量函数或 scoring 函数，来衡量变量间的紧密度。例如，可以将图分为以下三个簇：

-簇1：a, b, c

-簇2：b, d

-簇3：d, e, f

则联合概率可以表示为：

[ p(a, b, c, d, e, f) = \frac{1}{z} \cdot \phi_1(a, b, c) \cdot \phi_2(b, d) \cdot \phi_3(d, e, f) ]

其中，( z ) 是归一化常数，计算方法根据变量类型而异（如离散型可用动态规划，连续型可用近似方法）。归一化过程至关重要，因为它将 scoring 函数转换为概率。

无向图模型的核心在于如何定义 scoring 函数。例如：

无向图模型的分割块并非固有，而是基于对变量关系的假设。例如，可以将以下结构分解为：

[ p(a, b, c, d, e) = \frac{1}{z} \cdot \phi_1(a, c) \cdot \phi_2(b, c) \cdot \phi_3(a, b) \cdot \phi_4(b, d) \cdot \phi_5(a, c) \cdot \phi_6(f, d) \cdot \phi_7(f, e) ]

无向图模型的应用依赖于对变量关系的深刻理解，通过定义合适的 scoring 函数，可以将复杂的变量关系建模到模型中。

有向图模型采用局部归一化（Local Normalization），因为其概率计算依赖于局部的条件概率。而无向图模型则采用全局归一化（Global Normalization），因为其概率计算涉及所有变量的联合分布。

从模型应用的角度来看，有向图模型更类似于贪心算法，每次只寻求局部最优解。而无向图模型则更全面，考虑了全局关系。

通过初步认识这些图模型，我们可以为后续学习 HMM 和 CRF 模型打下基础。无向图模型的理解尤为重要，因为它与 Logistic Regression 等常见模型密切相关。

转载地址：http://utokz.baihongyu.com/

你可能感兴趣的文章