概率上下文无关文法

  • 更新时间: 2016-09-10
  • 来源: 原创或网络
  • 浏览数: 45次
  • 字数: 2554
  • 发表评论
PCFG(Probabilistic Context Free Grammar),概率上下文无关文法,或称为SCFG(Stochastic Context Free Grammar),随机上下文无关文法。

随机上下文无关文法(Stochastic context-free grammar),即在上下文无关文法中,为每一个产生式规则赋予一个概率,标示应用一个产生式规则的可能性。

1 定义

一个概率上下文无关文法(PCFG)是一个五元组(N,∑,S,R,P):

(1)一个非终结符集N

(2)一个终结符集∑

(3)一个开始非终结符S∈N

(4)一个产生式集R

(5)对于任意产生式r∈R,其概率为P(r)

PCFG是CFG的扩展,PCFG的规则表示形式为:A→α p,其中A为非终结符,p为A推导出α的概率,即p=P(A→α),该概率分布必须满足如下条件:

∑P(A→α)=1

也就是说,相同左部的产生式概率分布满足归一化条件。

分析树的概率等于所有使用规则概率之积。

2 三个假设条件

(1)位置不变性(place invariance):子树的概率不依赖于该子树所管辖的单词在句子中的位置;

(2)上下文无关性(context-free):子树的概率不依赖于子树控制范围以外的单词;

(3)祖先无关性(ancestor-free):子树的概率不依赖于推导出子树的祖先节点。

3 三个基本问题

(1)给定一个句子,估计产生句子的概率;

(2)在语句句法结构有歧义的情况下,如何快速选择最佳的句法分析

(3)如何从语料库中训练文法的参数。


标签: 文法 r 概率

我来评分 :6
0

转载注明:转自5lulu技术库

本站遵循:署名-非商业性使用-禁止演绎 3.0 共享协议