词汇化概率上下文无关文法 Lexicalized PCFGs

  • 更新时间: 2016-09-10
  • 来源: 原创或网络
  • 浏览数: 47次
  • 字数: 4144
  • 发表评论

PCFGs:Probabilistic Context-Free Grammars

Lexicalized PCFGs:Lexicalized Probabilistic Context-Free Grammars

1 PCFGs的缺点

1)对词汇信息不敏感:句法树只和POS有关,和句子中的单词无关;无法在使用相同规则的句法树中择优;

2)对结构偏好不敏感:有些结构更倾向于就近结合。如(president (of ((a company) in Africa))),in Africa倾向于和a company结合,而非和president结合

2 树库词汇化

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

词汇化之后

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

NP中的词汇化规则:

如果规则右侧含有NN,NNS,或NNP,则选择最右的NN,NNS,或NNP;

否则,如果规则中含有NP,则选择最左NP;

否则,如果规则中含有JJ,则选择最右JJ;

否则,如果规则中含有CD,则选择最右CD;

否则,选择最右的孩子。

VP中的词汇化规则:

如果规则右侧含有Vi或Vt,则选择最左的Vi或Vt;

否则,如果规则中含有VP,则选择最左VP; 否则,选择最左的孩子

3 Lexicalized PCFGs中的参数估计

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.comhead在最左

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.comhead在最右

h是head的简写,m是modifier的简写

例子:词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

定义符号如下:

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

规则的概率为

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

等价于

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

平滑后:

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

最终可得:

词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com

平滑之后使模型更具健壮,具有鲁棒性(robust)。

4 解码

CKY算法解码,复杂度比PCFG要高。

PCFGs:词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com,CKY解码

Lexicalized-PCFGs:词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com,CKY解码

Ulabeled Dependency Parsing:词汇化概率上下文无关文法 Lexicalized PCFGs,by 5lulu.com动态规划(Jason Eisner)


标签: 解码 vi vp np

我来评分 :6
0

转载注明:转自5lulu技术库

本站遵循:署名-非商业性使用-禁止演绎 3.0 共享协议