关系抽取论文整理,核方法、远程监督的重点都在这里
The following article comes from CSDN云计算 Author Matt_sh
进行二分类检测的理由: Detecting relations is a difficult task for a kernel method because the set of all non-relation instances is extremely heterogeneous, and is therefore difficult to characterize with a similarity metric.
Dependency tree 与 parse tree 对模型的提升有限,原因在于:ACE预料中关系间隔较短,70%以上实体之间的间隔只有一个词。依赖树和解析树特征只能在剩余的远距离关系中发挥作用。然而,尽管我们系统中使用的Collins解析器代表了完全解析的最新技术,但完全解析总是容易出现长距离错误。
某些关系检测与分类会较为困难,比如AT型及其子类的关系。
加入了chunking的结果后,基于特征的方法明显优于核方法。这表明基于特征的方法可以有效地结合来自不同来源(如WordNet和gazetters)的不同特征,从而对关系抽取产生影响。
在误差分布的分析中,结果表明,73%(627/864)的错误源于关系检测,27%(237/864)的错误源于关系表征,其中17.8%(154/864)的错误源于关系类型间的误分类,9.6%(83/864)的错误源于同一关系类型内关系子类的误分类。这说明关系检测是关系抽取的关键。
远程监督关系抽取论文总结https://zhuanlan.zhihu.com/p/39885744
多示例多标签学习http://palm.seu.edu.cn/zhangml/files/cccf09-mil&mll.pdf
深度学习中的MIMLhttps://blog.csdn.net/weixin_41108334/article/details/83048552
【end】
◆
精彩推荐
◆
你点的每个“在看”,我都认真当成了AI