思必驰在中文文本相似度计算任务上的探索与进展

Original AISpeech 思必驰 2023-05-12

文本相似度计算旨在识别两段文本在语义上是否相似，是自然语言处理领域的一个重要研究方向，其在智能问答、信息检索等领域都发挥重要作用，具有很高的商业价值。

近期，思必驰知识服务团队在中文文本相似度计算方向投入研究，并取得阶段性成果：

1）在第十四届全国知识图谱与语义计算大会（CCKS: China Conference on Knowledge Graph and Semantic Computing）[1]上发表相关论文一篇《Neural Fusion Model for Chinese Semantic Matching》。

该会议是国内知识图谱、语义技术、链接数据等领域的核心学术会议，聚集了知识表示、自然语言理解、知识获取、智能问答、链接数据、图数据库、图计算、自动推理等相关技术领域的和研究人员的学者和研究人员。

2）在“千言数据集：文本相似度”评测[2]中取得阶段性进展。该评测的文本相似度数据集包括公开的三个文本相似度数据集，分别为哈工大（深圳） LCQMC 、 BQ Corpus和谷歌的 PAWS-X（中文）。目前，思必驰知识服务团队在三个数据集上均暂列第一。

针对中文文本相似度计算的鲁棒性和泛化性问题，思必驰知识服务团队在以下几个方面开展了技术研究：1）针对中文特点的字、词融合编码器；2）基于预训练模型的领域自适应训练；3）目标应用领域导向的多阶段模型微调。相关技术实现在上述公开评测中得到了应用和验证。
语言智能常被称为人工智能皇冠上的一颗明珠。在未来，思必驰知识服务团队将继续深耕认知智能领域，在面向通用领域的文本相似度计算基础上，打造领域自适应的文本相似度计算系统，推动文本相似度在垂直领域的应用和发展。

参考文献：[1] 第十四届全国知识图谱与语义计算大会（CCKS: China Conference on Knowledge Graph and Semantic Computing）http://sigkg.cn/ccks2020/
[2] 千言数据集：阅读理解公开评测https://aistudio.baidu.com/aistudio/competition/detail/45

—如有合作意向，请发邮件—

marketing@aispeech.com

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

思必驰在中文文本相似度计算任务上的探索与进展

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

生成图片，分享到微信朋友圈

思必驰在中文文本相似度计算任务上的探索与进展

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡