Language Is Not ALL You Need && 知识图谱的两种应用
引言
最近的研究成果表示,大型的自然语言模型不仅能应用到自然语言处理,还可以应用到图像等方向。为此今天给大家分享的第一篇叫做「Language Is Not ALL You Need」,「作者将提出了一种多模态大型语言模型」,该模型可以处理文本/图像任务。另外第二篇和第三篇,作者「从知识图谱(KG)出发,分别将其应用到下游任务结合和QA问答中」,并且都取到了不错的效果。(本文分享论文可以后台回复:20230320 获取,另外您也可以在文末直接复制连接进行自行下载。如果觉得对您有用,点个赞吧,感谢
Language Is Not ALL You Need
实验结果表明,Kosmos-1 在 (i) 语言理解、生成,甚至无 OCR NLP(直接输入文档图像),(ii) 感知语言任务,包括多模态对话、图像字幕、视觉问题等方面取得了令人印象深刻的表现 回答,以及 (iii) 视觉任务,例如带有描述的图像识别(通过文本指令指定分类)。我们还表明,MLLM 可以从跨模态迁移中受益,即将知识从语言迁移到多模态,以及从多模态迁移到语言。此外,我们还引入了一个 Raven IQ 测试数据集,用于诊断 MLLM 的非语言推理能力。
知识图谱(KG)表示融合。
在三个任务(三分类,零样本图像分类和问题回答)上评估预训练的KGTransformer。KGTransformer始终比专门设计的任务模型获得更好的结果。通过实验,我们证明了预先训练的KGTransformer可以作为一个通用的、有效的KRF模块,用于与KG相关的任务。
基于知识图谱的QA
实验发现,与之前使用完整训练数据集或其中很大一部分的方法相比,该模型可以用不到1%的训练数据回答测试数据集中的所有问题,准确率为100%。
论文&&源码
Paper1:https://arxiv.org/pdf/2303.03922v1.pdf
Code:https://github.com/zjukg/kgtransformer
Paper2:https://arxiv.org/pdf/2303.02206v1.pdf
Code:https://github.com/navidmdn/logic_based_qa
Paper3:https://arxiv.org/pdf/2303.07992v1.pdf
Code:https://github.com/microsoft/unilm
推荐阅读
[1] NLP你必须要知道的 “ 十二个国际顶级会议 ” !
[3] NLP不断突破界限,2023 十篇必读的顶级NLP论文!
[5] 如何评估ChatGPT回答复杂问题的能力(开源)