查看原文
其他

“生成式信息检索”互联网基础技术研讨会举办

伏羲智库
2024-10-08



6月3日,数字发展论坛·互联网基础技术研讨会在伏羲智库举行。中国科学院计算技术研究所副研究员、阿姆斯特丹大学访问学者张儒清以“生成式信息检索”为题作主旨报告。计算所互联网基础技术实验室研究生及伏羲智库数字化转型实验室相关研究人员参会,计算所助理研究员彭博韬博士主持会议。

张儒清在报告中介绍了信息检索的发展历程、生成式信息检索的概念,以及如何将生成式模型应用于信息检索任务。传统的信息检索流程存在构建复杂、优化困难和能效低下等问题,为改善现有检索系统的局限性,研究人员开始探索将信息检索任务形式化成一个序列到序列的学习任务(如输入为查询词序列,输出为文档标识序列),提出了生成式检索模型。这类模型通过单一模型处理信息编码、检索和排名,大幅降低了检索的时空复杂度。

张儒清介绍,其团队研发的CorpusBrain项目是一个为知识密集型语言任务设计的预训练生成式检索模型,通过特定的预训练任务学习文档和查询间的语义关系,可以在多个基准数据集上取得优异性能。其团队还研发了统一生成式检索器(UGR),提高了生成式检索模型的异构任务适应性。最后,张儒清介绍了生成式信息检索研究目前存在的挑战,并对未来的研究方向提出了展望,期待能进一步推动生成式信息检索的发展和应用。

在会后讨论中,参会人员围绕生成式信息检索的应用、性能优化和生成式人工智能的具体任务应用等问题展开探讨。

 


互联网基础技术研讨会由中国科学院计算所互联网基础技术实验室和伏羲智库数字化转型实验室主办,系行业“数字发展论坛”的有机组成部分,聚焦互联网基础设施领域的关键技术展开探讨。







  END  

注:文章来源于伏羲智库,敬请关注后续话题。另现围绕数字治理、数字发展领域,向广大业内资深撰稿人约稿,投稿邮箱:pr@fxzk.org,欢迎洽谈。


继续滑动看下一个
伏羲智库
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存