复旦DISC

其他

ElectionSim:首个大模型智能体驱动的大规模人口选举仿真框架,实现美国总统大选高精度模拟

我们通过训练专用的人口属性标签分类器对大规模社交媒体用户进行标注,通过对目前主流的商用大语言模型API进行多数表决作为训练集,不同属性的分类器都能实现较高的标注准确度:2.3
10月29日 上午 11:00
其他

Agent Tuning | 长短轨迹学习结合的多智能体联调框架

“引言在知识密集型场景中,让智能系统生成与事实一致的响应一直以来都是研究人员的目标。尽管大语言模型(LLMs)在其参数记忆中内化了大量的世界知识,但仍然受限于虚构事实。引入非参数(即基于检索的)记忆知识可以显著增强LLM回复的事实性。但是当前的参数知识增强框架面临着三个主要挑战:(1)
8月17日 下午 2:06
其他

AI Healthcare | 大模型能否胜任临床诊断任务? 交互式医学诊断仿真和评测

所示。这些发现表明,在采用争议解决机制后,在最初四轮讨论中达成共识的比率显著提高。这种改进表明,在主治医师强调有争议问题、医生集中讨论这些问题的促进下,该过程有效地减少了达成共识所需的时间。LLM
7月15日 上午 10:34
其他

论文分享 | NIPS2022 | 图对比学习的新范式和增广方法

引言本次推送将带来两篇关于图对比学习(GCL)的文章,第一篇主要关注于图对比学习能work的原因以及是否存在更为高效的学习范式,第二篇主要关注于在图对比学习中的增广方法。文章概览1、Rethinking
2022年12月16日
其他

论文分享 | ACL 2022 | 如何去除语言模型中的偏见

Adapter使用CDA方法增强数据,并在增强的语料库上训练adapter参数,以打破模型中的刻板印象关联。作者实验了两种adapter的结合方法:AdapterStackingg(Pfeiffer
2022年12月10日
其他

复旦 DISC 原创 | 开放域对话中粗粒度响应选择的上下文细到粗蒸馏

多塔架构为了以低延迟搜索大规模候选者,基于神经的检索器通常设计为(或限于)下图中的多塔式架构。在多塔模型中,查询和候选被不同的编码器独立映射到一个公共向量空间,并计算相似度。在推理阶段,大规模候选的
2022年3月18日
其他

复旦大学数据智能与社会计算实验室推出大规模跨视觉语言模态预训练模型:MVPTR

modeling)作为高层次的语义推断任务。通过在约9M的图片-文本对的语料库上进行预训练,我们的base设定下的MVPTR在下游任务上有着更好的表现。方法介绍MVPTR的模型结构如下图所示:1.
2022年3月4日