AAIG-自然语言理解实验室论文被ACL 2022录用,为更鲁棒可解释的算法服务而努力!
近日,ACL 2022录用结果出炉,AAIG-自然语言理解实验室论文被ACL 2022录用。以下为论文介绍以及实验室介绍:
Prototypical Verbalizer for Prompt-based Few-shot Tuning
类型:Long Paper
摘要:针对预训练语言模型(PLM)的提示微调(prompt-based tuning)在少次学习中十分有效。通常,提示微调会将输入文本包装成填空问题。为了做出预测,这种方法通过一个表达器(verbalizer)将输出的单词映射到标签上。该表达器可以是人工设计的,也可以是自动构建的。然而,人工表达器严重依赖于特定领域的先验知识,而自动寻找合适的标签词仍然是一项挑战,本文提出了直接从训练数据中构建的原型表达器ProtoVerb。
具体而言,ProtoVerb通过对比学习将学到的原型(prototype)向量作为表达器。通过这种方式,原型归纳了训练实例,并且能够包含丰富的类级别语义。我们在主题分类和实体分类任务上进行了实验,实验结果表明,ProtoVerb的性能明显优于现有的自动生成的表达器,特别是在训练数据极其匮乏的场景下。更令人惊讶的是,即使是在未微调的预训练语言模型上,ProtoVerb也能够提升提示微调的性能,这表明ProtoVerb也是一种优雅的非微调预训练模型利用方式。该工作与清华大学刘知远老师团队合作完成。
AAIG-自然语言理解实验室
致力于解决内容风控场景高对抗、强变异的语言理解难题,研究文本分类、文本抽取、文本匹配、文本生成等自然语言理解技术,落地更加鲁棒可解释的算法服务,团队提供技术已服务于集团内电商、直播、视频、新零售、健康、出行、本地生活等各类业务场景,日调用量达百亿级,自主研究成果发表于ACL、EMNLP、IJCAI、SIGIR、WWW等国际顶会,与清华、中科院、浙大、复旦等国内知名高校建立学术合作关系。
2
研究方向
🌟 低资源文本分类
低资源文本分类专注于在仅有少量样本、风险描述的情况下,使新场景新风险下的分类稳定达到可用标准,为各类场景新风险落地提供基本能力。技术方向包括弱监督学习、迁移学习、少样本文本分类、多标签文本分类等。典型的应用场景包括细粒度风险多标签分类、内容场景命中消歧和新分类扩展、新风险内容识别、国际场景新语言新分类扩展。🌟 文本对抗还原
文本对抗还原聚焦对抗图谱的定义和构建和文本对抗的识别等核心技术,识别文本内容中的对抗情况。通过提升对抗图谱的建设能力和文本变异还原能力不断突破技术深度,提升线上风险识别能力和下游业务模型的识别准召。并最终赋能阿里集团商品、交互的内容安全场景和跨语言业务场景,输出对抗生成用于构建科学可信的评测集,建立文本对抗的业界benchmark。🌟 多元信息抽取
多元信息抽取围绕事件抽取、实体抽取、属性情感抽取等核心技术,对来源、形式、结构多样的复杂信息进行抽取,沉淀安全内部关于抽取任务的最佳实践。在各业务点位上,使用任务转换路线的方法,进行创新性探索研究。应用场景包括属性情感计算、漏防数据风险片段抽取、知识自动生产信息抽取、订单地址风险识别、舆情事件结构化等。🌟 基础模型可信评估
基础模型可信评估主要面向基于开发语料得到的大规模预训练模型,避免这类模型自身存在的风险传递给下游任务,主要专注于自动选择和生成评测数据并给出定量指标和统计显著性指标等。技术方向包括了文本生成、虚假新闻识别、情感识别等。在提供内容安全、红线、虚假新闻识别结果的同时输出相关模型的鲁棒性和可解释性指标,确保模型评估的客观性。应用于生成式应用的NLP接口(如文本生成等)和业务模型,对其进行风险检测和鲁棒性与可解释性的定量评估。欢迎23届同学加入AAIG
诚邀自然语言理解与知识图谱方向同学
可直接扫码投递简历
让AI更有益思!一文读懂人工智能训练师: 被国家认可的新职业—《追AI的人》第9期回放
给AI当老师?人工智能训练师让AI更通"人性"!《追AI的人》第9期来咯!
36万人关注的AI治理交互栏目—《追AI的人》年终总结~我们一起向阳成长!
硬核前沿!万字厘清因果推理融入机器学习:浙大况琨《追AI的人》第8期直播回放
2021年最热方向之因果推论能改变下一代AI研发吗?《追AI的人》第8期来咯!
内容风险知识图谱是怎样炼成的:如何应对强对抗下的内容安全挑战?—《追AI的人》第7期直播回放
揭秘阿里安全最神秘的风险知识图谱—《追AI的人》第7期来咯!
缸中之脑详谈:科幻作家和虚拟主播讨论科幻世界中的人工智能伦理—《追AI的人》第6期直播回放
科幻作家眼中的人工智能是什么样的?双翅目带你从科幻视角探究人工智能和伦理道德的关系!《追AI的人》第6期来咯!
全网17万直播观看的PPT公开:准备好进入虚拟世界和数字人共存了吗?—《追AI的人》第5期直播回放
PPT公开:人工智能触犯刑法该如何处罚?责任谁承担?刑法介入人工智能风险规制的慎思!—《追AI的人》第4期直播回放
刑法介入人工智能风险规制的慎思:《追AI的人》直播第4期来咯!
AI好科技(3)AI一眼识别"你算什么鸟"?—《追AI的人》第3期直播回放
低碳AI好科技(2):如何降低超30%的算法调用成本?畅聊多专家结构—《追AI的人》第3期直播回放
低碳AI好科技(1)顶会冠军Writeup:目标检测比赛的常用方法有哪些?—《追AI的人》第3期直播回放
三个学霸的顶会Paper中奖座谈会:《追AI的人》直播第3期来咯!
(下)算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则—《追AI的人》第2期直播回放
算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则(上)—《追AI的人》第2期直播回放
50页!《AI与安全治理的恩怨情仇》PPT快来下载~真香!—《追AI的人》第1期直播回放
这个AI不太冷 往期推荐点击标题查看文章
“算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!
你会和虚拟人谈恋爱吗?「这个AI不太冷」第2期带你了解现实、应用中的虚拟人!
"人工智障",是算法翻车还是人翻车?跨界科普栏目「这个AI不太冷」第1季上线咯!
产业实践 往期推荐点击标题查看文章
AAIG受邀参加护脸计划评审会议,共建人脸识别合规应用的健康生态
AAIG应邀参加CNCC 2021“数字服务的监管与治理”技术论坛
阿里AI黑科技成团出道,可防火防伪防疫还能反诈鉴黄与打假……
阿里建全球最大奢侈品商标数据库:无偿提供给全球科研团队使用识别假货
一场猎杀AI的残酷游戏:把枪口对准人工智能,是为了吓退黑暗丛林中的对手
为AI攻防测能力,清华联合阿里、RealAI发布全新测试基准平台Adversarial Robustness Benchmark
阿里新一代安全架构核心AI技术夺冠,机器阅读理解准确率战胜人工
治理重构,塑造平台经济的健康生态——《中国平台经济健康指数》报告发布
技术干货 往期推荐点击标题查看文章
史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步
给AI系统做“安全体检”,阿里安全提出自动化AI对抗平台CAA | AAAI 2021
给图片打「马赛克」可骗过AI视觉系统,阿里安全新研究入选ICCV 2021
「启发式领域适应」成果入选NIPS2020,新一代算法「鉴黄师」诞生
4项新一代安全架构核心AI技术沉淀的论文被国际会议ICASSP收录
张钹院士解读AI安全治理三大痛点+信通院AI数据安全治理的七条建议
准确检测DeepFake视频,阿里新算法从多个人物中识别被篡改的人脸
阿里AI技术获国际视觉大赛双冠军 “低碳AI”降低30%算力成本
爱心公益 往期推荐点击标题查看文章
“长辈模式”、数字化“养老助餐”、在线医保购药——“饿了么”适老化改造让数字化生活服务更普惠
为数十万盲人修建网络盲道:阿里的追光者每天为数亿张图片把脉,帮助盲人“听图”
AAIG CUP 往期推荐点击标题查看文章
抱大腿攻击是什么?AAIG CUP暨第三届 Apache Flink 极客挑战赛启动!
更多人工智能治理和可持续发展
技术干货+产业实践分享
点击下方名片关注和星标
【阿里巴巴人工智能治理与可持续发展实验室】
关注公众号发现更多干货
👇AAIG课代表,获取最新动态就找他