专知 | 自由微信

专知

适配还是提示？微软最新《通用大模型是否超过专业领域微调大模型》论文，GPT-4多种策略提示超越医学大模型

通用基础模型，如GPT-4，在多种领域和任务中展现出了惊人的能力。然而，普遍的假设是，它们在没有对专业知识进行密集训练的情况下，无法匹敌专家的能力。例如，迄今为止在医学能力基准测试上的大多数探索都利用了领域特定的训练，如BioGPT和Med-PaLM的努力就是典范。我们在之前的研究基础上，探讨了GPT-4在没有特殊训练的情况下对医学挑战基准的专家能力。与为了突出模型开箱即用能力而故意使用简单提示不同，我们进行了系统的提示工程探索，以提升性能。我们发现，提示创新可以解锁更深层次的专家能力，并展示出GPT-4在医学问答数据集上轻松超越之前的领先成果。我们探索的提示工程方法具有通用性，不需要特别使用领域专家知识，从而消除了对专家策划内容的需求。我们的实验设计严格控制了在提示工程过程中的过拟合。我们引入了基于多种提示策略组合的Medprompt。Medprompt大幅提升了GPT-4的性能，在MultiMedQA套件中的全部九个基准数据集上都达到了最新的成果。该方法以数量级更少的模型调用次数，大幅超越了如Med-PaLM

2023年12月4日

其他

【干货书】无穷维统计模型的数学基础，705页pdf

在非参数和高维统计模型中，经典的高斯-费舍尔-勒卡姆关于最大似然度和贝叶斯后验推断的最优性理论并不适用，过去的几十年里已经发展出了新的基础和理念。这本书对无限维参数空间中的统计理论提供了一个连贯的描述。数学基础包括对高斯过程和经验过程理论、近似与小波理论以及函数空间基础理论的自足的"迷你课程"。在此模型中的统计推断理论

2023年10月24日

其他

【EPFL博士论文】统计学习问题的基本限制:块模型和神经网络，183页pdf

本论文聚焦于两个选定的学习问题：1）图模型上的统计推断；2）神经网络上的梯度下降，共同的目标是定义和分析表征基本限制的度量。在论文的第一部分，我们考虑了图上的自旋同步问题，该问题包括基于图边缘上它们的交互的噪声观察来重构图顶点上的n个独立自旋的向量。特别是，我们考虑了带擦除（BEC）边信息的同步模型，在这些模型中，一小部分节点的自旋被揭示，并研究了这样的边信息如何影响远距离位点上的自旋的相关性。我们表明，在树上，当边缘观察给出的远距离位点上的自旋几乎是独立的时，那么给出边缘观察和边信息的自旋仍然几乎是独立的。我们推测这对任何图都适用。另一方面，（Kanade等人，2014）推测，在正规树和Galton-Watson树上，只要揭示了任何小部分节点标签，无穷深度处的边界就无法检测到根位，即使在重构范围内也是如此。我们解释了这如何用于计算具有两个对称社区的稀疏随机块模型（SBM）的极限熵。最后，我们表明，后一推测不适用于每一棵树。在论文的第二部分，我们考虑了用全连接神经网络上的梯度下降（GD）学习布尔目标函数的问题。我们引入了一个概念，即神经网络在初始化时与目标函数之间的“初始对齐”（INAL），并证明如果网络和目标在初始时没有显著的INAL，那么在具有i.i.d.

2023年9月26日

其他

大模型如何做个性化？中科大等最新《当大型语言模型遇到个性化》综述，详述大模型与个性化的挑战与机遇

大型语言模型的出现标志着人工智能领域的一次革命性突破。得益于前所未有的训练规模和模型参数，大型语言模型的能力得到了显著提升，从而在理解、语言合成和常识推理等方面达到了与人类相似的表现。这种在通用AI能力上的重大飞跃将从根本上改变个性化服务的实施模式。首先，它将改变人类与个性化系统之间的交互方式。大型语言模型不再是像传统的推荐系统和搜索引擎那样的被动信息过滤介质，而是为主动用户参与提供了基础。在这样一个新的基础上，可以主动探索用户的请求，并以自然、互动和可解释的方式提供用户所需的信息。其次，它还将大大扩展个性化服务的范围，使其从仅仅收集个性化信息发展到提供个性化服务的复合功能。通过利用大型语言模型作为通用界面，个性化系统可以将用户的请求编译为计划，调用外部工具（例如搜索引擎、计算器、服务API等）的功能来执行这些计划，并整合这些工具的输出，完成端到端的个性化任务。如今，大型语言模型仍在快速发展，而在个性化应用中还大都未被探索。因此，我们认为现在是时候审视个性化服务的挑战以及用大型语言模型来解决它们的机会了。特别是，我们在这篇展望性论文中专门讨论了以下几个方面：现有个性化系统的发展和挑战、大型语言模型新出现的能力，以及如何利用大型语言模型进行个性化的潜在方法。https://www.zhuanzhi.ai/paper/325807b835937e4e1b068dc515b57c26大型语言模型的出现[1]在理解人类表达方面显示出了显著的进步，深刻地影响了AI社区。这些模型配置了大量的数据和大规模的神经网络，展示了在理解人类语言和生成与我们相似的文本方面的卓越能力。其中的能力包括推理[2]、少次学习[3]以及在预训练模型中融合大量的世界知识[1]。这标志着人工智能领域的一个重大突破，导致了我们与机器互动的革命。因此，大型语言模型在从自然语言处理和机器翻译到创意内容生成和聊天机器人开发的各种应用中都变得不可或缺。特别是ChatGPT的推出，受到了人类社区的广泛关注，促使人们反思大型语言模型的变革力量及其推动AI能够达到的界限的潜力。这种颠覆性的技术承诺改变我们在无数领域与AI的互动和利用方式，为创新打开了新的可能性和机会。随着这些语言模型继续进步和发展，它们有望塑造人工智能的未来，使我们能够探索未知领域并在人机合作中发掘更大的潜力。个性化，即根据个人喜好量身定制体验的艺术，是连接人类与机器之间差距的一个关键且动态的纽带。在当今的技术驱动世界中，个性化在增强用户与各种数字平台和服务的互动和参与中起到了关键的作用。通过适应个人的偏好，个性化系统赋予机器满足每个用户独特需求的能力，从而使互动更为高效和愉快。此外，个性化不仅仅是内容推荐；它涵盖了用户体验的各个方面，包括用户界面、交流风格等。随着人工智能的不断进步，个性化在处理大量互动和多样化的用户意图方面变得越来越复杂。这要求我们开发更先进的技术来应对复杂的场景，提供更加愉快和满意的体验。对改进个性化的追求是由希望更好地了解用户并满足他们不断变化的需求的愿望驱动的。随着技术的发展，个性化系统很可能会继续演变，最终创造出一个人机交互无缝融入我们生活的每一个方面的未来，为我们的日常生活提供个性化和量身定制的体验。大型语言模型，凭借其深入和广泛的能力，有潜力革命化个性化系统，改变人类的互动方式并扩大个性化的范围。人机之间的交互不再仅仅可以被分类为主动和被动，就像传统的搜索引擎和推荐系统一样。然而，这些大型语言模型不仅仅是简单的信息过滤，它们还提供了多样化的附加功能。具体来说，系统会主动和全面地探索用户的意图，使用户和系统之间能够通过自然语言进行更直接和无缝的沟通。与依赖于抽象且难以解释的基于ID的信息表示的传统技术不同，大型语言模型能够更深入地理解用户的确切需求和兴趣。这种更深入的理解为更高质量的个性化服务铺平了道路，以更精细和有效的方式满足用户的需求和偏好。此外，通过大型语言模型的能力，各种工具的整合得到了极大的增强，大大扩展了个性化系统的可能性和应用场景。通过将用户需求转化为计划，包括理解、生成和执行它们，用户可以访问各种各样的信息和服务。重要的是，用户并不知道后台发生的复杂转换过程，因为他们体验到的是一个无缝的端到端模型。从这个角度来看，大型语言模型在个性化方面的潜力尚未被充分探索。本文探讨了个性化中的挑战，并探索了使用大型语言模型的潜在解决方案。在现有的相关工作中，LaMP

2023年8月9日

其他

黑盒模型如何透明化？MIT博士论文《黑盒模型的可解释性和透明性技术》，207页pdf阐述可信赖机器学习路径

过去的十年见证了机器学习在诸多领域（如医疗保健、金融和司法）的巨大进步。然而，近年来的技术进步主要依赖于深度神经网络，这种网络的不透明性阻碍了人们对这些模型的检查能力。此外，一些法律要求正在提议，要求在部署和使用模型之前必须先理解模型。这些因素推动了提高这些模型可解释性和透明度的研究。本论文在这个方向上做出了一些贡献。首先，我们对当前用于定义和评估模型预测解释的技术进行了简洁而实用的概述。然后，我们观察到各种可解释性概念的定义和评估之间存在一种新颖的对偶性，并提出了一种新的生成解释的方法，研究了这些新解释的属性。接下来，我们详细研究了良好解释的两个基本属性：正确性

清华女神，34岁的美女博士县长，辞职了

豆瓣9.7！鲁迅赞叹不已、余华为它失眠，看完后劲太大···

“湿冷魔法”攻击！鸟家三合一冲锋衣、羽绒服、软壳裤帮你抵挡

故宫蛇年限定款藏书票，错过再等12年！

贴脸开大！小呆呆爆后台收入，撕X舞帝！热度暴涨，爆数据阿哲打开公域流量！停播降热度！

专知