其他
火山引擎吴迪:火山方舟加速大模型和大算力应用落地
6月28日,2023火山引擎V-Tech体验创新科技峰会上,火山引擎正式发布“火山方舟”大模型服务平台。
火山引擎智能算法负责人、火山方舟负责人吴迪以《绽放·共赢,“火山方舟”大模型平台启航》为主题进行演讲,深度阐释了火山引擎大模型理念,解读“火山方舟”的功能特点,为模型提供方以及模型使用方带来全新价值。
01
大模型百花齐放,“火山方舟”启航
第一部分是大模型的提供商和研究机构,将为各行业提供极具竞争力的通用基座模型或垂直模型;
第二部分是大量颇具技术能力的公司,一方面会保持自研自用的模型训练投入,另一方面也会调用若干商用模型,落地到业务的不同场景;
第三部分是以大模型应用为主的各行各业,他们会把大模型能力深入到诸多细分场景,在提升自身经营效率的同时,把大模型的能力渗透到我们生活的方方面面。
大模型即将出现第二条增长曲线(勘误:模型训练为紫色,模型应用为蓝色)
“火山方舟”加速大模型市场正向循环
模型广场,模型提供方提供了不同版本、不同尺寸的模型,客户可以直接与其交互,获得直观体验。也可直接调用推理API,接入生产环境。这是一条敏捷的短链路,适合进行快速分析和业务A/B实验,让算法工程师和业务团队不断缩短从新想法到试一试的距离。
模型评估,用好大模型首先要确定业务需求,并为之设计一套可量化的评估指标。在不断对比、评估、试验的过程中,积累评估数据。快速迭代,为多样化的业务场景挑选不同的、最合适的模型。
模型精调,对于一些要求较高的垂直场景,客户可能需要利用自有数据或领域的非公开数据进行持续训练,并且建设和积累自己的精调数据集,同一条精调数据集对多个基座模型同时发起精调任务,同时进行自动化评估,精调的效果和运行指标均能在平台实时跟踪。对于精调良好的运用,小模型在特定工作上的表现可能接近通用大模型的水平,由此也可以进一步降低推理成本。
02
三类互信技术,促进互信共赢
安全沙箱,通过计算隔离、存储隔离、加密、私有的逻辑通信链路以及共同的流量审计,确保安全沙箱只能向模型使用方传递response,杜绝任何人进入沙箱或从沙箱中向外泄露数据的可能性。
硬件支持,未来将基于硬件的可信计算环境进行方案加固,其中既有结合CPU的TEE技术,也有基于英伟达H800、H100的可信计算技术。
联邦学习,经过多年发展的联邦学习技术将在大模型领域发挥重要价值,其主要通过对数据资产的拆分来获取大模型提供方和使用方的信任。模型使用方和提供方之间,传递的是机器学习的中间结果。这一技术火山引擎还在与合作伙伴进行进一步的研究。
03
持续优化,推动大模型应用落地
首先是插件,基于基座模型的理解能力和规划能力,配合适当的工具链,今天,很多大模型已经具备操作插件和接口的能力。“火山方舟”将提供大量插件,并且会为各插件配套一个数据集,来告诉不同基座模型如何正确地与之交互。
其次是领域模型的微服务网络,在未来通用基座模型将更好地完成多模态任务,但目前来看,领域模型和大语言模型将需要密切配合,以完成一些复杂工作。因此在“火山方舟”平台上将构建一个由领域模型组成的微服务网络,内置包括图像分割、语音识别等众多专业模型,供中央处理器随时调用。
技术在飞速发展, 模型和工具链层出不穷。“火山方舟”希望能够帮助模型使用方做好核心重要的事情,以不变应万变,紧追时代趋势。“火山方舟”也将努力帮助模型提供方更快地触达海量客户,降低规模化ToB过程中的开销和成本。同时,信任和安全也是“火山方舟”密切关注的事情,一个可依赖的环境会促成更多合作,激发模型应用的创造力。
欢迎关注