查看原文
其他

Meta开源Llama 2,大模型从“iPhone时刻”走到“安卓时刻”?

宋婧 中国电子报 2024-01-09
这两天,大模型混战再起波澜。Meta公布最新大模型Llama 2,包含70 亿、130 亿和 700 亿三种参数类型,可免费用于商业或者研究。同时,Meta 宣布与微软云服务Azure 合作开发基于Llama 2 模型的云服务,将进一步加速生成式人工智能技术的普及和大模型相关应用的落地。此外,高通也宣布与Meta合作,优化Llama 2在移动终端的执行。未来,Llama 2有望应用于各种领域,包括智能手机、汽车座舱和物联网终端等。此次开源,被认为是大模型发展的又一个“里程碑”,引发业界高度关注。

据介绍,相比于Llama 1 预训练模型1.4 万亿的训练token 数,Llama 2 预训练模型的训练数据提升了40%至2 万亿,且针对聊天用例进行的Chat 模型精调训练数据超过100 万人类标记数据,使用人类反馈进行强化学习从而提高模型安全性。此外,对于大模型非常重要的上下文长度限制,Llama 2 比Llama1 翻了一倍至4096 字符,能处理更多信息。Llama 2 模型在大多数基准测试中表现优于其他开源模型,包括编码、推理、知识、精通性测试等。不仅如此,Meta对实用性和安全性进行评估,认为Llama 2 有希望成为闭源模型的替代品。
目前,Meta已在GitHub上开源了Llama 2预训练模型的代码和参数,并允许研究人员进行探索。同时,Meta也开放了Llama 2的商业使用许可,为基于Llama 2的大模型产品的涌现打开了大门。业内专家普遍认为,Llama 2 开放开源免费使用,将加速大模型生态构建。
Meta CEO马克·扎克伯格将Llama 2称为大模型的“次世代”产品。他表示:“这是我们开源大语言模型的下一代产品。开源推动了创新,因为它让更多的开发者能够使用新技术。同时,软件开源意味着更多的人可以审查它,识别并修复可能存在的问题,从而提高了安全性。我相信如果生态系统更加开放,将会释放更多的进步,这就是我们开源Llama 2的原因。”
美国斯坦福大学基金会模型研究中心主任Percy Liang 表示,像Llama 2 这样强大的开源模型会对 OpenAI 构成相当大的威胁。尽管Meta 在其研究论文中承认,Llama 2 仍与GPT-4 存在较大的性能差距。“但对于许多应用场景来说,你不需要 GPT-4。”Percy Liang 表示,相较于一个庞大、复杂的专有模型,一个更可定制、更透明的模型——比如Llama 2,可能会帮助公司更快地创造产品和服务。
据了解,目前已有不少企业正在考虑将基础模型替换为Llama2。Meta副总裁、人工智能部门负责人杨立昆公开表示,Llama 2将改变大语言模型市场的格局。“Meta此次推出开源且可商业化的Llama 2大模型,背后的目的其实是为了建立一个类似安卓这样的开放的生态系统。”一位大模型创业公司的专家对记者分析说道:“以开源的方式吸引大批开发者,建立生态系统,不仅能让Llama2实现快速迭代,还能帮助Meta借此机会建立自己的技术壁垒,在目前的模型之争中抢占优势。不过这并不容易,最终生态是否能够成功搭建起来,还是要看市场和用户的选择。”
值得一提的是,一些大模型普遍面临的问题在Llama2上依然存在。比如Meta 没有公布用于训练 Llama 2 的数据集的信息,也不能保证其中不包含受版权保护的作品或个人数据。另外,Llama 2 同样存在产生虚假事实和攻击性语言的倾向等问题。
不过,如果将GPT的诞生比作大模型的“iPhone时刻”,那么这次Meta Llama 2的开源无疑将成为大模型的“安卓时刻”。曾经,开源让安卓阵营得以与iPhone分庭抗礼。今天,开源究竟能否让大模型走向生态开放的新阶段,让我们拭目以待。
延伸阅读:
我国首个开源桌面操作系统“开放麒麟1.0”正式发布
工信部:将加快推进开源体系建设


作者丨宋婧
编辑丨赵晨
美编丨马利亚
监制丨连晓东

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存