查看原文
科技

最好最快体验Llama 3.1渠道就是Groq | Llama 3.1 模型发布重点

思辨view kate人不错
2024-07-24

最好最快体验Llama 3.1渠道就是Groq


https://groq.com/


目前405B繁忙中,我用70B试了下,速度很快。

Groq API使用次数给得很大方。


Groq+Llama 3.1 模型详情

Llama 3.1 405B (Preview)

  • Model ID: llama-3.1-405b-reasoning

  • Context Window: 131,072 token

Llama 3.1 70B (Preview)

  • Model ID: llama-3.1-70b-versatile

  • Context Window: 131,072 token

Llama 3.1 8B (Preview)

  • Model ID: llama-3.1-8b-instant

  • Context Window: 131,072 token

预览版限制说明

在预览版发布期间,Groq将所有3.1模型的max_tokens限制为8k,405b模型的输入令牌限制为16k。

当然,Ollama也上线了


https://ollama.com/library/llama3.1

ollama run llama3.1
ollama run llama3.1:70b
ollama run llama3.1:405b


Llama 3.1 模型发布重点总结


1. 核心亮点

  • Meta发布了迄今为止最强大的开源AI模型:Llama 3.1

  • 新模型扩展了上下文长度至128K,支持8种语言

  • Llama 3.1 405B是首个前沿级开源AI模型,能力可与闭源模型相媲美

2. 模型特点

Llama 3.1 405B模型:

  • 世界上最大且最强大的开源基础模型

  • 在通用知识、可控性、数学、工具使用和多语言翻译方面达到最先进水平

  • 能够支持合成数据生成模型蒸馏等新工作流程


从上述数据可以看出:
  • Llama 3.1 405B在多个基准测试中表现优异,特别是在MMLU、IFEval和GSM8K等测试中。
  • 与其他规模的Llama 3.1模型相比,405B版本在所有测试中都表现最佳,显示了模型规模对性能的积极影响。
  • 在人工评估中,Llama 3.1 405B与顶级闭源模型(如GPT-4和Claude 3.5)相比,表现相当,大多数情况下能够达到平局或接近的水平。
  • 特别值得注意的是,Llama 3.1 405B在与Claude 3.5 Sonnet的对比中表现最好,赢率略高于输率。


3. 技术细节

  • 使用超过15万亿个标记进行训练

  • 采用16,000多个H100 GPU进行模型训练

  • 使用标准的仅解码器Transformer架构,而非专家混合模型

  • 通过量化技术,将模型从16位(BF16)降至8位(FP8),降低计算需求

4. 开源与生态系统

Meta致力于开放获取的AI发展:

  • 开源可促进创新,让更多人受益于AI技术

  • 开发者可以完全自定义模型,无需与Meta共享数据

  • 超过25个合作伙伴(如AWS、NVIDIA、Databricks等)提供首日支持服务

5. 安全性与责任

  • 发布Llama Guard 3(多语言安全模型)和Prompt Guard(提示注入过滤器)

  • 进行广泛的红队测试,以评估和缓解潜在风险

  • 采用多轮对齐技术,包括监督微调(SFT)、拒绝采样(RS)和直接偏好优化(DPO)

6. 未来展望

Meta计划进一步探索:

  • 更适合设备的小型模型

  • 额外的模态

  • 对智能体平台层的更多投资

扎克伯格还发表了一封公开信

马克·扎克伯格:开源AI是未来的道路

1. 开源AI的优势

  • 类似Linux的发展模式,开源AI将成为行业标准

  • Llama 3.1 405B是首个前沿级开源AI模型

  • 开源促进创新、降低成本、提高安全性

2. 对开发者的好处

  • 可以训练、微调和蒸馏自己的模型

  • 控制自身命运,不被锁定在封闭供应商中

  • 保护数据安全

  • 运行成本效率高

  • 投资长期行业标准

3. 对Meta的好处

  • 确保获得最佳技术,不被竞争对手的封闭生态系统限制

  • 促进Llama生态系统的发展

  • 符合Meta的开源传统和商业模式

4. 对世界的好处

  • 增加人类生产力、创造力和生活质量

  • 加速经济增长和科研进步

  • 安全和透明

  • 促进全球创新和机会平等

5. 安全性考虑

  • 非故意伤害:开源系统更透明,可被广泛审查

  • 故意伤害:开放部署有助于大型机构检查和制衡小规模不良行为者

  • 开源AI将比替代方案更安全

6. 未来展望

  • Llama 3.1的发布将成为行业转折点

  • 大多数开发者将开始主要使用开源AI

  • Meta致力于建立广泛的合作伙伴关系,推动生态系统发展

Llama 3.1 合作伙伴

生态系统合作伙伴

Llama 3.1的生态系统已准备就绪,超过25个合作伙伴在发布首日就提供服务,包括:

  • AWS

  • NVIDIA

  • Databricks

  • Groq

  • Dell

  • Azure

  • Google Cloud

技术支持伙伴

Meta与关键社区项目合作,以确保社区从第一天起就能进行生产部署:

  • vLLM

  • TensorRT

  • PyTorch

特别优化

  • Groq 为云部署优化了低延迟推理

  • Dell 为本地系统实现了类似的优化

开始使用 Llama 3.1

  • 阅读 Llama 3.1 论文

    https://ai.meta.com/research/publications/the-llama-3-herd-of-models/

  • 访问 Llama GitHub 仓库

    https://github.com/meta-llama/llama-models

    https://github.com/meta-llama/llama-agentic-system

  • 在 Hugging Face 上下载 Llama 3.1

    https://huggingface.co/collections/meta-llama/llama-31-669fc079a0c406a149a5738f

广告时间

过去我已写了150篇AI主题原创长文,我对继续写作充满信心,因为这是我的爱好,我非常热爱这件事。

最近我开通了知识星球,你加入后可以访问公众号收费文章,向我提问,第一时间获取AI资讯。

结语

希望这些工具和技巧能帮助你实现更多创意想法。

别忘了分享你的作品,让我们一起在AI应用开发的道路上共同进步!

欢迎点赞、转发、收藏。

精选历史文章,请看这里:

效率提升N倍!分享我正在使用的AI编程新工具

打造更可靠的 AI :解析 7 种减少幻觉的高效策略

解锁 Claude 3.5 Sonnet 创意潜能:10+ 个 Web 应用实战

Poe x Claude:零代码创建交互式 Web 应用,完整操作带你轻松上手

AI 驱动的网页开发:用 Claude 3.5 Sonnet 打造趣味互动应用并轻松部署

继续滑动看下一个
kate人不错
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存