Llama 3 登场：70B 版本超越 Claude 3 Sonnet，探索8大主要使用渠道

Original 思辨view kate人不错

2024-07-24

Meta 推出了新一代开源大型语言模型 Meta Llama 3。这是迄今为止性能最强、功能最全面的开源语言模型。

本周发布的是2个小模型，8B 和 70B 参数，模型支持 8K 上下文长度，是 Llama 2 容量的两倍。

据 Meta 员工透露，最大的 Llama 3 模型将是多模态的，并预计在今年夏天推出。

Llama 3 70B 的性能超过了 Claude 3 Sonnet，但其上下文长度不如后者，且不支持多模态功能。

Llama 3 400B+ 性能

从 MMLU 上来看，Llama 3 400B+ 和 GPT-20230314 的版本近似。

主要亮点

提供了 8B 和 70B 参数规模的预训练和指令微调模型，可支持广泛的应用场景。
在行业标准基准测试中展现出业界领先的性能，尤其在推理、代码生成等能力上有显著提升。
通过改进预训练和后期训练，大幅降低了错误拒绝率，优化了模型一致性，增强了回应多样性。
训练数据规模是 Llama 2 的7倍，代码数据是4倍，质量和覆盖范围大幅提升。
采用了更高效的 tokenizer，128K 词汇量，大幅改善了性能。
引入分组查询注意力机制(GQA)，提高了推理效率。
开发了 Llama Guard 2、Code Shield 等安全工具，加强安全防护能力。

近期规划

发布更大规模的模型，参数量高达 400B+。
引入多语言、多模态、更长上下文等新功能。
持续提升模型整体性能。
发布详细的研究论文。

使用渠道

HuggingChat

https://huggingface.co/chat/

Poe

https://poe.com/Llama-3-70B-T

Perplexity Labs

https://labs.perplexity.ai/

Meta AI

https://www.meta.ai/

Llama 3 为 Meta AI 的新版本提供动力，它是一个跨 Meta 平台（如 Facebook、Instagram、WhatsApp 和 Messenger）的智能助手。该助手能够处理多种任务，范围从生成图像到提供实时信息。

登录后，可以使用画图功能；此外，图片还支持转为视频。

虽然每张图片只能生成一秒钟的视频，但其运动幅度大，动感十足。

Ollama

https://ollama.com/library/llama3

建议拥有16G、32GB 内存的 Mac 电脑用户下载 Llama3 8B 模型，而 64GB 及以上内存的用户则适合使用 70B 模型。

该模型有两个版本：

Instruct
专为聊天/对话用例进行微调的模型
示例命令：ollama run llama3、ollama run llama3:70b
Pre-trained
基础预训练模型
示例命令：ollama run llama3:text、ollama run llama3:70b-text

我本地运行 ollama run llama3 时，中文提问，模型默认回复英文。

建议添加中文回复功能，或在设置中进行相应的修改。

Matt Williams 曾经提到，新模型推出时，你可能无法立即获得正确的配置，可能需要进行一些后续调整。

Ollama 官方上架的模型也存在类似问题，有时问题出在模型本身，有时则是 Ollama 的问题，均需调整。关于如何进行这些调整，推荐观看以下视频：

https://www.youtube.com/watch?v=bXf2Cxf3Wk0

Ollama 的推文指出：如果你在这个模型发布后已经下载了 Llama 3，请使用 ollama pull 命令更新模型。

LM Studio

将 LM Studio 更新至版本 0.2.20。
从 lmstudio-community 下载 Llama-3 模型。

Together AI

https://api.together.xyz/playground/chat/meta-llama/Llama-3-70b-chat-hf

Llama 3 8B 模型能够每秒处理高达 350 个令牌，而 Llama 3 70B 模型每秒能处理高达 150 个令牌。这两个模型均在 Together API 上运行，使用全 FP16 精度。

Llama-3 还可在 Together AI 上进行微调。

https://docs.together.ai/docs/fine-tuning-cli

OpenRouter

https://openrouter.ai/models/meta-llama/llama-3-70b-instruct?tab=status

本周使用 LLaMA v3 70B 指令模型的热门应用程序

此外，Llama 3 模型也将在多个平台上推出，包括 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake。

https://llama.meta.com/docs/model-cards-and-prompt-formats/meta-llama-3

Llama Recipes

https://github.com/meta-llama/llama-recipes

结语

随着 Llama 3 的推出，我们期待在此基础上开发的中文模型将为中文用户提供更智能、更高效的体验。

春风吹醒数据梦，智能新章待展宏。Llama耕耘识海广，中华语境绘未空。

精选历史文章，请看这里：

体验 Command R+：功能强大的大型模型，支持联网、文件分析及类 Perplexity 搜索功能，提供试用 API key

Copilot Pro 现在可以免费试用一个月 | 使用分享

Claude 3 深度探索：从提示技巧到高级 API 使用指南

探索新Ollama Python库：在应用程序中集成本地LLM

修改于

继续滑动看下一个

kate人不错

向上滑动看下一个

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

突发！宜兴一学校发生持刀伤人案件！致8死17伤！太恶劣了！

一小学门口突发！多名学生被撞伤！

Llama 3 登场：70B 版本超越 Claude 3 Sonnet，探索8大主要使用渠道

Llama 3 400B+ 性能

主要亮点

近期规划

使用渠道

HuggingChat

Poe

Perplexity Labs

Meta AI

Ollama

LM Studio

Together AI

OpenRouter

Llama Recipes

结语

您可能也对以下帖子感兴趣

常德悲剧：让谴责无差别杀戮之声更加响亮一点

魏加宁：日本之所以能走出“大衰退”，靠的是不断改革，而不是所谓“积极的财政政策”

泪目！8死17伤！江苏一职校持刀伤人案，背后隐情令人心惊！

突发！宜兴一学校发生持刀伤人案件！致8死17伤！太恶劣了！

一小学门口突发！多名学生被撞伤！

生成图片，分享到微信朋友圈

Llama 3 登场：70B 版本超越 Claude 3 Sonnet，探索8大主要使用渠道

Llama 3 400B+ 性能

主要亮点

近期规划

使用渠道

HuggingChat

Poe

Perplexity Labs

Meta AI

Ollama

LM Studio

Together AI

OpenRouter

Llama Recipes

结语

您可能也对以下帖子感兴趣