其他
Groq API 使用指南:无需申请即可体验,从速率限制到模型参数解析
之前我介绍过Groq,详见Groq技术新突破:Mixtral 8x7B模型实现每秒500个tokens的生成速度。
Groq发布后,我立即提交了API申请,并很快收到了一封需等待的邮件回复。
近期,我注意到越来越多的用户开始使用Groq API。这促使我登录Groq官网进行查看,结果发现如今使用Groq API已无需申请。
https://wow.groq.com/
Groq API 现在还未收费,但是有速率限制。
Groq Playground
https://console.groq.com/playground
可调整参数
Groq API 文档内容详细。
https://console.groq.com/docs/quickstart
import os
from openai import OpenAI
# 从环境变量中获取API密钥
api_key = os.getenv('GROQ_API_KEY')
# 设置自定义的基础URL
base_url = "https://api.groq.com/openai/v1"
# 创建OpenAI客户端
client = OpenAI(api_key=api_key, base_url=base_url)
# 创建聊天完成请求
response = client.chat.completions.create(
messages=[
{"role": "system", "content": "你是一个有帮助的助手。"},
{"role": "user", "content": "光速是多少?"},
{"role": "assistant", "content": "在真空中,光速约为每秒299,792公里。"},
{"role": "user", "content": "什么是相对论?"},
{"role": "assistant", "content": "相对论是爱因斯坦提出的物理理论,主要分为狭义相对论和广义相对论。狭义相对论主要讨论在没有重力作用的情况下,物体的运动和时间、空间的关系;广义相对论则扩展到了引力场的影响,提出了时空弯曲的概念。"},
{"role": "user", "content": "爱因斯坦的质能等价公式是什么?"}
],
model="mixtral-8x7b-32768",
temperature=0.5,
max_tokens=2048,
top_p=1,
stop=None,
stream=False,
)
# 打印响应的第一个选择的消息内容
print(response.choices[0].message.content)
根据之前解释的temperature和top_p的概念,将temperature设置为2,top_p设置为1,执行后的输出文本出现混乱。
Groq的官方网站提供了一系列示例,供参考使用。
Groq的API为开发者提供了一个高效且兼容性强的工具,使得在各种应用场景下实现高质量的文本生成变得更加便捷。
通过对Temperature、Top-p等参数的灵活调整以及对停止序列的有效应用,用户可以精细控制生成内容的质量和风格。
我相信随着Groq API的不断优化和更新,未来它将为AI领域的创新应用带来更多可能性。
精选历史文章,请看这里:
AI-Typing-Assistant:借助大模型的打字助手,本地运行,安全,可定制
Mac 用户的 RAG 交互:通过 Chat-with-MLX 与数据对话
Mistral Large 亮相,仅次于 GPT-4 ,介绍+API 使用
实测在Mac上使用Ollama与AI对话的过程 - 模型选择、安装、集成使用记,从Mixtral8x7b到Yi-34B-Chat