Claude 3 深度探索:从提示技巧到高级 API 使用指南
之前我写过比 GPT-4 强!Claude 3 Opus 模型发布,推荐给刚了解Claude 3的读者看下。
Claude 注册和实测,公众号平台已有很多文章了,今天来分享下个人用户深入使用 Claude 3 和 API 需要了解的信息。
使用 Claude3 最方便的渠道是 Poe。(支持图片上传和文字对话)
https://poe.com/
Claude.ai 内容审核严格。
而 Poe 里的 Claude 3 可以。
而且可以把链接直接发给 Poe 里的 Claude 3,它会基于链接里的正文信息给到回复,而 Claude.ai 大多不支持。这一点,我在已是ChatGPT会员,为何还充值Poe,我的深度使用分享里详细介绍过。
此外,使用 Claude 官网太费心,比如收到提示:1)Your account has been disabled after an automatic review of your recent activities.2)This organization has been disabled。
Claude 能力
Anthropic 官方提供了详细的提示库,比 OpenAI 要丰富很多。
🔼OpenAI
🔼Anthropic
https://docs.anthropic.com/claude/prompt-library
总共63个主题,值得在 Anthropic 官网好好看下详情。
上文提示技巧里提到使用 XML 标签,这对 Claude 非常重要。
我非常看好 Claude 3 Haiku API 的推出,因为 Claude 3 Haiku 支持文字和图像,比 GPT 3.5 便宜,性能和上下文长度支持比 GPT 3.5 好很多。
Claude 3 系列模型区别
OpenAI 模型价格
GPT 只有4才支持视觉功能,Claude 3 的3个模型都支持,如果只用 Claude 3 Haiku 的话,视觉识别成本低,非常适合简单任务。
Claude 3的图片识别能力如何,简单实测下,用的是 Claude 3 Sonnet 模型。
🔼原图片文字是井柏然写的
识别手写的中文能力不行。
但 Claude 官方特别发布了一个关于 Claude 3 Haiku 识别手写英文的视频,可以看出识别效果很好。
🔼Claude 官方视频
官网免费的 Claude 使用有很多限制。上下文和每日消息数的限制根据需求不同。(换句话说,就是免费使用机会很少)
Claude Pro 的限制也不少,可用次数比 GPT Plus 少。
新申请 Anthropic API 用户可以获得$5积分。(需要验证手机号)
https://www.anthropic.com/api
API 使用限制
HTTP 错误代码
考虑到网络环境,有了 API 后,可以先在 Colab 体验 Anthropic API。(本地 IDE 运行时要特别注意网络设置)
https://colab.research.google.com/drive/1j9693zY2MkyX9_RVjefjkvs5VhlSvaDD
此外,以下三个库也推荐看下,很实用。
https://github.com/anthropics/anthropic-sdk-python
https://github.com/anthropics/anthropic-cookbook
https://github.com/anthropics/anthropic-tools
anthropic-cookbook
anthropic-tools
这个程序是用来与Anthropic模型(例如Claude)进行交互的工具。它提供了一种简单的方式来定义和使用工具(或者说函数调用),以便利用Anthropic模型的能力。
具体来说,这个程序可以做以下事情:
定义自定义工具:你可以通过继承BaseTool类来定义自己的工具,然后实现use_tool()方法来定义工具的具体功能。例如,你可以创建一个工具来获取当前的时间。
使用预定义工具:除了可以自定义工具外,这个程序还提供了一些预定义的常用工具,例如搜索或SQL查询,可以直接使用。
交互式使用工具:通过创建ToolUser实例,并传入所需的工具,你可以与Anthropic模型进行交互。你可以向ToolUser实例提供消息(prompt),然后调用use_tools()方法来使用工具,并获取结果。
处理结构化消息:这个程序使用一种结构化的消息格式来进行交互,使得处理消息更加方便。消息以列表的形式传递,包含了工具的输入和输出,以及其他相关信息。
之前提到 Anthropic API 现最多支持20张图片上传,那怎么解决识别超过20页的PPT呢?
https://github.com/anthropics/anthropic-cookbook/blob/main/multimodal/reading_charts_graphs_powerpoints.ipynb
上面链接给出了答案。
通过逐张处理和累积叙述的方法,程序可以有效地绕过处理幻灯片时面临的20张图片的限制,实现对整个幻灯片的深入分析与理解。
这个过程涉及逐一为每张幻灯片生成文本叙述,通过将当前幻灯片的内容与之前的叙述结合起来,以获得更连贯、详细的理解。
此方法不仅提高了对幻灯片内容的理解质量,相较于常规PDF转录,还能生成更高质量的文本形式表示,避免了将图像直接嵌入模型可能引发的问题。
尽管当前每次只能处理20张图片,但通过这种顺序叙述的方式,程序能够完整地覆盖并分析整个幻灯片内容。
最后还有个插件非常推荐-Claude for Sheets
https://docs.anthropic.com/claude/docs/google-sheets-add-on
Google sheet 里现在已经有了 Gemini,但智能化不高。Gemini 可以创建表格和公式,还不能修改工作表的内容。
因此,Claude for Sheets 是个很好的补充。搭配未来推出的 Claude 3 Haiku ,预计会实惠好用。
考虑到Claude 3 Opus编程能力比较强,我还尝试在 Open Interpreter 里使用 Claude 3 Opus,不过 Open Interpreter 暂不支持该模型。
以上,就是今天的分享,感兴趣的伙伴可以在 Claude 3 Haiku 推出前,先注册 API 并学会应用。
精选历史文章,请看这里:
Groq API 使用指南:无需申请即可体验,从速率限制到模型参数解析
探索新Ollama Python库:在应用程序中集成本地LLM
Mistral Large 亮相,仅次于 GPT-4 ,介绍+API 使用