查看原文
其他

Claude 3 深度探索:从提示技巧到高级 API 使用指南

思辨view kate人不错 2024-05-19

之前我写过比 GPT-4 强!Claude 3 Opus 模型发布推荐给刚了解Claude 3读者看下

Claude 注册和实测,公众号平台已有很多文章了,今天来分享下个人用户深入使用 Claude 3 和 API 需要了解的信息。

使用 Claude3 最方便的渠道是 Poe。(支持图片上传和文字对话)

https://poe.com/

Claude.ai 内容审核严格。

而 Poe 里的 Claude 3 可以。

而且可以把链接直接发给 Poe 里的 Claude 3,它会基于链接里的正文信息给到回复,而 Claude.ai 大多不支持。这一点,我在已是ChatGPT会员,为何还充值Poe,我的深度使用分享里详细介绍过。

此外,使用 Claude 官网太费心,比如收到提示:1)Your account has been disabled after an automatic review of your recent activities.2)This organization has been disabled。

Claude 能力

Anthropic 官方提供了详细的提示库,比 OpenAI 要丰富很多。

🔼OpenAI

🔼Anthropic

https://docs.anthropic.com/claude/prompt-library

总共63个主题,值得在 Anthropic 官网好好看下详情。

上文提示技巧里提到使用 XML 标签,这对 Claude 非常重要。

我非常看好 Claude 3 Haiku API 的推出,因为 Claude 3 Haiku 支持文字和图像,比 GPT 3.5 便宜,性能和上下文长度支持比 GPT 3.5 好很多。

Claude 3 系列模型区别

OpenAI 模型价格

GPT 只有4才支持视觉功能,Claude 3 的3个模型都支持,如果只用 Claude 3 Haiku 的话,视觉识别成本低,非常适合简单任务。

Claude 3的图片识别能力如何,简单实测下,用的 Claude 3 Sonnet 模型。

🔼原图片文字是井柏然写的

识别手写的中文能力不行。

但 Claude 官方特别发布了一个关于 Claude 3 Haiku 识别手写英文的视频,可以看出识别效果很好。

🔼Claude 官方视频

官网免费的 Claude 使用有很多限制。上下文和每日消息数的限制根据需求不同。(换句话说,就是免费使用机会很少)

Claude Pro 的限制也不少,可用次数比 GPT Plus 少。

新申请 Anthropic API 用户可以获得$5积分。(需要验证手机号)

https://www.anthropic.com/api

API 使用限制

HTTP 错误代码

考虑到网络环境,有了 API 后,可以先在 Colab 体验 Anthropic API。(本地 IDE 运行时要特别注意网络设置)

https://colab.research.google.com/drive/1j9693zY2MkyX9_RVjefjkvs5VhlSvaDD

此外,以下三个库也推荐看下,很实用。

https://github.com/anthropics/anthropic-sdk-python
https://github.com/anthropics/anthropic-cookbook
https://github.com/anthropics/anthropic-tools

anthropic-cookbook

anthropic-tools

个程序是用来与Anthropic模型(例如Claude)进行交互的工具。它提供了一种简单的方式来定义和使用工具(或者说函数调用),以便利用Anthropic模型的能力。

具体来说,这个程序可以做以下事情:

  1. 定义自定义工具:你可以通过继承BaseTool类来定义自己的工具,然后实现use_tool()方法来定义工具的具体功能。例如,你可以创建一个工具来获取当前的时间。

  2. 使用预定义工具:除了可以自定义工具外,这个程序还提供了一些预定义的常用工具,例如搜索或SQL查询,可以直接使用。

  3. 交互式使用工具:通过创建ToolUser实例,并传入所需的工具,你可以与Anthropic模型进行交互。你可以向ToolUser实例提供消息(prompt),然后调用use_tools()方法来使用工具,并获取结果。

  4. 处理结构化消息:这个程序使用一种结构化的消息格式来进行交互,使得处理消息更加方便。消息以列表的形式传递,包含了工具的输入和输出,以及其他相关信息。


之前提到 Anthropic API 现最多支持20张图片上传,那怎么解决识别超过20页的PPT呢?

https://github.com/anthropics/anthropic-cookbook/blob/main/multimodal/reading_charts_graphs_powerpoints.ipynb

上面链接给出了答案。

通过逐张处理和累积叙述的方法,程序可以有效地绕过处理幻灯片时面临的20张图片的限制,实现对整个幻灯片的深入分析与理解。

这个过程涉及逐一为每张幻灯片生成文本叙述,通过将当前幻灯片的内容与之前的叙述结合起来,以获得更连贯、详细的理解。

此方法不仅提高了对幻灯片内容的理解质量,相较于常规PDF转录,还能生成更高质量的文本形式表示,避免了将图像直接嵌入模型可能引发的问题。

尽管当前每次只能处理20张图片,但通过这种顺序叙述的方式,程序能够完整地覆盖并分析整个幻灯片内容。

最后还有个插件非常推荐-Claude for Sheets

https://docs.anthropic.com/claude/docs/google-sheets-add-on

Google sheet 里现在已经有了 Gemini,但智能化不高。Gemini 可以创建表格和公式,还不能修改工作表的内容。

因此,Claude for Sheets 是个很好的补充。搭配未来推出的 Claude 3 Haiku ,预计会实惠好用。

考虑到Claude 3 Opus编程能力比较强,我还尝试在 Open Interpreter 里使用 Claude 3 Opus,不过 Open Interpreter 暂不支持该模型。

以上,就是今天的分享,感兴趣的伙伴可以在 Claude 3 Haiku 推出前,先注册 API 并学会应用。


精选历史文章,请看这里:

Groq API 使用指南:无需申请即可体验,从速率限制到模型参数解析

探索新Ollama Python库:在应用程序中集成本地LLM

Mistral Large 亮相,仅次于 GPT-4 ,介绍+API 使用


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存