查看原文
其他

遥遥领先?GPT-4 多模态模式即将发布!

陈建涵 AI小岛 2024-04-15

这个世界太疯狂了,前几天我们刚说完“ Windows 11:全面整合AI,与MacOS竞争加剧 ”、“ Google Bard Extension vs ChatGPT Plus:哪个更高级 ”以及“ DALL·E 3即将发布:未来的创意革命已经到来!”,这不,OpenAI的GPT-4多模态版本终于要发布了。

而在这其中,ChatGPT不仅是一个聊天助手,它更是一个多模态交互的巨头,拥有无限的应用潜力和商业价值。从语音到图像,再到商业合作,一切都只是冰山一角。

语音交互与应用场景

你现在可以通过语音与ChatGPT进行对话。无论是在外出时,还是在家里,你都可以通过语音与它进行互动。

只需进入移动应用的设置,开启新功能,然后选择你喜欢的声音。 

如何开启

打开移动应用,进入设置 → 新功能,选择开启语音对话。 

声音选择

提供五种不同的声音选项,由专业的声音演员录制。 

技术支持

使用了全新的文本识别语音模型和开源的语音识别系统Whisper。

应用场景与安全性

1. 家庭教育: 用语音功能给孩子讲一个睡前故事。
2. 旅行指导: 在旅行时,通过语音询问附近的旅游景点或餐厅。
3. 日常辩论: 在家庭聚餐时,用语音功能解决一些小争议。
4. 医疗咨询: 通过语音功能,可以更方便地与医生进行远程咨询。

了防止恶意使用,所有的语音数据都会进行加密处理。

图像交互与应用场景

你可以向ChatGPT发送一张或多张图片,它会根据图片内容给出相应的建议或信息。 

如何使用

点击照片按钮,选择或拍摄一张图片。

多图交互

可以发送多张图片,并使用绘图工具进行标注。

技术支持

使用了多模态的GPT-3.5和GPT-4模型。

应用场景与安全性

1. 家务助手: 拍摄冰箱里的食物,ChatGPT会推荐晚餐菜单。
2. 工作辅助: 上传复杂的工作图表或数据,进行分析。
3. 教育辅导: 孩子的数学问题可以通过拍照和圈选问题集来解决。

在推出这些新功能之前,已经进行了大量的风险评估和测试。

想象一下,你正在旅行,看到一个美丽的地标,但不知道它的历史背景。现在,你只需拍张照片,ChatGPT就能给你详细介绍。或者在家里,不知道晚餐吃什么,拍摄冰箱里的食材,ChatGPT会给你提供食谱。

这些新功能将在接下来的两周内逐步推出给Plus和Enterprise用户。语音功能将在iOS和Android平台上推出,而图像功能将在所有平台上推出。

AI小岛Tips
ChatGPT是一个不断发展的产品,建议用户定期查看更新日志。
你最期待哪个新功能?语音还是图像?
结束语
GPT-4的多模态模式不仅具有巨大的应用潜力,还可能在商业领域产生深远的影响。
如果你觉得这篇文章有用,不妨点个赞,让更多人看到!










AI小岛涵哥 出品

【微信号】sanhan2016



个人转载内容至朋友圈和群聊天,无需申请版权许可。



都看到这里了,你不关注一下嘛👇 👇 👇 


你的点赞,是我持续更新的动力。


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存