查看原文
其他

WAIC 2024 | 走进无问芯穹展区,释放云、边、端上无穹算力

无问芯穹
2024-11-22

2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)将于7月4日-7日在上海世博中心、世博展览馆举行。无问芯穹将携云、边、端三线面向大模型的AI算力优化解决方案,亮相世博展览馆H2-612展位。


无问芯穹

释放无穹算力,让AGI触手可及

无问芯穹(Infinigence AI,简称“无穹”)依托行业领先且经过验证的AI计算优化能力与算力解决方案,追求大模型落地的极致能效。打造 “M 种模型” 和 “N 种芯片” 间的“M×N”中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。链接上下游,共建AGI时代大模型基础设施,加速AGI落地千行百业。



云上无穹

无问芯穹Infini-AI云平台的大模型服务平台将重磅发布全新功能。当前,Infini-AI已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,将精调出的更贴合业务的大模型部署在无穹Infini-AI上。


本次展区将展示Infini-AI云平台的大模型服务平台全新功能和M×N全场景评测体验,更设有趣味AI小游戏等你来互动!



边缘无穹

无问芯穹自研大模型边缘推理IP,可被高效集成于各类边缘设备。面向边缘场景的高能效、低功耗、高性价比大语言模型推理计算处理核心,高效支持2B~13B规模大小的主流大语言模型(包括但不限于Baichuan,ChatGLM,ChatGLM2,LLaMA2,MiniCPM,OPT,Qwen等),具备大语言模型专用指令集和混合极低精度量化,可面向不同功耗场景(1~10W)提供IP定制化能力。


本次展区将展示集成了无问芯穹自研大模型边缘推理IP的大模型一体机设备,还支持上手体验边缘推理效果哦!



端侧无穹

无问芯穹端侧大模型解决方案,用有限计算资源发挥无限计算潜能。经过无问芯穹 FlashDecoding++计算优化、稀疏注意力优化、高精度量化和极致的显存优化等一系列端侧计算优化工作,各类AI PC运行性能显著提升、运行功耗大幅降低,且运行显存的占用情况也明显降低。本单元将展出无穹AIPC Agent与AIGC创意工作室两项展品,可在基于不同硬件的离线AIPC上实现AI智能体顺畅运行和创意画面AI生成。


本单元展区还将展示无问芯穹在神经网络处理单元(NPU)上实现的大模型推理,让NPU硬件焕发大模型的崭新生机。


另外,无问芯穹的工作人员们将在7月4日至7月7日间,每日固定时段开放有奖互动,多样周边小礼等你来领取。


7月4日下午14:00,上海世博中心431会议室还有一场由无问芯穹主办的WAIC 2024 “智启新章·算引未来”AI基础设施论坛也将同步启动。志合者,不以山海为远,无问芯穹期待在WAIC的舞台上与您相见!



扫描二维码报名线下参展

*参展报名:扫码登录—右下角【我的】—【立即注册报名】

*文章中提及的模型与硬件品牌名称,按英文字母顺序排列。


推荐阅读




关于无穹


无问芯穹(Infinigence AI,简称“无穹”)

依托行业领先且经过验证的AI计算优化能力与算力解决方案

追求大模型落地的极致能效


打造 “M 种模型” 和 “N 种芯片” 间的“M×N”中间层产品

实现多种大模型算法在多元芯片上的高效、统一部署


我们链接上下游企业

共建AGI时代大模型基础设施

加速AGI落地千行百业


长按识别 关注我们

继续滑动看下一个
无问芯穹
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存