查看原文
其他

无问芯穹Infini-AI发布,百亿token补贴,限时全免!

无问芯穹
2024-11-22


🤫请扫描上方二维码🤫

或直接用浏览器打开infini-ai.com

领取你的百亿token配额


昨天,我们发布了“无穹Infini-AI”,这是一个基于多芯片算力底座,目标让开发者只花小成本,就能够享受好用工具和充沛算力的一站式大模型开发与服务平台。



开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,就能精调出更贴合业务的大模型,并部署在无穹Infini-AI上,再以非常优惠的千token单价向用户提供服务。





基于多元芯片算力底座




去年,我们宣布了FlashDecoding++在英伟达GPU和AMD等芯片上取得的优化效果,实现大模型任务2-4倍的推理速度提升。随后,AMD中国宣布与无问芯穹达成战略合作关系,双方将携手联合提高商用AI应用性能。目前,无问芯穹已实现在十余张计算卡上的最强性能优化,并与多个芯片伙伴达成合作,将携手为大模型训练、微调与推理任务提供易用、稳定、高性能算力支持。





开放注册且支持三方模型托管



当前,无穹Infini-AI大模型开发与服务平台已正式开放全量注册,并向所有完成实名注册的个人和企业提供总计百亿token配额。此外,第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,后续也可获得细粒度定制的按token计费方案。





持续提升模型与芯片覆盖率


目前,无穹Infini-AI已支持了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。随着无问芯穹产研团队在模型支持与芯片优化数量覆盖率上的提升,无穹Infini-AI的性价比优势会越来越突出。





启动大客户邀测,欢迎联络



如果您需要专项算力支持,还需要在算法和硬件上享受到更有纵深的算力优化服务,请直接联系sales@infini-ai.com




推荐阅读



关于无穹


无问芯穹(Infinigence AI,简称“无穹”)

依托行业领先且经过验证的AI计算优化能力与算力解决方案

追求大模型落地的极致能效


打造 “M 种模型” 和 “N 种芯片” 间的“M×N”中间层产品

实现多种大模型算法在多元芯片上的高效、统一部署


我们链接上下游企业

共建AGI时代大模型基础设施

加速AGI落地千行百业


长按识别 关注我们

修改于
继续滑动看下一个
无问芯穹
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存