无问芯穹Infini-AI发布,百亿token补贴,限时全免!
🤫请扫描上方二维码🤫
或直接用浏览器打开infini-ai.com
领取你的百亿token配额
昨天,我们发布了“无穹Infini-AI”,这是一个基于多芯片算力底座,目标让开发者只花小成本,就能够享受好用工具和充沛算力的一站式大模型开发与服务平台。
开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,就能精调出更贴合业务的大模型,并部署在无穹Infini-AI上,再以非常优惠的千token单价向用户提供服务。
基于多元芯片算力底座
去年,我们宣布了FlashDecoding++在英伟达GPU和AMD等芯片上取得的优化效果,实现大模型任务2-4倍的推理速度提升。随后,AMD中国宣布与无问芯穹达成战略合作关系,双方将携手联合提高商用AI应用性能。目前,无问芯穹已实现在十余张计算卡上的最强性能优化,并与多个芯片伙伴达成合作,将携手为大模型训练、微调与推理任务提供易用、稳定、高性能算力支持。
开放注册且支持三方模型托管
当前,无穹Infini-AI大模型开发与服务平台已正式开放全量注册,并向所有完成实名注册的个人和企业提供总计百亿token配额。此外,第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,后续也可获得细粒度定制的按token计费方案。
持续提升模型与芯片覆盖率
目前,无穹Infini-AI已支持了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。随着无问芯穹产研团队在模型支持与芯片优化数量覆盖率上的提升,无穹Infini-AI的性价比优势会越来越突出。
启动大客户邀测,欢迎联络
如果您需要专项算力支持,还需要在算法和硬件上享受到更有纵深的算力优化服务,请直接联系sales@infini-ai.com
推荐阅读
关于无穹
无问芯穹(Infinigence AI,简称“无穹”)
依托行业领先且经过验证的AI计算优化能力与算力解决方案
追求大模型落地的极致能效
打造 “M 种模型” 和 “N 种芯片” 间的“M×N”中间层产品
实现多种大模型算法在多元芯片上的高效、统一部署
我们链接上下游企业
共建AGI时代大模型基础设施
加速AGI落地千行百业
长按识别 关注我们