提供“百亿补贴”！无问芯穹发布大模型服务平台—新闻

作者：赵广立来源：中国科学报发布时间：2024/4/1 12:59:55

选择字号：小中大

提供“百亿补贴”！无问芯穹发布大模型服务平台

3月31日，源自清华的创新企业无问芯穹在上海举办“多元计算·泛在链接”AI算力优化论坛暨产品发布会，清华大学电子工程系长聘教授、无问芯穹发起人汪玉携联合创始人团队首次集体公开亮相，并发布“无穹Infini-AI”大模型开发与服务平台。

清华大学电子工程系教授、无问芯穹发起人汪玉。无问芯穹供图 ?

无穹Infini-AI大模型开发与服务平台基于多芯片算力底座开发，旨在有效整合和优化算力资源、设计出好的利用方式和工具，缓解大模型企业面临的算力紧缺状况。会上，无问芯穹宣布，该开发服务平台自3月31日起正式开放全量注册，并给所有实名注册的个人和企业用户提供百亿tokens免费配额。

无问芯穹联合创始人兼CEO夏立雪介绍说，开发者可以在这个平台上体验、对比各种模型能力和芯片效果，通过简单拖拽各种参数按钮的动作，就能精调出更贴合业务的大模型并部署在无穹Infini-AI上，再以非常优惠的千token单价向用户提供服务。

谈起发布这一平台的初衷，汪玉介绍说，大模型引发社会广泛关注后，他们认为，国内整体算力水平距离国际先进还有明显差距，仅靠芯片工艺提升或多元芯片的迭代已远远不够，需要建立一个大模型生态系统，让不同模型能自动部署到不同硬件上，让各种算力得到有效利用。

据介绍，无穹Infini-AI已支持Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型，以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡，支持多模型与多芯片之间的软硬件联合优化和统一部署。第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI，并获得细粒度定制化的按token计费方案。

“我们对模型品牌和芯片品牌的覆盖率还会持续提升，随着时间的推移，无穹Infini-AI的性价比优势会越来越突出。”夏立雪表示，未来无穹Infini-AI还将支持更多模型与算力生态伙伴的产品上架，让更多大模型开发者能够‘花小钱、用大池’，持续降低AI应用的落地成本。

编辑部推荐博文
问答之间｜idea被别人做过，要转变方向吗？饮酒与戒酒（二）瓶子酒科学家解开自私的B染色体之谜植物写真\|“森林明珠” 银杉上海交大郭益平课题组：用于结构健康监测和机器人感知的超高灵敏度各向 ... 给课堂以想象的空间更多>>