你好,欢迎来到快科报,懂你更懂科技。
当前位置: 首页 - 热点 - 正文

申城AI基础设施企业:让“满血版”DeepSeek更适配好用

来源:中国经济网 时间:2025-02-12 22:57 阅读量:5743   
导读好消息是,“满血版”DeepSeek-R1、V3正在得到越来越多第三方平台的支持。 11日,上海AI基础设施企业无问芯穹宣布获七家国产芯片企业鼎力支持,正打通DeepSeek-R1、V3在壁仞科技、海光信息、华为昇腾、摩尔线程、沐曦、燧原...

好消息是,“满血版”DeepSeek-R1、V3正在得到越来越多第三方平台的支持。

11日,上海AI基础设施企业无问芯穹宣布获七家国产芯片企业鼎力支持,正打通DeepSeek-R1、V3在壁仞科技、海光信息、华为昇腾、摩尔线程、沐曦、燧原科技、天数智芯等7个硬件平台的多芯片适配优化,现开发者已可通过无问芯穹Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构国产算力服务。

自春节前夕爆火,DeepSeek已牵动国内超30家云服务商与近20家芯片企业宣布接入。随着无问芯穹宣布获7家国产芯片企业支持,并带着多芯片适配的DeepSeek-R1入场,DeepSeek为可控国产算力撬动的历史机遇,正变得愈发清晰。

“同题作答”到底谁更强?

DeepSeek是绝佳的商业化试炼场,激发了大量推理算力需求。几乎主流云厂商均已宣布提供R1模型服务,但全网找到服务不繁忙的“满血版”还是不容易。

以前,国产AI芯片都号称支持大模型部署,奈何实际使用者并不多。现在,DeepSeek相当于给AI芯片公司出了同一道考题:你到底“来赛”吗?

短时间内,20家国产AI芯片企业争相适配或上线DeepSeek模型,以期抓住这千载难逢的增长机遇。这恰恰反映当下AI基础设施的特点:芯片和算力资源是有,但没被高效利用起来。

如何将大量不同架构的国产芯片变得能用、好用,并在使用过程中形成硬件与算法之间的正向循环?无问芯穹的策略是做“异构云”,即统筹模型和算力需求,把分散在不同地方的异构算力整合起来,实现不同模型和不同硬件之间的统一部署和联合优化,提供给需要算力和模型的客户。

去年7月,无问芯穹就在业内首次实现了千卡规模的4+2种芯异构混训,集群算力利用率最高达到97.6%,其运营算力已经覆盖全国超13座城市。

“当下的生态环境,需要一个从算法、硬件到模型都深入理解的团队,无问芯穹便具备这样的全栈垂直优化能力。”无问芯穹联合创始人、CEO夏立雪表示。

加速全国产AI产业闭环

夏立雪说,DeepSeek的突破,激发了越来越多的下游应用创造力,未来行业日均tokens消耗量将达到百万亿级别,不仅将激发国产芯片的市场需求,也为打造全国产AI产业闭环,实现更可控的自主算力发展创造了有利条件。

记者了解到,在美国,模型、系统、芯片三个关键因素已经形成闭环生态;而国内多数大模型是通过国外芯片训练得到的,与国内的系统、芯片难以形成闭环。

“DeepSeek作为开源模型,其之于AI 2.0时代,正如Android之于移动互联网革命,将重构整个产业生态,引发链式反应,加快上层应用发展和下层系统‘统一’增速,由此广泛调动起跨越软硬件和上下游的生态,一起加大投入‘国产模型—国产芯片—国产系统’的协同优化和垂直打通。”夏立雪说。

对此,无问芯穹提出“三步走”模式,来促进全国产AI产业闭环的打通——基于主流芯片开展极致软硬件协同优化,以有限算力实现国产模型能力追赶国外模型;推动国产芯片开放底层生态,搭建“异构”AI系统解决算力缺口,实现模型能力赶超;构建国产“同构”系统,支持Scaling Law持续发展,打造“国产模型—国产芯片—国产系统”的全国产AI产业闭环,实现更可控的自主算力发展。

夏立雪表示,在劈开算力封锁的路上,DeepSeek踏出了成功的一步,接下来的“国产模型+国产算力+国产云服务+国产应用”全国产化AI之路,还要靠产业链上下游的生态伙伴合力闯出来。

软硬协同优化是必然路径

DeepSeek大语言模型共发布了3个大版本,参数规模从67B扩大到236B再到如今的671B,所用的训练算力并未与模型尺寸等比例地成倍增长,其核心便是利用软硬件协同设计的思想,不断提升系统开销——即模型的训练成本到模型尺寸、能力的转化率。

记者了解到,软硬协同优化是连接硬件和算法的桥梁,区别于各种算法层面优化方法,和硬件本身迭代的方法,而是随着硬件变化,让软件也不断优化,或根据软件的迭代来定义未来的底层电路实现,以更好地支持AI算法的运行。

业内人士指出,DeepSeek通过软硬件协同降低算力成本,给国内的启示在于这套方法论可以打破现在的闭环生态瓶颈。

无问芯穹核心技术团队早在2018年就总结出了“深度学习算法—编译—芯片联合设计”路线,致力于人工智能场景下能效电路和系统设计方法的研究,是软硬协同路线上的早期开拓者之一。自成立以来,依托“多元异构、软硬协同”的核心技术优势,打造了连接“M种模型”和“N种芯片”的“M×N”AI基础设施新范式。

蛇年春节,DeepSeek和《哪吒之魔童闹海》两匹“黑马”,扭转了中国企业技不如人的成见,也证明了只要实力强,自有不分国界的人鼓掌。前两日,本报报道了《国际权威科技商业化智库关注DeepSeek之外中国人工智能初创公司 四大AI新锐三家已入驻模速空间》,其中就包括了无问芯穹。有分析认为,DeepSeek正在让国际意识到,除了DeepSeek之外,中国还存在若干路径独特的团队,在用“力大砖飞”堆叠GPU算力储备、比拼模型精度的巨头竞赛之外,找到未被五角大楼战略家们关注到的“盲点”,跨越软硬件,攒动上下游,走出可能出奇制胜的技术路径。

免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。

为您推荐