1.jpg
它可以训练相当于GPT-4、Gemini十几倍的下一代AI大模型,能在单一逻辑内存空间内存储24万亿参数,无需分区或者重构。用它来训练1万亿参数大模型的速度,相当于用GPU训练10亿参数。四颗并联,它能在一天之内完成700亿参数的调教,而且支持最多2048路互连,一天就可以完成Llama 700亿参数的训练。WSE-3的具体功耗、价格没公布,根据上代的情况看应该在200多万美元。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
时间管理器:职场免打扰“神器”
上海迪士尼能带酸奶进去吗
1MORE万魔新品S50值不值得买
与北汽极弧合作升级为智选生态
中国成为全球能耗强度降低最快
为鼓励走出家门:韩国为宅男宅
超越中国:印度人口14日成全
首次定义超光影三主摄OPPO
出现裂缝仍有游客打卡网红悬崖