中国联通:针对DeepSeek系列模型进行了优化升级 平均节省30%推理计算量
开丰娱乐
热点资讯
新闻动态

你的位置:开丰娱乐 > 新闻动态 >

中国联通:针对DeepSeek系列模型进行了优化升级 平均节省30%推理计算量

发布日期:2025-03-05 16:05    点击次数:194

中国联通近日宣布,继1月开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级,平均可节省约30%的推理计算量,现已开源。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。

中国联通称,除了通过对DeepSeek-R1模型进行自适应慢思考优化升级外,还在推进对DeepSeek-R1系列模型的能力边界量化和安全价值观增强等相关工作的探索。未来,中国联通将持续与以DeepSeek为代表的先进开源模型深度融合,不断升级元景基础模型能力和MaaS平台功能,贯彻开源普惠理念,推进算力普惠、模型普惠、应用普惠,以先进数智水平赋能社会千行百业。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者

一财资讯

相关阅读 DeepSeek吃光了云端的闲置算力 | 海斌访谈

DeepSeek给云计算厂商带来立竿见影的回报。

213 昨天 21:00 AI进化速递 | 腾讯混元新一代快思考模型Turbo S发布

DeepSeek宣布开源Optimized Parallelism Strategies;腾讯混元新一代快思考模型Turbo S发布。

21 昨天 20:54 DeepSeek开源第四弹“教”优化,梁文锋参与研发

通过这些分享可以清晰了解DeepSeek是如何最大限度利用GPU能力的。

209 昨天 13:02 DeepSeek开源第三日,行业影响几何?

这些“脚手架”的开源有利于之后的生态搭建。

215 02-26 12:14 DeepSeek光芒盖过“六小龙”,大模型的天平往哪里倾斜了?

可以确定的是,DeepSeek为行业竞争带来了深远的影响,使得开闭源的天平开始向开源一侧倾斜。

664 02-26 11:10 一财最热 点击关闭

首页 | 开丰娱乐介绍 | 产品展示 | 新闻动态 |

Powered by 开丰娱乐 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024