开丰娱乐
热点资讯
中国联通:针对DeepSeek系列模型进行了优化升级 平均节省30%推理计算量
发布日期:2025-03-05 16:05 点击次数:194
中国联通近日宣布,继1月开源元景“自适应慢思考”思维链大模型后,又针对DeepSeek系列模型进行了“自适应慢思考”优化升级,平均可节省约30%的推理计算量,现已开源。这也是目前业界首个对DeepSeek系列思维链模型做“自适应慢思考”优化升级的工作。
中国联通称,除了通过对DeepSeek-R1模型进行自适应慢思考优化升级外,还在推进对DeepSeek-R1系列模型的能力边界量化和安全价值观增强等相关工作的探索。未来,中国联通将持续与以DeepSeek为代表的先进开源模型深度融合,不断升级元景基础模型能力和MaaS平台功能,贯彻开源普惠理念,推进算力普惠、模型普惠、应用普惠,以先进数智水平赋能社会千行百业。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者
一财资讯
相关阅读
DeepSeek吃光了云端的闲置算力 | 海斌访谈DeepSeek给云计算厂商带来立竿见影的回报。
213 昨天 21:00
AI进化速递 | 腾讯混元新一代快思考模型Turbo S发布DeepSeek宣布开源Optimized Parallelism Strategies;腾讯混元新一代快思考模型Turbo S发布。
21 昨天 20:54
DeepSeek开源第四弹“教”优化,梁文锋参与研发通过这些分享可以清晰了解DeepSeek是如何最大限度利用GPU能力的。
209 昨天 13:02
DeepSeek开源第三日,行业影响几何?这些“脚手架”的开源有利于之后的生态搭建。
215 02-26 12:14
DeepSeek光芒盖过“六小龙”,大模型的天平往哪里倾斜了?可以确定的是,DeepSeek为行业竞争带来了深远的影响,使得开闭源的天平开始向开源一侧倾斜。
664 02-26 11:10 一财最热 点击关闭
