辩证看待Deepseek的火爆
发布时间: 2025-03-09 浏览次数: 10


2024年接近尾声之际,被硅谷视作“东方神秘力量”的中国大模型创业先锋DeepSeek,再次以低调的姿态,在全球AI技术领域投下一颗震撼弹。DeepSeek重磅推出了全新超大规模模型——DeepSeek-V3

DeepSeek-V3的问世,无疑为业界注入了一剂强心针。它不仅以开源的姿态,为全球lang="en-US">AI开发者打开了探索的大门,更以卓越的测试成绩,实力碾压MetaLlama 3.1-405B、阿里的Qwen等主流开源模型,甚至在性能表现上直逼AnthropicOpenAI的闭源模型(如下图),大幅拉近了开源与闭源AI之间的距离。

然而,面对此次Deepseekan lang="zh-CN">的横空出世,智能算法研究中心黄翰教授从另一角度提出了自己独到的见解。

<p style="text-indent:0.29in;background:#ffffff;line-height:150%;widows:2;orphans:2;text-align:left;margin-top:0.02in;margin-bottom:0.02in;">1.Deepseek 指标出色,技术创新却引争议

许多利用大模型开展垂直应用的团队,都不可避免地会进入对模型进行蒸馏或优化的阶段。Deepseek团队之所以脱颖而出,是因为其在备受关注的几个大模型指标上表现出色。值得称赞的是,他们将这一方法公开分享,为行业发展贡献力量。

然而,从我个人的角度来看,其技术创新并没有特别显著。诚然,这项技术在Deepseek团队手中确实得到了颇为出色的优化,但我相信,国内其实也有不少优秀团队具备达成类似技术水平的能力。

2.资本推波助澜,舆论再起风波

Deepseek团队背后的资本力量,发挥了极为关键的推动作用。从线上舆论引导,到助力其与中央及政府部门建立沟通与合作,资本团队的身影无处不在,其作用不容小觑。

因此,总体来说,Deepseek团队带来的积极影响主要体现在两大方面:一方面,促使大众重新审视民营企业的技术潜力,认识到民营企业在技术创新领域同样拥有广阔前景;另一方面,他们公开了模型优化方法,这一举措为后续大模型应用的开发与拓展奠定了良好基础,极大地推动了行业技术的进步。

3.突破传统路线,摆脱算力依赖

我认为 “不跟随美国技术路线” 这一观点确实有其合理性。以GPT为代表的通用大模型技术路线,主要依靠消耗大量算力来获取优质模型。然而,从当下情况来看,大家已经开始反思这种做法是否真的是最优解。

在过去两年投身大模型应用的过程中,我们为客户和用户提供服务时,并不会一味建议他们投入巨额算力。相反,我们通过算法优化对模型进行了大量改进。然而,和一些备受瞩目的团队相比,我们仍存在明显差距。一方面,我们背后缺乏强大资本团队的有力支持;另一方面,我们也没有通过撰写论文等方式公开这些技术成果。

其实,国内像我们这样的团队不在少数。那些勇于突破传统技术路线的团队,发挥了很好的先驱作用。他们就如同《皇帝的新衣》里那个说出真话的小孩,大胆指出了“皇帝没有穿衣服”的事实。同样地,大模型要获得高质量结果,并非只能依赖燃烧算力,这一观点打破了行业固有的认知。对于众多一直在默默探索优化技术,却未曾公开表达的团队而言,他们的发声无疑是对民营企业的极大鼓舞,为行业发展开辟了新的思路。

4.虚假繁荣下,应用见真章

就目前看来,像Deepseek这类的技术,虽然在舆论场中热度不低,但却仍未能真正融入实际业务。如今,更多的是水军的不实鼓吹、单纯的指标对比,以及仅停留在表面的娱乐体验。在我看来,想要在实际应用中真正发挥其价值,并非易事。不过可以明确的是,未来人们将不再一味强调算力的消耗,而是会更加理性、辩证地去挑选合适的模型。那些对算力要求不高的模型,或许会成为新宠 。

Deepseek的宣传攻势,很大程度上是一场精心策划的展示,其目标受众涵盖其他投资人、股民以及政府部门。其核心意图在于吸引国资、民间资本以及各类投资机构的关注目光,进而促使他们慷慨解囊,让背后的资本方实现盈利。从年前到年后,不少投资的朋友都来向我咨询,他们纷纷打算向Deepseek注资。而我无一例外地都在劝他们务必保持冷静,切勿盲目跟风。

在我们自己的实际应用过程中,我们常常会将手头的业务与Deepseek进行对比。就拿我近期开展的项目来说,经过实际操作,我发现Deepseek没有宣传中的那般出色,其实际使用效果还是要根据具体的应用场景才能有定论。

5.技术突破引关注,资本与民心所向

从唤起民族自信心与自豪感的角度来看,Deepseek的成就无疑具有不可忽视的积极意义。其成果不仅为行业发展添砖加瓦,更在一定程度上激发了民族的科技自信,让大家切实感受到我们在科技领域的进步与突破。然而,在这背后,资本力量的推动同样不容小觑。在当前网络环境中,有明显迹象表明存在大量水军,他们编造舆论脚本,精心营造出一种众口一词的热烈追捧氛围,但是Deepseek真实的形象有待在具体的应用场景中去进一步验证。他们受指使编造舆论脚本,精心营造出一种众口一词的热烈追捧氛围,使得大众所看到的形象可能偏离真实。

但换个角度思考,这一现象也恰恰反映出我们国家对这类技术成果和标志性事件的迫切需求。在快速发展的时代浪潮中,我们急需这样的科技突破来凝聚人心、鼓舞士气,为民族发展注入源源不断的精神动力,激励全体国民在追求进步的道路上奋勇前行。





总编:黄翰

责任编辑:雷墨鹥兮

文字:黄翰

图片:雷墨鹥兮

校稿:陈嘉慧

时间:202529