一己之力干崩全球股市！Deepseek有多猛？

1月27日，深度求索（DeepSeek）发布了最新的AI开源模型，性价比完爆ChatGPT，直接惊掉了整个硅谷和华尔街的下巴。所以你是在跟我说，一个金融公司的副业，用了几十分之一成本，就超越了全国总龙头（也就是openAI）？！哎，没错！不仅如此，好戏才刚刚开始！大家好，欢迎来到NAI热投。今天我们就来唠唠最近卷起AI大风暴的小小模型——Deepseek。Deepseek这个模型啊它是开源的，而GPT是闭源的。开源就是我的操作方式方法都分享给大家，大伙一起携手进步，而闭源一般就是准备圈地美美收租了，封闭技术嘛，下一步就是盈利。但闭源的前提是你模型世界第一，没有第二家可以选，这样你闭源人家才会继续付费用给你嘛。这下倒好，Deepseek不仅开源，而且开源的程度几乎完全透明：R1模型直接甩网上随便下载，连训练论文都公开，代码权重全放出来，潜台词就是：不开源你怎么知道我厉害？这一波操作，看似是技术上的慷慨解囊，实则是对美国金融市场的降维打击。这OpenAI辛辛苦苦烧钱堆出来GPT，本想靠技术垄断和股市泡沫大赚一笔，结果DeepSeek一开源，水平又那么高，直接让OpenAI的护城河变成了公共游泳池，谁都能在池里撒泡尿。反差感也是包有的，Deepseek（深度求索）来自一家名不见经传的中国杭州公司。你说说看，这简直几乎把所有爽文该有的东西都拉满了。

现在从斯坦福到麻省理工，DeepSeek几乎一夜之间就成了美国顶尖大学研究人员的首选模型啊。硅谷已经炸了锅，集体被端掉金饭碗的风险太大了。你说月薪三千失业了，咱大不了去开滴滴，月薪三百万失业，我能开什么滴滴补回来啊？Deepseek就像一柄利剑直插AI泡沫的核心，周一一举掀翻了全体美国科技股。英伟达这艘最大的航空母舰直接被击沉17个点，跟班小弟AMD也暴跌百分之六，AI领域的衍生品也受到重创。这个美股股民是一片哀嚎啊……哎，停！美股蒸发万亿美元不假，惨也确实惨，不过咱们也不要搞错了，DeepSeek和这些市值下滑科技公司都没有竞争关系。即便有竞争关系，一个初创公司也不可能对硅谷的巨无霸公司产生如此强烈的影响。例如英伟达，英伟达是干什么的？是卖铲子的。DeepSeek也需要向英伟达买铲子，越厉害越要买更多的铲子。所以大家也不要高估DeepSeek的影响力，它爆红本身是可以拉抬英伟达股价的，但它影响有限，正向赋能呢抵不过英伟达的其它负面预期，导致拉抬失效。

啊这时候就要有人问了，这个深度求索Deepseek真的这么厉害？能改变全世界AI的发展格局？话不要说的这么满，事情分为宏观和微观两块，我们一个个说。首先宏观层面，我们先达成个共识，就是AGI不会短期内实现——起码十年以上，不会有一个全知全能的AGI模型出现。其次，训练模型的主要成本在于预训练阶段，后训练阶段只占算力成本的10%不到。DeepSeek的这个最新模型V3开创了一种新范式，追逐理想的公司去训练更大更好的模型，然后开源出来给各个行业利用，蒸馏各个领域的专用模型。具体的业务在这个基础上做微调，做定制化和工程落地。而目前这样的格局形成的最大可能在中国手上，真要如此的话中国的全产业链优势也因此得以充分发挥。大伙要明白一件事啊，传统大模型的运行需要巨量的算力，随着美国对华算力制裁的加强，以后国内想从正规渠道获取大量高性能算力卡是非常困难的。虽然Deepseek现在没什么颠覆性的手段，但是未来万一掌握了某种非常高效的优化，那中国算力效率会连跳几个台阶，到时候真的称得上是“国运之光”这一名号了。

我们现在聚焦到微观层面，来看看Deepseek这个模型到底如何。之前讲过了啊，Deepseek一是中国本土特产，二是完全开源，这两点给它本身上了不小的光环，也让它跟“中美对账”“中国国运”这些比较夸张的词联系到一起。但是大家千万不要以为它就已经在技术层面超越GPT，Claude等大只佬登顶世界了，它采用的算法还是曾经OpenAI的开源PPO深度学习算法迭代，也就是站在“巨人”的肩膀上！Deepseek强调的是性价比，性能极度优越的同时成本极度低廉，在一众开源模型里领跑，但还到不了开宗立派的程度。具体Deepseek的用户体验大家可以去谷歌百度自行搜索啊，我们这里就不多形容了，这里就来看几张图。在数学与代码方面，DeepSeek在MATH 500、Codeforces 这些任务上的表现尤其亮眼，遥遥领先！长文本处理能力方面，它在 DROP、FRAMES等测评中的表现也与主流模型非常接近。值得一提的是，它在中文测评中表现非常出色，体现了咱们中国团队的优势。不过，DeepSeek还不够全面，它的功能相比主流模型更加单一，不会画图，也不能帮你生成PPT。同时，还有一些短期内根本无法解决的硬伤：市场容量小，硬件仍然限制于英伟达的芯片，技术不成熟。高端技术需要大量研发投入，训练模拟，是一个长期改进和完善的过程。弯道超车可能性存在，但在特别严谨的行业领域里，没有较多铺垫和积累，基本不存在这情况。咱们老实评价，Deepseek仍是“半成品”。在系统架构、精密度、准确率等方面，与国外较成熟产品仍有一定差距。

最后呢，话也说回来了。性价比都做到这个份上了，还要啥自行车，也许人家压根儿也没想做成一个“大而全”的模型，没那个必要。除了模型本身的优秀，这次DeepSeek之所以这么出圈，与它背后年轻的中国团队也有很大的关系。雷军开千万年薪挖DeepSeek研究员罗福莉的传闻大家应该都在小红书上或多或少见过。DeepSeek的团队都是中国本地各大高校的应届生，甚至是在读生，比如为MLA架构做出了关键创新的高华佐和曾旺丁，分别来自北大物理系和北邮。DeepSeek的创始人梁文锋说，团队主要看能力而非经验，鼓励自然分工和资源灵活调配。

所以，Deepseek到底有多猛？顶级性价比，国产大模型，开源超闭源，年轻团队。即便现在已经火的不正常了，但不得不说DeepSeek现在深度拥抱“强化学习”，潜力十足，不会被轻易捧杀。27日周一，苹果App Store中国区显示DeepSeek已经成为第一了。这波啊，真的就是让业界的AI大佬倍感压力。中美之间的 AI 差距已经骤然缩小，2025年才刚刚开始呢！下一代Deepseek3.5或许真能追上o1，嘿嘿到时候我就把gpt会员停了。

本文链接地址：https://www.wwsww.cn/hqfx/30342.html
郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关文章阅读