1月27日,深度求索(DeepSeek)发布了最新的AI开源模型,性价比完爆ChatGPT,直接惊掉了整个硅谷和华尔街的下巴。所以你是在跟我说,一个金融公司的副业,用了几十分之一成本,就超越了全国总龙头(也就是openAI)?!哎,没错!不仅如此,好戏才刚刚开始!大家好,欢迎来到NAI热投。今天我们就来唠唠最近卷起AI大风暴的小小模型——Deepseek。Deepseek这个模型啊它是开源的,而GPT是闭源的。开源就是我的操作方式方法都分享给大家,大伙一起携手进步,而闭源一般就是准备圈地美美收租了,封闭技术嘛,下一步就是盈利。但闭源的前提是你模型世界第一,没有第二家可以选,这样你闭源人家才会继续付费用给你嘛。这下倒好,Deepseek不仅开源,而且开源的程度几乎完全透明:R1模型直接甩网上随便下载,连训练论文都公开,代码权重全放出来,潜台词就是:不开源你怎么知道我厉害?这一波操作,看似是技术上的慷慨解囊,实则是对美国金融市场的降维打击。这OpenAI辛辛苦苦烧钱堆出来GPT,本想靠技术垄断和股市泡沫大赚一笔,结果DeepSeek一开源,水平又那么高,直接让OpenAI的护城河变成了公共游泳池,谁都能在池里撒泡尿。反差感也是包有的,Deepseek(深度求索)来自一家名不见经传的中国杭州公司。你说说看,这简直几乎把所有爽文该有的东西都拉满了。
现在从斯坦福到麻省理工,DeepSeek几乎一夜之间就成了美国顶尖大学研究人员的首选模型啊。硅谷已经炸了锅,集体被端掉金饭碗的风险太大了。你说月薪三千失业了,咱大不了去开滴滴,月薪三百万失业,我能开什么滴滴补回来啊?Deepseek就像一柄利剑直插AI泡沫的核心,周一一举掀翻了全体美国科技股。英伟达这艘最大的航空母舰直接被击沉17个点,跟班小弟AMD也暴跌百分之六,AI领域的衍生品也受到重创。这个美股股民是一片哀嚎啊……哎,停!美股蒸发万亿美元不假,惨也确实惨,不过咱们也不要搞错了,DeepSeek和这些市值下滑科技公司都没有竞争关系。即便有竞争关系,一个初创公司也不可能对硅谷的巨无霸公司产生如此强烈的影响。例如英伟达,英伟达是干什么的?是卖铲子的。DeepSeek也需要向英伟达买铲子,越厉害越要买更多的铲子。所以大家也不要高估DeepSeek的影响力,它爆红本身是可以拉抬英伟达股价的,但它影响有限,正向赋能呢抵不过英伟达的其它负面预期,导致拉抬失效。
啊这时候就要有人问了,这个深度求索Deepseek真的这么厉害?能改变全世界AI的发展格局?话不要说的这么满,事情分为宏观和微观两块,我们一个个说。首先宏观层面,我们先达成个共识,就是AGI不会短期内实现——起码十年以上,不会有一个全知全能的AGI模型出现。其次,训练模型的主要成本在于预训练阶段,后训练阶段只占算力成本的10%不到。DeepSeek的这个最新模型V3开创了一种新范式,追逐理想的公司去训练更大更好的模型,然后开源出来给各个行业利用,蒸馏各个领域的专用模型。具体的业务在这个基础上做微调,做定制化和工程落地。而目前这样的格局形成的最大可能在中国手上,真要如此的话中国的全产业链优势也因此得以充分发挥。大伙要明白一件事啊,传统大模型的运行需要巨量的算力,随着美国对华算力制裁的加强,以后国内想从正规渠道获取大量高性能算力卡是非常困难的。虽然Deepseek现在没什么颠覆性的手段,但是未来万一掌握了某种非常高效的优化,那中国算力效率会连跳几个台阶,到时候真的称得上是“国运之光”这一名号了。
我们现在聚焦到微观层面,来看看Deepseek这个模型到底如何。之前讲过了啊,Deepseek一是中国本土特产,二是完全开源,这两点给它本身上了不小的光环,也让它跟“中美对账”“中国国运”这些比较夸张的词联系到一起。但是大家千万不要以为它就已经在技术层面超越GPT,Claude等大只佬登顶世界了,它采用的算法还是曾经OpenAI的开源PPO深度学习算法迭代,也就是站在“巨人”的肩膀上!Deepseek强调的是性价比,性能极度优越的同时成本极度低廉,在一众开源模型里领跑,但还到不了开宗立派的程度。具体Deepseek的用户体验大家可以去谷歌百度自行搜索啊,我们这里就不多形容了,这里就来看几张图。在数学与代码方面,DeepSeek在MATH 500、Codeforces 这些任务上的表现尤其亮眼,遥遥领先!长文本处理能力方面,它在 DROP、FRAMES等测评中的表现也与主流模型非常接近。值得一提的是,它在中文测评中表现非常出色,体现了咱们中国团队的优势。不过,DeepSeek还不够全面,它的功能相比主流模型更加单一,不会画图,也不能帮你生成PPT。同时,还有一些短期内根本无法解决的硬伤:市场容量小,硬件仍然限制于英伟达的芯片,技术不成熟。高端技术需要大量研发投入,训练模拟,是一个长期改进和完善的过程。弯道超车可能性存在,但在特别严谨的行业领域里,没有较多铺垫和积累,基本不存在这情况。咱们老实评价,Deepseek仍是“半成品”。在系统架构、精密度、准确率等方面,与国外较成熟产品仍有一定差距。
最后呢,话也说回来了。性价比都做到这个份上了,还要啥自行车,也许人家压根儿也没想做成一个“大而全”的模型,没那个必要。除了模型本身的优秀,这次DeepSeek之所以这么出圈,与它背后年轻的中国团队也有很大的关系。雷军开千万年薪挖DeepSeek研究员罗福莉的传闻大家应该都在小红书上或多或少见过。DeepSeek的团队都是中国本地各大高校的应届生,甚至是在读生,比如为MLA架构做出了关键创新的高华佐和曾旺丁,分别来自北大物理系和北邮。DeepSeek的创始人梁文锋说,团队主要看能力而非经验,鼓励自然分工和资源灵活调配。
所以,Deepseek到底有多猛?顶级性价比,国产大模型,开源超闭源,年轻团队。即便现在已经火的不正常了,但不得不说DeepSeek现在深度拥抱“强化学习”,潜力十足,不会被轻易捧杀。27日周一,苹果App Store中国区显示DeepSeek已经成为第一了。这波啊,真的就是让业界的AI大佬倍感压力。中美之间的 AI 差距已经骤然缩小,2025年才刚刚开始呢!下一代Deepseek3.5或许真能追上o1,嘿嘿到时候我就把gpt会员停了。
本文链接地址:https://www.wwsww.cn/hqfx/30342.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。