科技圈又迎来了一场颠覆性的挑战,让资本市场不禁捏了一把冷汗。这次是斯坦福大学和华盛顿大学的研究团队,他们用不到 50 美元的云计算成本,搞出了一个推理 AI 模型 s1,在数学和编程能力测试上,表现竟然能跟 OpenAI 的 o1 和 DeepSeek 的 R1 抢饭碗。最让人挠头的是,这玩意代码还直接丢 GitHub 上了,想看就看,想用就用。
为什么重要
AI 领域的竞争,本来就是个烧钱游戏,大厂们动不动砸个几十亿进去。但现在,几位研究人员用相当于一顿烧烤的钱,就能做出接近顶级水平的 AI 推理模型,这说明先进 AI 的门槛可能比我们想象的还要低。这不禁让人思考,AI 模型的商业壁垒是否已经摇摇欲坠?在数据和计算能力日益开放的情况下,曾经高不可攀的 AI 技术是否会像软件行业一样走向开源和普及?那些投资上百亿美元的 AI 企业,该不会哪天被几个学生给超车吧?
关键点
- 训练成本低得离谱:s1 的训练花费不到 50 美元,而大厂们通常得烧掉上亿美元。
- 技术门槛开始松动:研究团队用蒸馏(distillation)技术,把 Google 的 Gemini 2.0 Flash Thinking Experimental 的推理能力“压缩”进了 s1。
- 计算资源需求不高:用 16 张 Nvidia H100 GPU,30 分钟就能搞定训练,租算力的话 20 美元就能跑一遍。
- 模型开源,代码随便拿:s1 基于阿里旗下 Qwen 实验室的开源模型,训练数据和代码全都放到 GitHub 上。
- 实验发现“等待”能提升推理能力:研究团队发现,只要让 s1 在回答前“等一下”,它就会思考得更深入,答案更准。
大局观
AI 发展到了这个阶段,原本属于巨头专属的技术,正在快速平民化。就像当年云计算刚起步的时候,只有科技巨头能玩,现在连个人开发者都能搭 AI 了。这次 s1 的出现,让人不得不思考一个问题:如果 AI 高端技术可以用极低的成本复制,那投资数十亿美元的大模型研发,未来还有多少意义?
他们怎么说
斯坦福研究员 Niklas Muennighoff 直接跟 TechCrunch 说,他现在租同样的计算资源,大概 20 美元就能跑一次 s1 的训练。这听起来,就像有人告诉你,花 20 块买张彩票,结果中了 10 亿。
言外之意
这波操作不只是技术层面的突破,还涉及到 AI 生态系统的改变。如果未来更多团队都能用低成本复刻顶级 AI,那 AI 产业的竞争模式就要改写了。过去 AI 还是资本和数据的游戏,现在情况或许要变了。如果 AI 走向开源化,那最终比拼的可能不是资金,而是谁的优化和微调能力更强。像 Linux 这样的案例会不会在 AI 领域重演?
下一步
AI 巨头会怎么反应?可能会开始更严格地控制数据访问权限,防止“蒸馏”技术再被滥用。Google 已经在 Gemini 2.0 Flash Thinking Experimental 的使用条款里明确禁止反向工程,但 AI 生态正在快速变化,开源社区的创新速度往往超出大厂的掌控力。未来我们可能会看到两个趋势:一是开源 AI 继续进化,二是大厂可能加大封闭式 AI 生态的投入。那问题来了,如果顶级 AI 模型真的被低成本复制,那 AI 商业化的护城河还剩多少?
结语
s1 的出现,可能是 AI 进入平民化阶段的信号。以前 AI 只有资本雄厚的公司能玩,现在研究团队都能用零头成本复刻高端 AI 了。AI 产业究竟会走向 Linux 式的开源竞争,还是依然由大厂掌控?如果历史有任何参考价值,那或许我们应该留意类似行业的演变轨迹,比如云计算或开源软件的发展历程。现在还不好说,但有一点是肯定的——如果你是个投资者,AI 公司的竞争壁垒,可能比你想象的更脆弱。