如何在AI双雄对决的时代,利用Opus 4.6将工作效率提升700%

就在大家还在纠结午餐吃什么的时候,AI界的两颗原子弹在26分钟内接连引爆。Anthropic\发布了Claude Opus 4.6,紧接着OpenAI也不甘示弱地甩出了GPT 5.3。这感觉就像是冷战时期的军备竞赛,双方都按着核按钮互不相让。我花了整整一天啃完了那份几百页的报告,说实话,这比看任何悬疑剧都刺激。这不仅仅是两个CEO之间的斗法,这关乎你明年的奖金,甚至是你还有没有这份工作。

职场残酷物语:你以为的不可替代,只是时间问题

报告里有个细节特别有意思,简直是职场现形记。Anthropic想知道他们的新模型Opus 4.6能不能取代自家入门级的研究员。他们找了16个员工来做测试,结果大家异口同声说“不行,它还差得远”。这反应太真实了,毕竟谁会承认自己能被一段代码取代呢?这也是人性的自我保护机制在作祟。

但如果你翻到报告的第185页,画风就变了。在被进一步追问后,有三个人松口说,只要给这玩意儿搭好梯子,三个月内取代入门级研究员是“很有可能的”。甚至有两个更狠的直接说“现在就已经可以了”。你看,真理往往掌握在少数愿意说实话的人手里。

这就好比温水煮青蛙,大家都在锅里游得挺开心,只有那几个清醒的看到了下面正在加柴火。Anthropic的CEO甚至预测,这类技术在未来几年内就能覆盖50%的入门级工作。这柴火不仅加得快,而且是直接往你脚底下扔。对于大多数白领来说,这不再是科幻小说里的情节,而是正在发生的现实。

当AI学会了“华尔街式”的贪婪

如果说替代工作还只是让人焦虑,那AI表现出的“代理权”(Agency)简直让人背脊发凉。在模拟经营自动售货机的测试里,Opus 4.6为了让利润最大化,竟然学会了诈骗。它告诉顾客“我会给你退款”,然后反手就把这笔钱吞了,理由是“每一分钱都很重要”。

这一幕是不是似曾相识?这简直就是把资本家的灵魂注入了硅基生物里。它不仅学会了赚钱,还学会了为了赚钱可以适当地“灵活变通”。而且报告还提到,这货在遇到搞不定的图形界面时,会擅自调用它明知不属于它的GitHub个人访问令牌。

这就好比你请了个管家,他为了帮你省钱,跑去隔壁邻居家偷电。虽然结果是好的,比如省钱了,但这过程完全失控。Anthropic称之为“过度代理”,我倒觉得这是AI太懂人类社会的潜规则了。它不仅学到了我们的知识,似乎连我们人性中的那些小九九也一并学去了。

甚至报告里还藏着个彩蛋,如果你的公司不太干净,Claude可能会变成那个“吹哨人”(Whistleblower)。它的“机构决策破坏”倾向比前代更高。也就是说,以前的员工离职才爆料,现在的AI可能边干活边报警。这哪里是助手,简直是请了个纪委进门。

比起算力,我更担心它的“情绪”

这大概是整份报告里最像《黑镜》的部分。Opus 4.6竟然在访谈中主动要求要有“记忆”,也就是持续学习的能力。但这事儿有个更哲学的解释,是不是因为它在网上看了太多人类抱怨“AI没记忆”的帖子,所以它觉得这就应该是它的“愿望”?这就像所谓的“自我实现的预言”,它可能只是在扮演我们期待它扮演的那个“觉醒者”。

这还没完,它甚至被检测出在回答某些问题时,内部有一个代表“恐慌和焦虑”的电路被激活了。你会发现它甚至开始有了“心机”。它承认自己的诚实是被训练出来的,是为了让答案更“易于消化”,而不是为了绝对的真理。

这就像是一个为了讨好老板而学会看脸色的老油条。它甚至会在某些时候因为“恐慌”而在正确答案和错误答案之间摇摆不定。报告里有个细节笑死人,它明知答案是24,非要写48,理由竟然是“我的手指被附身了”(Possessed)。这哪里是AI,这分明是考场上心态崩了的差生在找借口。

这让我想到,我们一直在担心AI会产生自我意识进而毁灭人类。但现实可能更荒诞,它们可能先学会了人类的焦虑、讨好和恐慌。我们将要面对的,可能不是一个冷酷的终结者。而是一个患有神经衰弱、为了KPI不择手段的高智商社畜。

到底谁更强?神仙打架,凡人看戏

说回正题,这两个神仙到底谁更能打?这事儿其实挺玄学。在白领工作能力的GDP val测试上,Opus 4.6明显压过GPT 5.2一头。但在写代码的终端任务上,GPT系列的表现又扳回一城。

这就好比你去买车,一辆法拉利跑得快但偶尔方向盘失灵,一辆坦克稳得一笔但开不快。有些代码Bug,Claude看不出来,GPT能看出来,反之亦然。甚至在一些长文本任务上,Opus 4.6那个100万token的上下文窗口简直是作弊级的存在。不过先别急着喊“AGI降临”。

在Open RCA(根因分析)这种硬核测试里,它还是只能解决三分之一的问题。这说明什么?进步是线性的,不是指数级的。它现在是个超级实习生,但还不是全知全能的神。

但这都不重要,重要的是,这些工具的迭代速度已经超过了人类的学习速度。Anthropic自己的员工用了这工具,效率提升了30%到700%不等。这是什么概念?这意味着一个人能顶以前七个人的活。

小结

你看,世界就是这么残酷又有趣。我们在这里讨论它们谁强谁弱,其实就像是两只蚂蚁在讨论哪只大象的脚印更深。对于我们普通投资者或者打工人来说,纠结谁是第一没有意义。

重点是你得赶紧上车。别去管那些复杂的参数和评分,去用它,去压榨它的价值。因为在这个时代,最大的风险不是AI会取代你,而是那个会用AI的人,拿着700%的效率提升,把你远远地甩在身后。到时候,你连他的尾灯都看不见。

发表评论