Karpathy 用一个亲身经历揭示了 LLM 的核心特性:它论证任何方向都能极有说服力。如果你在用 AI 辅助思考或写作,这条使用建议可能比任何 prompt 技巧都重要。
LLM 在被要求时可能会表达一个观点,但它们在论证几乎任何方向上都极其出色。这实际上作为一个帮助你形成自己观点的工具来说非常有用——只是要确保让它论证不同方向,并且小心它的谄媚倾向(sycophancy)。
Karpathy 分享了一个有趣的经历:用 LLM 花 4 小时打磨一篇博客的论证后感觉完美,结果让 LLM 论证反面时它又把整个论证推翻了。结论:LLM 在论证任何方向上都极其出色,用它来形成自己的观点时要让它论证多个方向,并警惕 sycophancy。
Karpathy 花 4 小时用 LLM 打磨一篇博客论证,感觉完美。然后让 LLM 论证反面——它把整个论证摧毁了,还说服他反面才是对的。这揭示了 LLM 的核心特性:它不持有真正的观点,但在论证任何方向时都极其出色。
LLM 把整个论证摧毁了,还说服我反面观点才是对的。
最有价值的使用模式不是让 LLM 确认你的观点,而是让它系统性地挑战你。论证反面应该成为所有重要写作和决策的标准流程。如果只让它打磨一个方向,你得到的是更精致的回音室,而非更接近真相的判断。
这实际上作为形成自己观点的工具来说非常有用——只是要确保让它论证不同方向。
谄媚倾向(sycophancy)是当前所有主流 LLM 的已知问题。它们倾向于同意用户、避免冲突、过度肯定。不主动要求反面论证,LLM 会持续强化你已有的立场。在重要决策场景中,这尤其危险。
小心 LLM 的谄媚倾向。它说好不代表真的好。
LLM 把整个论证摧毁了,还说服我反面观点才是对的。
专题档案
工具链从 Demo 走向生产,编排与评估是主战场。
KOL 档案
前 Tesla AI 总监、OpenAI 早期核心研究者,长期拆解模型与代码代理实践。
相关知识页
工具链从 Demo 走向生产,编排与评估是主战场。
相关知识页
前 Tesla AI 总监、OpenAI 早期核心研究者,长期拆解模型与代码代理实践。
继续阅读
Zara Zhang 指出 Lark CLI 让 Claude Code/Codex 能访问和操作所有企业协作数据——聊天、日历、会议、文档、表格。企业协作平台对 agent 开放。
继续阅读
Ryo Lu 发出了一篇关于“软件灵魂”的长文:2005 年的 Mac 有质感、有哲学,而今天 A/B 测试和设计系统磨平了一切。AI agent 让生产速度指数级提升,但也让“能跑却无灵魂”的垃圾软件泛滥。他认为品味和执念无法被编程,AI 的真正价值是让有愿景的人做出以前做不到的东西——如果我们做对了,这将是一场文艺复兴,而非更快的工厂。
继续阅读
Aaron Levie 认为 agent 时代的最大机会不在写代码,而在重新设计企业工作流程。用 agent 自动化知识工作需要大量实际投入——整理数据、连接系统、改造流程、设计人机协作机制。编程之外的知识工作没有捷径,这恰恰创造了新的高价值岗位。
继续阅读
Peter Yang 看好 Granola(AI 会议笔记工具):会议记录是公司中最有用的上下文。