关于 agentic coding 里的两层 loop——内层 agent loop 在模型说「完成」时结束,外层 harness loop 决定是否继续——以及为什么后者在一次性、可验证的工作上表现惊人,却会侵蚀需要长期维护的代码。
简报
2026 年 6 月 24 日
十四条关于智能体 loop、工程审查、prompt injection、开源模型、工具、基础设施与游戏 AI 的阅读笔记。
2025 年 11 月的新一代 agent 如何让代码产出激增、而人工审查停滞,以及 Meta 史上最大事故如何追溯到「AI 写、AI 审」的代码越过被裁撤的 Trust & Safety 团队上线。
Coinbase 如何用 Plan Mode 加五到七个并行 agent,把交付周期从 20 天压缩到 1.8 天,目前 75% 的 PR 由 agent 创建。
一项研究发现:模型靠文本的「风格」而非角色标签判断谁在说话——把攻击改写得略微不合格式,就能让成功率从 61% 降到 10%。
关于一个排名已超过人类高手的自动化红队系统、「模型不随规模自动变安全」的发现,以及「致命三件套」——不可信输入、私有数据与外泄通道同时存在。
为什么 GLM-5.2 是第一个能在 Claude Code 类 harness 里作为通用 agent 使用的开源权重模型,以远低的价格把美中差距缩小到约 6.8 个月。
一个 3B 参数模型,在答案可机器验证的数学与竞赛编程上追平 600B–1T 旗舰,靠的是两段式「先撒网、再聚焦」(Spectrum-to-Signal)的后训练方法。
IBM 的开源 harness 把 planning、状态与 reflection 收进 harness,让开发者只写工具和 prompt,就用开源权重模型拿下 AppWorld 与 WebArena 双榜第一。
扁平的 Mercurial 式 manifest 加惰性挂载,让 agent 不必克隆整库就能在多 GB monorepo 上秒级开始编辑——代价是脱离整个 Git 生态。
一篇论证:memcached 更适合做缓存,恰恰因为它做得少——不持久化、不集群——从而强制了「缓存随时可丢」的正确语义,绕开了「把 Redis 当数据库」的陷阱。
GPT-5 Pro 如何为一位免疫学家提供了 T 细胞行为的新视角,解释了他三年来都无法说明的实验现象。
FromSoftware 如何不用规划算法构建 Boss 行为——下推自动机的目标栈、加权随机动作选择和中断回调,让设计师保持完全掌控。
为什么 AI 数据中心的瓶颈不是电力,而是被投机项目挤满的先到先得并网排队——以及拍卖名额、给灵活性定价如何疏通它。
西方填海造地如何在 1970 年前后停摆——不是因为禁令,而是可被诉讼的环评把单个项目的审批拖成了数十年。