简报

2026 年 6 月 29 日

六条关于 agent harness、敏感文件边界、人机工作流、WAL-RUS、开放模型生态与 AI 经济学的深读笔记。

← 简报
6 月 29 日
2026
星期一
6 篇
架构
GLM 5.2 的分数提醒:Agent 成败常由 Harness 决定
— Semgrep / Hacker News

GLM 5.2 在 IDOR 检测上以 39% F1 超过 Claude Code 的 32%,但 Semgrep 自家 multimodal harness 达到 53-61%;真正值得比较的是模型、上下文选择、输出解析和执行回路的组合。

安全
`.agentignore` 不能当安全边界
— GitHub issue / Hacker News

Ignore 文件适合降噪和表达意图,但只要 agent 进程仍能读敏感文件,工具输出、搜索命中和运行日志就可能泄漏内容;真正的边界要由 OS、容器、VM 或最小权限凭据来执行。

系统
WAL-RUS 的重点不是速度,而是可预测内存
— ClickHouse / Hacker News

ClickHouse 用 Rust 重写 WAL 归档进程,不是为了泛泛追求更快,而是让 WAL-heavy 场景下的虚拟内存从近 2.8GB 降到 1GB 以下;对 DBaaS 来说,可预测峰值本身就是架构收益。

开源模型
开放模型正在按商业动机分层
— Interconnects

开放模型不再只是少数玩家的前沿竞赛,而是在 pure model makers、Big Tech、产品公司和 sovereign AI 之间分化;发布者靠什么赚钱,决定了开源策略是否可持续。

策略
AI 竞争的风险是价格战吞掉高成本范式
— Gary Marcus

Gary Marcus 把中国模型追赶解读为无护城河、更多竞争者和 token 价格战的组合:如果 LLM 范式昂贵、可靠性不足又容易复制,能力领先未必能变成商业护城河。