Slogan 待定
Elowen
这里记录着我探索这个世界时留下的东西:读过的书、做过的工具、走过的地方,以及一些还没完全想明白的想法。
精选
我的 Kindle 工作流
完整记录我的 Kindle 配置:如何挑好书、获取干净的 EPUB、用 Calibre 翻译外文版本,并把一切顺畅地传到设备上。
KindleWorkflow2 分钟阅读 →
简报
查看全部 →- 产品Hamel Husain难 Eval 的 AI 产品,通常也难让用户信任
如果用户必须把 AI 的工作重做一遍才能验证,问题不只在 eval,而是产品没有把来源、定义、中间步骤和不可验证项做成一等产物。
- 智能体Hugging Face / IBM ResearchJava 迁移 Benchmark 暴露:能编译不等于迁移成功
ScarfBench 把企业 Java 迁移评估从代码生成拉回系统现实:构建、部署、行为验证都过关才算成功,而当前最强 agent 的行为成功率仍低于 10%。
- 架构Latent Space企业 Agent 的难点在流程编码,不在把模型接上电话
Sierra 的 agent engineer/FDE 模型说明,企业 agent 的核心工作是把客户流程、API、品牌语气、发布治理和验证路径编码进系统。
摘录
查看全部 →當你保有成功太久,就會喪失冒險的欲望。
受限於物理定律的規則才是真正需要遵守的規則。其他都只是建議。