Slogan 待定

Elowen

这里记录着我探索这个世界时留下的东西:读过的书、做过的工具、走过的地方,以及一些还没完全想明白的想法。

软件工程师自 2023 年写作GitHub ↗
置顶
查看全部 →
  1. 产品Hamel Husain
    难 Eval 的 AI 产品,通常也难让用户信任

    如果用户必须把 AI 的工作重做一遍才能验证,问题不只在 eval,而是产品没有把来源、定义、中间步骤和不可验证项做成一等产物。

  2. 智能体Hugging Face / IBM Research
    Java 迁移 Benchmark 暴露:能编译不等于迁移成功

    ScarfBench 把企业 Java 迁移评估从代码生成拉回系统现实:构建、部署、行为验证都过关才算成功,而当前最强 agent 的行为成功率仍低于 10%。

  3. 架构Latent Space
    企业 Agent 的难点在流程编码,不在把模型接上电话

    Sierra 的 agent engineer/FDE 模型说明,企业 agent 的核心工作是把客户流程、API、品牌语气、发布治理和验证路径编码进系统。

  1. 01

    用 Rust 构建更好的 HN API

    在 Hacker News Firebase API 之上的轻量快速封装,以及我对边缘缓存的一些体会。

  2. 02

    我的 Kindle 工作流

    完整记录我的 Kindle 配置:如何挑好书、获取干净的 EPUB、用 Calibre 翻译外文版本,并把一切顺畅地传到设备上。

當你保有成功太久,就會喪失冒險的欲望。

馬斯克傳 · Walter Isaacson · p. 636

受限於物理定律的規則才是真正需要遵守的規則。其他都只是建議。