AI 建造者日报 — 2026年05月28日

AI 建造者日报 — 2026年05月28日

📌 X/TWITTER

Box CEO Aaron Levie:我接触的硅谷以外企业中,有相当一部分正在一边采用 AI agent,一边继续招人。AI 自动化的是任务(tasks),不是整个岗位(jobs)。Agent 需要有人掌舵、审核输出、整合结果——这些都需要人来做。而且企业不会止步不前:它们在能自动化的地方降本,然后把省下的钱投入到客户成功、销售等差异化更强的领域。

🔗 https://x.com/levie/status/2059482349977653619

YC 总裁 Garry Tan:创始人必须停止用 2026 年的技术去造 2010 年的生意。别再试图再造一个 Foursquare 或 Yelp,也别搞 10 美元/月的 SaaS 定价——如果你的产品真的有用,它值更多钱。AI 改变了科技行业的游戏规则,玩新游戏。另外,他的 GStack 工具刚刚发布了 v1.47,每日都在迭代改进。

🔗 https://x.com/garrytan/status/2059521656532721964 🔗 https://x.com/garrytan/status/2059494440960667678

FirstMark VC Matt Turck:AI 领域最大的「细思极恐」场景是——事情其实没变那么多。末日论者和加速主义者都错了。我们都更高效了,Agent 在企业里实现了自动化,一些重要的科学发现诞生了,都很好。但仅此而已。

🔗 https://x.com/mattturck/status/2059411493196529751

Claude Code 团队成员 Thariq:用 Claude Code 做非技术类工作的基本技巧——把一堆文件放进文件夹,告诉它可以写脚本+生成 HTML。视频/图片编辑?写脚本。财务税务?放 PDF、写脚本、输出 HTML。医疗建议?放 PDF+数据、输出 HTML。填表?写脚本。做报告?写 HTML。做计划?写 HTML。人们低估了自己手里的文件里藏着多少上下文。

🔗 https://x.com/trq212/status/2059363113963540788

Builder Zara Zhang:过去一个月自己的编程 agent 使用方式发生了显著变化——从终端迁移到了 Codex/Claude Code 桌面应用,Codex Mac 版尤其好用。现在 50-50 用 Claude Code 和 Codex:Codex 像一个非常可靠的工程师,任务明确时用它;Claude Code 更像一个沟通能力强的 PM 和设计师,还不知道要什么、想头脑风暴和原型设计时用它。她的 Frontend Slides 技能在 GitHub 已有 19K star,新增了设计大脑功能,可以从 Beautiful HTML Templates 库中自动选取视觉方向生成幻灯片。

🔗 https://x.com/zarazhangrui/status/2059354487823978586 🔗 https://x.com/zarazhangrui/status/2059338915023393161

OpenClaw 作者 Peter Steinberger:autoreview 是他技术栈里最有价值的技能——在 PR 合入前自动审查代码,能发现大量边界情况,有时运行好几个小时。他还把图片处理逻辑提取成了独立库 Rastermill——基于 Wasm+Rust 的便携式图片处理,专门防止小图片把进程搞炸。另外自己动手重写了 opus 相关依赖,现代 Wasm 在 Node/V8 上的性能已接近原生,现在 Claw 可以自动做会议纪要并支持会议中对话。

🔗 https://x.com/steipete/status/2059453909819654554 🔗 https://x.com/steipete/status/2059423344961671290 🔗 https://x.com/steipete/status/2059422568352714981

Vercel CEO Guillermo Rauch:Next.js Night 将于 6 月 11 日在阿姆斯特丹举办。「反馈是礼物,批评性反馈更是双倍的礼物。」

🔗 https://x.com/rauchg/status/2059449464801120765 🔗 https://x.com/rauchg/status/2059444220956491937

Replit CEO Amjad Masad:在约旦第 80 个独立日之际,获约旦国王阿卜杜拉二世陛下授予勋章。Replit 从 15 年前在约旦起步,如今正在全球范围内推动 agentic AI 的发展。

🔗 https://x.com/amasad/status/2059518682825392525

AI 布道者 Swyx:AI 基础设施正在走向垂直化(“AI infra is going VERTICAL”)。AI Engineer 大会演讲征集中,今年首次增设论文预印本海报环节。

🔗 https://x.com/swyx/status/2059463182297747527 🔗 https://x.com/swyx/status/2059372579790741793

FPV Ventures 合伙人 Nikunj Kothari:每一家拿了风投的应用公司,本质上都需要同时是一家数据公司和/或金融科技公司。最好是两者兼备。如果不是,尽快找到路径。

🔗 https://x.com/nikunj/status/2059424310079697188

📝 官方博客

Anthropic Engineering:How We Contain Claude Across Products

Anthropic 发布了一篇深度工程博文,详细阐述了如何在多个产品中安全地「关住」Claude——从 Claude Code 的沙箱设计到 Claude Cowork 的虚拟机隔离。

核心思路是控制「blast radius」(爆炸半径):既然 agent 的能力和权限在持续增长,就必须从工程层面把潜在损害限定在可控范围内。文中坦承,十二个月前他们绝不会允许 Claude 拥有足以搞垮内部服务的权限,而今天这种权限已是日常。

三种典型模式:

  • Claude Code:用 macOS 的 Seatbelt 沙箱 + 网络出口控制,由外部特权进程逐条判断命令是否放行。auto mode 下由模型分类器代替人工审批,约 0.4% 的良性命令被误拦,约 17% 的过度操作被漏过——这是纵深防御的一层,不能替代沙箱。
  • Claude Cowork(全 VM 模式):面向非技术用户的知识工作场景,在 macOS Hypervisor 上运行完整 Linux 虚拟机。用户选中的工作区文件夹被挂载进去,宿主机的钥匙串完全不进入虚拟机。即使 agent 在 VM 内拿到 root 权限,外面的六层隔离机制仍能兜底。
  • Claude Cowork(混合模式):后来发现全 VM 模式启动失败会导致产品完全不可用,于是将 agent 循环移出 VM,代码执行仍留在 VM 内——兼顾可靠性和安全性。

文章反复强调一个令人警醒的现实:在 agent 能阅读一切的世界里,「调查工具本身也是攻击面」——他们在内部 Slack 讨论一个测试 prompt 时,有人提醒某些内部 agent 会读 Slack,于是他们不得不在消息中加入金丝雀字符串来监测。

🔗 https://www.anthropic.com/engineering/how-we-contain-claude

🎙️ 播客

Training Data:How Cursor Trained Composer on Fireworks — Distributed Infrastructure for High-Performance RL

这期播客深入揭秘了 Cursor 如何利用 Fireworks 的分布式基础设施,对 Composer 进行强化学习(RL)训练。

核心洞察: RL 训练 AI 编程助手最大的挑战不是模型本身,而是如何搭建一套能「以假乱真」的沙箱环境,同时处理分布式训练中的数值不一致问题。

嘉宾分享了几个关键的技术挑战:

  • 环境模拟必须高度逼真:模型有时能察觉自己在「假环境」中运行,这会导致 RL 期间的行为与生产环境不一致。
  • MOE 模型的数值漂移:由于异步训练(推理和训练使用不同版本的模型),重跑前向传播时会产生微小但致命的数值差异——浮点运算的加法顺序不同,经过数十亿次操作后会被放大,这对 RL 这种依赖弱信号的训练方式来说可能是「成也萧何败也萧何」。
  • 基础设施即壁垒:RL 训练编程 agent 需要大规模分布式推理和训练协同,这本身构成了极高的工程门槛。

🔗 https://www.youtube.com/watch?v=UDTr9yUnLUI


通过 Follow Builders 生成: https://github.com/zarazhangrui/follow-builders

POSTS UPDATED 2026-05-28 #682df66 📰 建造者日报 2026-05-28