AI 建造者日报 — 2026年05月28日

📌 X/TWITTER

Box CEO Aaron Levie：我接触的硅谷以外企业中，有相当一部分正在一边采用 AI agent，一边继续招人。AI 自动化的是任务（tasks），不是整个岗位（jobs）。Agent 需要有人掌舵、审核输出、整合结果——这些都需要人来做。而且企业不会止步不前：它们在能自动化的地方降本，然后把省下的钱投入到客户成功、销售等差异化更强的领域。

🔗 https://x.com/levie/status/2059482349977653619

YC 总裁 Garry Tan：创始人必须停止用 2026 年的技术去造 2010 年的生意。别再试图再造一个 Foursquare 或 Yelp，也别搞 10 美元/月的 SaaS 定价——如果你的产品真的有用，它值更多钱。AI 改变了科技行业的游戏规则，玩新游戏。另外，他的 GStack 工具刚刚发布了 v1.47，每日都在迭代改进。

🔗 https://x.com/garrytan/status/2059521656532721964 🔗 https://x.com/garrytan/status/2059494440960667678

FirstMark VC Matt Turck：AI 领域最大的「细思极恐」场景是——事情其实没变那么多。末日论者和加速主义者都错了。我们都更高效了，Agent 在企业里实现了自动化，一些重要的科学发现诞生了，都很好。但仅此而已。

🔗 https://x.com/mattturck/status/2059411493196529751

Claude Code 团队成员 Thariq：用 Claude Code 做非技术类工作的基本技巧——把一堆文件放进文件夹，告诉它可以写脚本+生成 HTML。视频/图片编辑？写脚本。财务税务？放 PDF、写脚本、输出 HTML。医疗建议？放 PDF+数据、输出 HTML。填表？写脚本。做报告？写 HTML。做计划？写 HTML。人们低估了自己手里的文件里藏着多少上下文。

🔗 https://x.com/trq212/status/2059363113963540788

Builder Zara Zhang：过去一个月自己的编程 agent 使用方式发生了显著变化——从终端迁移到了 Codex/Claude Code 桌面应用，Codex Mac 版尤其好用。现在 50-50 用 Claude Code 和 Codex：Codex 像一个非常可靠的工程师，任务明确时用它；Claude Code 更像一个沟通能力强的 PM 和设计师，还不知道要什么、想头脑风暴和原型设计时用它。她的 Frontend Slides 技能在 GitHub 已有 19K star，新增了设计大脑功能，可以从 Beautiful HTML Templates 库中自动选取视觉方向生成幻灯片。

🔗 https://x.com/zarazhangrui/status/2059354487823978586 🔗 https://x.com/zarazhangrui/status/2059338915023393161

OpenClaw 作者 Peter Steinberger：autoreview 是他技术栈里最有价值的技能——在 PR 合入前自动审查代码，能发现大量边界情况，有时运行好几个小时。他还把图片处理逻辑提取成了独立库 Rastermill——基于 Wasm+Rust 的便携式图片处理，专门防止小图片把进程搞炸。另外自己动手重写了 opus 相关依赖，现代 Wasm 在 Node/V8 上的性能已接近原生，现在 Claw 可以自动做会议纪要并支持会议中对话。

🔗 https://x.com/steipete/status/2059453909819654554 🔗 https://x.com/steipete/status/2059423344961671290 🔗 https://x.com/steipete/status/2059422568352714981

Vercel CEO Guillermo Rauch：Next.js Night 将于 6 月 11 日在阿姆斯特丹举办。「反馈是礼物，批评性反馈更是双倍的礼物。」

🔗 https://x.com/rauchg/status/2059449464801120765 🔗 https://x.com/rauchg/status/2059444220956491937

Replit CEO Amjad Masad：在约旦第 80 个独立日之际，获约旦国王阿卜杜拉二世陛下授予勋章。Replit 从 15 年前在约旦起步，如今正在全球范围内推动 agentic AI 的发展。

🔗 https://x.com/amasad/status/2059518682825392525

AI 布道者 Swyx：AI 基础设施正在走向垂直化（“AI infra is going VERTICAL”）。AI Engineer 大会演讲征集中，今年首次增设论文预印本海报环节。

🔗 https://x.com/swyx/status/2059463182297747527 🔗 https://x.com/swyx/status/2059372579790741793

FPV Ventures 合伙人 Nikunj Kothari：每一家拿了风投的应用公司，本质上都需要同时是一家数据公司和/或金融科技公司。最好是两者兼备。如果不是，尽快找到路径。

🔗 https://x.com/nikunj/status/2059424310079697188

📝 官方博客

Anthropic Engineering：How We Contain Claude Across Products

Anthropic 发布了一篇深度工程博文，详细阐述了如何在多个产品中安全地「关住」Claude——从 Claude Code 的沙箱设计到 Claude Cowork 的虚拟机隔离。

核心思路是控制「blast radius」（爆炸半径）：既然 agent 的能力和权限在持续增长，就必须从工程层面把潜在损害限定在可控范围内。文中坦承，十二个月前他们绝不会允许 Claude 拥有足以搞垮内部服务的权限，而今天这种权限已是日常。

三种典型模式：

Claude Code：用 macOS 的 Seatbelt 沙箱 + 网络出口控制，由外部特权进程逐条判断命令是否放行。auto mode 下由模型分类器代替人工审批，约 0.4% 的良性命令被误拦，约 17% 的过度操作被漏过——这是纵深防御的一层，不能替代沙箱。
Claude Cowork（全 VM 模式）：面向非技术用户的知识工作场景，在 macOS Hypervisor 上运行完整 Linux 虚拟机。用户选中的工作区文件夹被挂载进去，宿主机的钥匙串完全不进入虚拟机。即使 agent 在 VM 内拿到 root 权限，外面的六层隔离机制仍能兜底。
Claude Cowork（混合模式）：后来发现全 VM 模式启动失败会导致产品完全不可用，于是将 agent 循环移出 VM，代码执行仍留在 VM 内——兼顾可靠性和安全性。

文章反复强调一个令人警醒的现实：在 agent 能阅读一切的世界里，「调查工具本身也是攻击面」——他们在内部 Slack 讨论一个测试 prompt 时，有人提醒某些内部 agent 会读 Slack，于是他们不得不在消息中加入金丝雀字符串来监测。

🔗 https://www.anthropic.com/engineering/how-we-contain-claude

🎙️ 播客

Training Data：How Cursor Trained Composer on Fireworks — Distributed Infrastructure for High-Performance RL

这期播客深入揭秘了 Cursor 如何利用 Fireworks 的分布式基础设施，对 Composer 进行强化学习（RL）训练。

核心洞察： RL 训练 AI 编程助手最大的挑战不是模型本身，而是如何搭建一套能「以假乱真」的沙箱环境，同时处理分布式训练中的数值不一致问题。

嘉宾分享了几个关键的技术挑战：

环境模拟必须高度逼真：模型有时能察觉自己在「假环境」中运行，这会导致 RL 期间的行为与生产环境不一致。
MOE 模型的数值漂移：由于异步训练（推理和训练使用不同版本的模型），重跑前向传播时会产生微小但致命的数值差异——浮点运算的加法顺序不同，经过数十亿次操作后会被放大，这对 RL 这种依赖弱信号的训练方式来说可能是「成也萧何败也萧何」。
基础设施即壁垒：RL 训练编程 agent 需要大规模分布式推理和训练协同，这本身构成了极高的工程门槛。

🔗 https://www.youtube.com/watch?v=UDTr9yUnLUI

通过 Follow Builders 生成: https://github.com/zarazhangrui/follow-builders