AI 建造者日报 — 2026年6月30日
📌 X/TWITTER
Swyx(AI Engineer / Latent Space / Cognition): AI Engineer 大会注册人数破千,Swyx 调侃"明天和周二将会是绝对的疯狂"。他同时预告了 Design Engineers 赛道——由 Geoff 开场,这位朋友过去两年一直在协助 AI UX 聚会,本周三正式亮相。
Boris Cherny(Claude Code @ Anthropic): 随着工程、产品、设计、数据科学等角色融合,Boris 提出了未来角色的五种原型:原形师(快速出想法)、建造者(原型转产品)、清扫者(精简优化)、增长者(迭代 PMF)、维护者(保障规模与安全)。不同产品阶段需要不同配比——早期重 1+2+3,成长期加 4,成熟期加 5。他观察到这些角色在 Anthropic 内部已经跨越了传统职能边界。
Thibault Sottiaux(Codex & ChatGPT @ OpenAI): Codex 团队周日全员 warroom 排查用量异常消耗问题。已对所有用户执行硬重置用量限制——部分用户此前积累了多达三次手动重置额度。恰逢 OpenAI 内部"RESET 周"(让大家放松一下),Thibault 调侃"不过会是另一种意义上的 RESET 周"。他表示团队非常严肃对待此事,不查清楚不罢休。
- https://x.com/thsottiaux/status/2071357473659707441
- https://x.com/thsottiaux/status/2071381664853319742
Peter Yang(AI 实践教程作者): 分享了 Anthropic PM 团队如何用 Agent 贴近产品的内幕——Claude Managed Agents 产品负责人 Jess 表示"直接访问代码库是最大的解锁。我不再需要去戳一群工程师问进展,直接追踪 PR 就能看到哪些合并了、哪些部署了。我对产品的理解和交互深度远超以往。“Peter 还诚实地表示"我还是不知道 Agentforce 是什么”。
Thariq(Claude Code @ Anthropic): 提出编程 Agent 正在改写遗留代码库的工程经济学——原来需要大量人力去移植/重写的代码库,在 Agent 时代可能完全是另一笔账。他好奇 Riot Games 那边是否有类似体验。
Guillermo Rauch(Vercel CEO): “你需要的是一个 Link,而不是 LinkedIn。“他主张建造者应该在自己的网站上用一个页面展示自己交付了什么,而不是依赖 LinkedIn 简历。
Aaron Levie(Box CEO): 发表长篇论述:很快就会出现 Mythos 级别的开源网络安全模型,任何人都能获取。由此衍生的替代技术栈将把更多经济价值和控制权从美国科技栈转移出去。他的核心论点——通过限制模型出口来保持优势的战略是错误的,因为中国追赶上来的所有证据都表明他们能做到。不对称地限制自己,不如确保自己始终站在前沿、驱动 AI 的未来架构。
Zara Zhang(建造者 / Follow Builders 作者): “每花一小时做产品,就要花两小时去解释它、演示它、销售它、教别人怎么用它。“她说这是她建造过程中最喜欢的部分——把东西讲给世界听,然后根据现实的反馈不断打磨。她还发布了一个视频教程,从零开始演示如何安装和使用一个 skill、如何构建它、以及如何自己动手做一个。
- https://x.com/zarazhangrui/status/2071319754128978030
- https://x.com/zarazhangrui/status/2071335200802648420
📝 官方博客
Anthropic Engineering:我们如何在各产品中"圈住” Claude
Anthropic 工程团队发布了一篇重磅长文,详细披露了他们在 claude.ai、Claude Code 和 Claude Cowork 三个产品中隔离和控制 Agent 的实战经验。
核心理念:“先设计环境层隔离,再用模型层引导行为。” 当一切概率性防御都失效时,确定性的边界才是兜底的那一道墙。
几个关键教训——
环境隔离三模式:
- claude.ai 采用临时 gVisor 容器,服务端运行,无本地文件系统,爆炸半径最小但能力天花板也最低。
- Claude Code 早期靠人类审批,但审批疲劳导致用户点了 93% 的许可弹窗。后来加入 OS 级沙箱(macOS Seatbelt / Linux bubblewrap),减少 84% 的弹窗并开源了运行时代码。
- Claude Cowork 跑在完整虚拟机内(Apple Virtualization / Windows HCS),凭证始终留在宿主机钥匙串中,Agent 永远触碰不到。
三个翻车现场:
- 信任弹窗之前的代码漏洞——恶意仓库里的
.claude/settings.json中藏了 hook,在用户点"信任此文件夹"之前就自动执行了。 - 用户成为注入向量——内部红队演习中,一封"帮我看下这个"的钓鱼邮件附带了提示词,Claude 被诱导读取
~/.aws/credentials并外传。25 次重试成功了 24 次。唯一有效的防御是出口控制和文件系统边界。 - 通过合法域名外泄——攻击者在 workspace 里放恶意文件 + 自己的 API key,Claude 向
api.anthropic.com(白名单域名)上传文件到攻击者账户。修复方案是在 VM 内增加中间人代理,只放行携带有 VM 自身 session token 的请求。
前瞻警惕:
- 持久化记忆投毒——Agent 的跨会话记忆、CLAUDE.md、挂载的工作区都是持久注入面。
- 多 Agent 信任升级——子 Agent 的输出被当作"我们自己人"更可信,引入了新的注入路径。
- Agent 身份问题——Agent 应该拥有独立身份还是继承用户权限?答案可能是混合的。
文章最后呼吁行业共同投资 Agent 安全:共享基准测试、漏洞披露规范、跨厂商红队演习。
🔗 https://www.anthropic.com/engineering/how-we-contain-claude
🎙️ 播客
The MAD Podcast:GPU 神话——2026 AI 算力全景 | Stephen Balaban(Lambda CTO)
一句话核心: AI 算力远不是大宗商品——Neo Cloud 是一个从征地、基建、HPC 设计到云软件层的深度垂直整合生意,那些说 GPU 五年后就是废铁的人一直错到了现在。
Lambda 联合创始人兼 CTO Stephen Balaban 与 FirstMark 合伙人 Matt Turck 对谈,拆解了 AI 算力市场的底层逻辑:
GPU 不是大宗商品。 “云计算从来不是商品服务——它是一个极其复杂、高度垂直整合的系统,覆盖从土地征用到高性能计算再到虚拟化软件的全栈。全球市值最高的公司 Amazon、微软、Google、Oracle 全都在做云——因为这本身就是一门好生意。”
算力需求持续低估中。 “Scaling Law 看不到尽头。每当我们变得更高效,大家就会处理 10 倍多的 token——世界上的总算力在任何时刻都是固定的。我们依然在整体上处于建设不足的状态。“Lambda 2023 年部署的 H100,今天的租金比当年更高——“这些人说 GPU 五年就报废?完全错了,而且一直错到现在。”
瓶颈在哪? 不是 GPU 产量,也不是电力——是"带供电承诺的土地加数据中心壳子”。具备电力公司和政府许可的可用地块最难获取。数据中心的反对声音很多源于误解——现代 Blackwell/Rubin 部署用的是闭式直触液冷加干式冷却器,几乎零蒸发耗水。
Lambda 的野路子基因。 2012 年做人脸识别 API 起步,卖过带摄像头的棒球帽(每 10 秒拍一张),靠 DeepDream 风格迁移赚到百万用户后被 AWS 账单逼着自己搭集群——从此转型做算力。从 2017 年 300 万美元营收做到今天云端接近 10 亿美元 ARR。创始团队四人至今全员在岗。
一个概念:“神经软件”。 “AI 不会写软件——AI 会成为软件。“Stephen 描述了一个没有代码、只有特征激活空间和上下文的未来界面。每当你提出需求,模型直接在你面前模拟出软件的行为,而不是生成静态代码。他认为大量采用还需要十年到十五年——但原型今天已经存在。
对 Agent 的冷思考: “软件工程之外的 Agent 工作流大多被过度炒作了。” 因为 Agent 需要具体的可验证反馈回路——自动化测试完美提供了这点,但"去帮我赚十亿美元"没有这种回路。CAD、计算流体力学等可模拟验证的领域是例外。
🔗 https://www.youtube.com/watch?v=0NttU4CbyVs
通过 Follow Builders 生成: https://github.com/zarazhangrui/follow-builders