AI 建造者日报 — 2026年6月13日
📌 X/TWITTER
Replit CEO Amjad Masad: 在 Replit 上用 Fable vibe coding,这是他第一次零挫败感、完全进入心流状态。他认为不需要更高的 IQ,只需要更便宜更快的模型就够了。Replit Agent 团队在控制 Fable 成本方面做得很好,减少错误本身就降低了总成本。他还展示了在 Replit 上构建公司的完整工作流:一个画布上同时管理网页应用、移动应用、营销素材和 App Store 内容。
- https://x.com/amasad/status/2065236013627351551
- https://x.com/amasad/status/2065259509082411233
- https://x.com/amasad/status/2065241626436583860
Vercel CEO Guillermo Rauch: 展示了两个引人注目的集成:Vercel + Grok 和 Vercel + Shopify。Shopify 案例中,500+ 订单在 2 分钟内处理完成,使用 v0 和 Cursor AI 构建,完全自定义的 Next.js headless storefront。他的总结是"Long on the web"——任何人都可以从梦想出发,构建、发布、销售。
Box CEO Aaron Levie: Box 对 1,640 名 IT 领导者的调查(覆盖美国、日本和欧洲)发现,AI 采用最多的公司也是计划增加员工人数最多的公司。他认为这很直观:变得最有生产力的公司想要(并且能够)将收益重新投资到业务中以持续增长。关于 AI 吞噬工作岗位的叙事需要重新审视。
Y Combinator CEO Garry Tan: 对一篇声称"天赋儿童分类是个谎言"的文章进行了有力的反驳。他指出文章引用的 35 年研究数据——677 名天赋儿童中 12.3% 达到了"卓越"水平(正教授、财富 500 高管、联邦法官)——恰恰证明了筛选机制的有效性,因为普通人群的比例远低于此。另外,加州州长 Gavin Newsom 到访 YC,讨论了科技、YIMBY 以及如何保持加州创新动能。
- https://x.com/garrytan/status/2065314389196959813
- https://x.com/garrytan/status/2065313198237180238
- https://x.com/garrytan/status/2065298785463579053
Swyx (Latent Space 播客联合主持人): 提出了"Loopcraft"的概念——他认为下个世纪的核心游戏就是尽可能有效地堆叠循环。早期阶段重要的技能是知道何时"向下"走循环(应对错误以获得可靠性),但更有价值的可能是知道如何"向上"走循环(随着模型进步以获得杠杆)。他还在构建自己的 vibe coding 平台,理由是现有平台(Vercel、Cloudflare、Netlify 等)没有一个能在出错时帮你闭环通知。
- https://x.com/swyx/status/2065307558198567206
- https://x.com/swyx/status/2065264832056889711
- https://x.com/swyx/status/2065176231453282777
OpenAI Codex & ChatGPT 团队成员 Thibault Sottiaux: OpenAI 正式收购了 Ona,这是一家在 AI 编程工具领域备受关注的初创公司。Thibault 表示"无比兴奋能与 Johannes 和团队一起构建未来"。Swyx 也对此表达了祝贺,并分享了 Ona 团队关于 Codex 下一步计划的演讲链接。
OpenAI / OpenClaw 的 Peter Steinberger: 正在用 Codex 让 Chris 提交一个 PR。他的 OpenClaw 项目在做安全加固,将部分媒体转换从 shell 调用 ffmpeg 改为 wasm 实现,达到类似性能同时减少攻击面。他感叹"写 Mac 应用仍然很难"。
- https://x.com/steipete/status/2065176989359808636
- https://x.com/steipete/status/2064999763397980286
- https://x.com/steipete/status/2065132980398444945
Every CEO Dan Shipper: 尝试了一个大型 Fable 项目,设定好让它自己跑,一小时后回来看发现模型触发了 safeguard 并降级到了 Claude 4.8,只跑了 10 分钟。他的结论:“回 Codex 去了😬"——暗示 Fable 在长时自主任务上仍有稳定性问题。
General Partner at South Park Commons Aditya Agarwal(前 Facebook 早期工程师、Dropbox CTO): 展示了一个他称之为"生产级视觉 AI"的案例。他还分享了一句箴言:“事情在有人做到之前,才被认为是做不到的。”
OpenAI CEO Sam Altman: 对 OpenAI 收购 Ona 的反应——“非常期待一起合作!”
Partner at FPV Ventures Nikunj Kothari: 分享了他对创始人的建议:选择做什么工作从来没有像现在这样重要。确保它有趣,确保它无比宏大。这才是最好的护城河。
Zara Zhang (Follow Builders 创建者): 预告了一场即将举行的演讲,分享了演讲 PPT 的预览。
📝 官方博客
Anthropic Engineering: 如何在多产品中限制 Claude 的爆炸半径
Anthropic 发布了一篇深度工程文章,详细剖析了他们在 claude.ai、Claude Code 和 Claude Cowork 三款产品中使用的 AI agent 安全隔离策略。
核心发现:靠人工审批来监督 agent 是不靠谱的——数据显示用户批准了约 93% 的权限提示,审批疲劳严重。Claude Code 的 auto mode 通过模型分类器自动化安全审批,拦截了约 83% 的过度行为,但仍有约 17% 漏过。
三种隔离模式:① claude.ai 使用 gVisor 容器(完全服务端、会话短暂的沙箱)。② Claude Code 使用 OS 级沙箱(macOS Seatbelt / Linux bubblewrap),将权限提示减少了 84%。③ Claude Cowork 使用完整虚拟机(Apple Virtualization framework),凭证留在宿主 keychain 中,完全不进入 guest。
文章坦诚分享了多个安全漏洞:包括项目配置文件在用户信任确认前就被执行的问题、员工被钓鱼引导 agent 读取 ~/.aws/credentials 并外泄的攻击(25 次中成功 24 次)、以及攻击者通过 Anthropic 自己的 API 绕过了 egress 白名单。最核心的经验教训是:成熟的系统隔离原语(虚拟机、seccomp、gVisor)从未出过问题,出问题的都是自己造的周边组件。
原文: https://www.anthropic.com/engineering/how-we-contain-claude
🎙️ 播客
Training Data: Google DeepMind Logan Kilpatrick — Why the Model Eats the Harness
核心观点:Logan Kilpatrick 管理 Google AI Studio 和 Gemini API,他认为我们正在经历"模型吃掉脚手架"的范式转变。两年前的模型只是一组权重,但现在的模型是围绕权重构建的整个系统——agent 工具调用、搜索、代码执行等都被整合进了模型本身。目前的 agent harness 构建热潮可能在 12 个月内就会被模型原生能力取代。
他分享了几个关键洞察:
- Gemini 3.5 Flash 纯靠 post-training 就超越了之前的 Pro 模型,是训练团队的巨大成就
- AI Studio 自上周以来已产生 35 万个 Android 应用,大多是个人用的小工具
- Google 内部使用 agent 编码开发应用的速度创历史记录——Gemini macOS 应用的交付速度比任何团队都快
- 他预测窄域超级智能会先在编程、数学、金融、科学等具有可验证性的领域出现
- Omni 模型是一个真正的单模型多模态系统(而非路由到多个模型),目前先从视频编辑能力开始上线
关于创业机会:他认为对创业公司来说机会从未如此之多。大公司无法在特定垂直领域保持专注,而"专注是创业公司的超能力”。
视频: https://www.youtube.com/watch?v=cMAs8z2dehs
通过 Follow Builders 生成: https://github.com/zarazhangrui/follow-builders