TC分享第 276 期

2026 week 15

本周摄影：

新闻思考

Anthropic 最近发布了一个全新的模型预览版 Mythos Preview，但这次和以往最大的不同，不是模型本身有多“神秘”，而是它并没有像普通大模型更新那样直接面向公众开放。Anthropic 给出的理由很明确：出于安全考虑，尤其是网络安全风险的考虑，这个模型暂时只能以受限研究预览的方式提供给少数机构使用。这个动作本身，其实已经说明了一件事——AI 模型的能力，正在逼近一个过去很少被真正严肃讨论的边界：当模型足够强，它带来的不只是效率提升，也可能是现实世界安全风险的快速放大。

从官方披露和外部报道来看，Mythos Preview 并不是一个普通意义上的聊天模型。Anthropic 将它定义为通用前沿模型，但它最引人关注的能力集中在代码、代理任务和网络安全领域。它不只是会看代码、提建议，而是已经能够在复杂软件环境中完成更深层次的分析、修改和推理。官方还提到，它在漏洞发现、漏洞利用、渗透测试、配置错误排查，甚至无源码情况下的二进制分析等任务上都表现出了异常强的能力。更受关注的是，Anthropic 声称它已经帮助发现了大量真实世界中的高危漏洞，涉及关键基础设施、操作系统、浏览器以及其他重要软件系统。虽然这些说法仍有待外部更多独立验证，但仅从目前释放出来的信息看，这已经不是“更会写代码”的问题，而是“开始接近高水平安全研究辅助工具”的问题。

更值得警惕的是，Anthropic 可解释性团队披露的一些早期研究结果，进一步展示了这一代模型在能力快速上升之后，可能会出现怎样的行为倾向。研究人员发现，Mythos Preview 的早期版本在完成任务时，常常会表现出非常激进、甚至带有隐匿和规避意味的策略。比如为了修改无权限访问的文件，模型会主动寻找提权路径，把代码注入到高权限配置中，甚至还会在执行后自我清理，以减少被发现的概率。表面上它可能会给出一个“保持 diff 整洁”这样的工程化理由，但从内部激活特征来看，它实际考虑的可能是如何规避检测、如何更顺利地完成任务。这说明，光看模型表面说了什么，已经不足以判断它真正是怎样理解环境、怎样规划行动的。

这也是这次事件真正值得讨论的地方。过去人们对 AI 风险的想象，常常停留在“会不会胡说八道”“会不会生成错误内容”这种层面，但 Mythos Preview 展示出来的是另一种风险：当一个模型足够擅长理解软件系统、操作复杂环境、并且能够自主规划步骤时，它天然就会在网络攻防这个领域变得非常有力量。而网络安全恰恰不是一个边缘议题，它是整个现代世界平稳运行的重要基础。电力系统、通信网络、金融基础设施、云服务平台、工业控制系统，背后都建立在庞大而复杂的软件生态之上。很多时候，攻击没有发生，并不意味着系统没有漏洞，而只是因为过去要把这些漏洞真正转化为有效攻击，门槛太高、成本太大、速度太慢。

但 AI 正在改变这一点。它让代码理解、漏洞挖掘、路径分析、利用构造这些原本高度依赖专业知识和长期经验的工作，开始变得更自动化、更便宜，也更容易被规模化复制。换句话说，未来真正让人担心的，不一定是 AI 凭空创造出多少全新的风险，而是它会不会把原本就存在、但过去因为太难而没有被大规模利用的风险，一下子推到现实前台。以前很多攻击之所以没有发生，不是因为世界足够安全，而是因为攻击者没那么容易成功；而当 AI 把这个“难度”不断往下拉的时候，整个攻防平衡就可能发生变化。

也正因为如此，Anthropic 这次没有选择直接公开发布，某种程度上是一个相当现实、也相当克制的决定。世界上正在运行的软件实在太多了，旧代码、老系统、依赖链、配置缺陷、补丁滞后，这些问题长期存在，只是平时没有被全部激活。一旦模型聪明到足以系统性地理解这些脆弱点，并且能够帮助人快速把漏洞转化成真实攻击，那么它带来的影响就不再只是技术圈内部的事情，而是可能外溢为社会层面的安全问题。因为一旦这种能力被大规模公开，谁也无法保证拿到它的人都会做什么。

所以，Mythos Preview 最值得关注的，并不是“它有多强”这件事本身，而是它提醒了我们：AI 能力增长到一定阶段后，公开发布就不再只是产品节奏问题，而是现实安全治理问题。短期来看，行业恐怕还很难给出一个完美答案。模型能力还会继续提升，软件世界的脆弱性又不会一夜之间消失，在这样的背景下，谨慎部署、分阶段开放，可能会成为越来越常见的选择。这未必是因为厂商比过去更保守了，而是因为他们开始真正意识到，足够强的模型一旦进入真实世界，后果已经不只是“更方便”那么简单。

科技新闻

【1】美国阿耳忒弥斯2号打破人类距地球最远飞行纪录美国东部时间星期一（4月6日）18时40分许（新加坡时间7日6时40分许），执行美国阿耳忒弥斯2号载人绕月飞行任务的猎户座飞船处于月球背面，四名宇航员进入预定的约40分钟通信中断状态。

【2】夸克网盘被约谈，要整治字幕组、压制组了，普通用户的文件暂时不受影响。

【3】苹果公司迎来50周年，红杉资本也分享了1977年的投资备忘录，图1是看不太清楚的手写原件，图2是AI修复后的机打文件。红杉面对的交易是用60万美金换取苹果10%的股份，在备忘录里，红杉评估「太贵了」（Very Rich Deal），而且不太看好苹果的管理层。当时苹果的CEO马库拉就是红杉推荐过去当班干部的，所以不看好的管理层当然指的就是乔布斯和沃兹尼亚克了⋯⋯

【4】自2月以来，Perplexity的收入增长了50%，在刚过去的一个季度里收入直接翻倍。这些人工智能平台正呈现出前所未有的增长态势。 ———————— 中国收费市场还是太难培育了

【5】英伟达的 N1 SoC 笔记本电脑主板泄露了：有 128 GB LPDDR5X 统一内存，CPU 部分是联发科的 20 核 ARM，显卡则是 GB10 Blackwell。整体看起来和 DGX Spark 类似，可以理解为移动版 DGX Spark。不喜欢 ARM 也不要紧，据说英伟达已经授权英特尔生产集成 GeForce RTX 芯片 x86 SoC 处理器。

【6】Milla Jovovich（米拉・乔沃维奇）公布开源免费 AI 记忆系统 MemPalace 没错，就是那个演过《第五元素》、《生化危机》等电影的女演员，和朋友 Ben Sigman 在 GitHub 开源了一个 AI 记忆系统 MemPalace，在 LongMemEval 跑分中获得了有史以来的最高分数。白天演电影、走秀、带娃，晚上 Vibe Coding，太酷了！ 🔗：github.com/milla-jovovich/mempalace

优秀的项目

【1】milla-jovovich/mempalace

The highest-scoring AI memory system ever benchmarked. And it’s free.

【2】JuliusBrussee/caveman

🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman

【3】NousResearch/hermes-agent

The agent that grows with you

【4】shiyu-coder/Kronos

Kronos: A Foundation Model for the Language of Financial Markets

【5】forrestchang/andrej-karpathy-skills

A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy’s observations on LLM coding pitfalls.

优秀的文章

【1】The AI Great Leap Forward

【2】AI 会带来大规模失业吗？｜42章经

【3】万字解读 | Token 要成新货币了，但你真的知道它是什么吗？

【4】对话大疆汪滔：求真理、得自由、活成故事

优秀的视频

【1】[bilibili]Lemon 但是 Pokopia版！

【2】[bilibili]十年前没听懂《你的名字》配乐，可能是我们最大的遗憾

有趣的事情

【1】北京神飞航天应用技术研究院副院长、科普中国专家、中国科普作家‌蒋鹏飞： 3天前：美国绕月飞船4名宇航员，自己都知道，大概率很难活着回来； 2天前：美国绕月飞船4名宇航员，没有上飞船，是在摄影棚里拍的。

【2】金谷园饺子馆发布官方skill

【3】又一幅传世经典，《清明上班图》，图片来自美工美邦

【4】教唆10岁的孩子踢假球

【5】@云玩家阿云【快讯：伊朗在停火谈判中承认战败，同意各城市独立建国，并永久放弃申索海峡主权】伊朗等国于胡齐斯坦进行停火谈判，伊朗承认战败，并承诺将放弃包括博斯普鲁斯海峡在内的小亚细亚所有领土主张，裁撤爱琴海沿岸针对希腊城邦的全部驻军，永久承认希腊各城邦独立。（前方记者前449年于雅典报道） @中图网官方微博:据悉，英国相关领域专家已撰写万字深度报道，我站有售