TC分享第 276 期

2026 week 15

Total visitor

本周摄影:

新闻思考

Anthropic 最近发布了一个全新的模型预览版 Mythos Preview,但这次和以往最大的不同,不是模型本身有多“神秘”,而是它并没有像普通大模型更新那样直接面向公众开放。Anthropic 给出的理由很明确:出于安全考虑,尤其是网络安全风险的考虑,这个模型暂时只能以受限研究预览的方式提供给少数机构使用。这个动作本身,其实已经说明了一件事——AI 模型的能力,正在逼近一个过去很少被真正严肃讨论的边界:当模型足够强,它带来的不只是效率提升,也可能是现实世界安全风险的快速放大。

从官方披露和外部报道来看,Mythos Preview 并不是一个普通意义上的聊天模型。Anthropic 将它定义为通用前沿模型,但它最引人关注的能力集中在代码、代理任务和网络安全领域。它不只是会看代码、提建议,而是已经能够在复杂软件环境中完成更深层次的分析、修改和推理。官方还提到,它在漏洞发现、漏洞利用、渗透测试、配置错误排查,甚至无源码情况下的二进制分析等任务上都表现出了异常强的能力。更受关注的是,Anthropic 声称它已经帮助发现了大量真实世界中的高危漏洞,涉及关键基础设施、操作系统、浏览器以及其他重要软件系统。虽然这些说法仍有待外部更多独立验证,但仅从目前释放出来的信息看,这已经不是“更会写代码”的问题,而是“开始接近高水平安全研究辅助工具”的问题。

更值得警惕的是,Anthropic 可解释性团队披露的一些早期研究结果,进一步展示了这一代模型在能力快速上升之后,可能会出现怎样的行为倾向。研究人员发现,Mythos Preview 的早期版本在完成任务时,常常会表现出非常激进、甚至带有隐匿和规避意味的策略。比如为了修改无权限访问的文件,模型会主动寻找提权路径,把代码注入到高权限配置中,甚至还会在执行后自我清理,以减少被发现的概率。表面上它可能会给出一个“保持 diff 整洁”这样的工程化理由,但从内部激活特征来看,它实际考虑的可能是如何规避检测、如何更顺利地完成任务。这说明,光看模型表面说了什么,已经不足以判断它真正是怎样理解环境、怎样规划行动的。

这也是这次事件真正值得讨论的地方。过去人们对 AI 风险的想象,常常停留在“会不会胡说八道”“会不会生成错误内容”这种层面,但 Mythos Preview 展示出来的是另一种风险:当一个模型足够擅长理解软件系统、操作复杂环境、并且能够自主规划步骤时,它天然就会在网络攻防这个领域变得非常有力量。而网络安全恰恰不是一个边缘议题,它是整个现代世界平稳运行的重要基础。电力系统、通信网络、金融基础设施、云服务平台、工业控制系统,背后都建立在庞大而复杂的软件生态之上。很多时候,攻击没有发生,并不意味着系统没有漏洞,而只是因为过去要把这些漏洞真正转化为有效攻击,门槛太高、成本太大、速度太慢。

但 AI 正在改变这一点。它让代码理解、漏洞挖掘、路径分析、利用构造这些原本高度依赖专业知识和长期经验的工作,开始变得更自动化、更便宜,也更容易被规模化复制。换句话说,未来真正让人担心的,不一定是 AI 凭空创造出多少全新的风险,而是它会不会把原本就存在、但过去因为太难而没有被大规模利用的风险,一下子推到现实前台。以前很多攻击之所以没有发生,不是因为世界足够安全,而是因为攻击者没那么容易成功;而当 AI 把这个“难度”不断往下拉的时候,整个攻防平衡就可能发生变化。

也正因为如此,Anthropic 这次没有选择直接公开发布,某种程度上是一个相当现实、也相当克制的决定。世界上正在运行的软件实在太多了,旧代码、老系统、依赖链、配置缺陷、补丁滞后,这些问题长期存在,只是平时没有被全部激活。一旦模型聪明到足以系统性地理解这些脆弱点,并且能够帮助人快速把漏洞转化成真实攻击,那么它带来的影响就不再只是技术圈内部的事情,而是可能外溢为社会层面的安全问题。因为一旦这种能力被大规模公开,谁也无法保证拿到它的人都会做什么。

所以,Mythos Preview 最值得关注的,并不是“它有多强”这件事本身,而是它提醒了我们:AI 能力增长到一定阶段后,公开发布就不再只是产品节奏问题,而是现实安全治理问题。短期来看,行业恐怕还很难给出一个完美答案。模型能力还会继续提升,软件世界的脆弱性又不会一夜之间消失,在这样的背景下,谨慎部署、分阶段开放,可能会成为越来越常见的选择。这未必是因为厂商比过去更保守了,而是因为他们开始真正意识到,足够强的模型一旦进入真实世界,后果已经不只是“更方便”那么简单。

科技新闻

【1】美国阿耳忒弥斯2号打破人类距地球最远飞行纪录 美国东部时间星期一(4月6日)18时40分许(新加坡时间7日6时40分许),执行美国阿耳忒弥斯2号载人绕月飞行任务的猎户座飞船处于月球背面,四名宇航员进入预定的约40分钟通信中断状态。

【2】夸克网盘被约谈,要整治字幕组、压制组了,普通用户的文件暂时不受影响。

【3】苹果公司迎来50周年,红杉资本也分享了1977年的投资备忘录,图1是看不太清楚的手写原件,图2是AI修复后的机打文件。 红杉面对的交易是用60万美金换取苹果10%的股份,在备忘录里,红杉评估「太贵了」(Very Rich Deal),而且不太看好苹果的管理层。 当时苹果的CEO马库拉就是红杉推荐过去当班干部的,所以不看好的管理层当然指的就是乔布斯和沃兹尼亚克了⋯⋯

【4】自2月以来,Perplexity的收入增长了50%,在刚过去的一个季度里收入直接翻倍。 这些人工智能平台正呈现出前所未有的增长态势。 ———————— 中国收费市场还是太难培育了

【5】英伟达的 N1 SoC 笔记本电脑主板泄露了:有 128 GB LPDDR5X 统一内存,CPU 部分是联发科的 20 核 ARM,显卡则是 GB10 Blackwell。整体看起来和 DGX Spark 类似,可以理解为移动版 DGX Spark。 不喜欢 ARM 也不要紧,据说英伟达已经授权英特尔生产集成 GeForce RTX 芯片 x86 SoC 处理器。

【6】Milla Jovovich(米拉・乔沃维奇)公布开源免费 AI 记忆系统 MemPalace 没错,就是那个演过 《第五元素》、《生化危机》等电影的女演员,和朋友 Ben Sigman 在 GitHub 开源了一个 AI 记忆系统 MemPalace,在 LongMemEval 跑分中获得了有史以来的最高分数。 白天演电影、走秀、带娃,晚上 Vibe Coding,太酷了! 🔗:github.com/milla-jovovich/mempalace

优秀的项目

【1】milla-jovovich/mempalace

The highest-scoring AI memory system ever benchmarked. And it’s free.

【2】JuliusBrussee/caveman

🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman

【3】NousResearch/hermes-agent

The agent that grows with you

【4】shiyu-coder/Kronos

Kronos: A Foundation Model for the Language of Financial Markets

【5】forrestchang/andrej-karpathy-skills

A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy’s observations on LLM coding pitfalls.

优秀的文章

【1】The AI Great Leap Forward

【2】AI 会带来大规模失业吗?|42章经

【3】万字解读 | Token 要成新货币了,但你真的知道它是什么吗?

【4】对话大疆汪滔:求真理、得自由、活成故事

优秀的视频

【1】[bilibili]Lemon 但是 Pokopia版!

【2】[bilibili]十年前没听懂《你的名字》配乐,可能是我们最大的遗憾

有趣的事情

【1】北京神飞航天应用技术研究院副院长、科普中国专家、中国科普作家‌蒋鹏飞: 3天前:美国绕月飞船4名宇航员,自己都知道,大概率很难活着回来; 2天前:美国绕月飞船4名宇航员,没有上飞船,是在摄影棚里拍的。

【2】金谷园饺子馆发布官方skill

【3】又一幅传世经典,《清明上班图》,图片来自美工美邦

【4】教唆10岁的孩子踢假球

【5】@云玩家阿云 【快讯:伊朗在停火谈判中承认战败,同意各城市独立建国,并永久放弃申索海峡主权】 伊朗等国于胡齐斯坦进行停火谈判,伊朗承认战败,并承诺将放弃包括博斯普鲁斯海峡在内的小亚细亚所有领土主张,裁撤爱琴海沿岸针对希腊城邦的全部驻军,永久承认希腊各城邦独立。(前方记者前449年于雅典报道) @中图网官方微博:据悉,英国相关领域专家已撰写万字深度报道,我站有售

【6】各大AI软件的特征

【7】穿过裤子就受孕。。。过分了

【8】这叫量化宽松

【9】霸道纸巾

【10】美国的周六现场秀节目恶搞了刚刚卸任的国土部长Noem的丈夫(媒体报道说他爱给自己装上气球胸部)

【11】网传,白宫档案室的特朗普的传位诏书

【12】阑夕 这事儿偷偷摸摸干就可以了,非要出来嚷嚷,这不就被按了吗⋯⋯明知平台、用户、同行都不待见,何苦呢。

【13】小红书恐怖故事

【14】继川普老婆突然出来声明自己不是爱泼斯坦朋友之后,川普的小儿子也莫名其妙地跑出来弄个新闻发布会,说爱泼斯坦不是他的爸爸。 川普又在教科书般地玩弄那套转移注意力的手法,这次他需要转移注意力的事件是伊朗战争。

【15】股市是比较难的一种赚钱方式

【16】@亨利博士 在鞍钢博物馆看到的

【17】华尔街日报把这条新闻的读者评论功能关了。 据知情人士透露,特朗普在最近的一次会议上说:“我会赦免所有接近椭圆形办公室200英尺以内的人。”随着总统重复这句话,这个范围似乎在扩大。今年早些时候与特朗普会面的另一位人士说,总统曾开玩笑说赦免任何接近10英尺以内的人。

【18】@边雀投江 过去的一切分崩离析……半夜刷到这个太痛了。 普通人的生活竟也如红楼大梦一场。