TC分享第 214 期

2025 week 5

你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。

Total visitor

本周摄影:

新闻思考

DeepSeek R1 的发布在全球 AI 领域引起了巨大反响,尤其是在技术创新和市场影响方面带来了深远的变化。它的最大突破在于证明了强化学习在大模型训练中的可行性,特别是在降低标注数据成本方面的作用。过去,AI 训练依赖于大量人工标注的数据,而强化学习的引入意味着 AI 未来可能更加依赖自适应优化,从而减少对高质量人工标注数据的需求。这可能改变 AI 训练范式,使模型具备更强的自我学习能力。

从市场影响来看,DeepSeek R1 发布后,英伟达股价当天暴跌 16%。这一现象的出现可能有多重因素:首先,市场可能重新评估 AI 计算的需求,如果强化学习减少了 AI 训练所需的计算量,未来对 GPU 的需求增速可能放缓;其次,DeepSeek 采取开源策略,可能加速开源 AI 生态的崛起,削弱封闭式 AI 公司对算力的垄断;此外,市场情绪的短期波动也可能放大了这一影响。不过,随后科技股股价回升,表明投资者逐渐认识到 DeepSeek 的成功并不意味着某家公司或某个国家的失败,而是 AI 技术整体的进步。

值得注意的是,OpenAI 在 DeepSeek R1 引发市场热议后迅速推出了 O3 Mini,该模型同样支持“推理 + 搜索”能力。这表明 AI 竞争进入了更高强度的技术迭代期,创新带来的市场压力正在加速大公司之间的产品更新。

DeepSeek 选择完全开源,不仅开放模型,还公开训练方法,与 OpenAI、Anthropic 等公司采取的封闭式商业化模式形成对比。开源模式的优势在于促进创新,使更多研究者能够基于现有模型改进 AI,同时降低中小企业和个人开发者的使用门槛。然而,开源也带来了隐私安全、滥用风险、商业模式等挑战,因此 AI 未来的发展可能在开源与封闭之间寻找平衡。

值得关注的是,DeepSeek 的成功不应被视为“中美 AI 战争”的一部分,而是人类整体技术进步的表现。无论是 OpenAI 还是 DeepSeek,核心目标都是推动 AI 发展,提高生产力,最终惠及全球。AI 竞争的焦点正在从单纯的算力比拼转向技术创新和应用落地,未来的关键在于谁能率先突破技术瓶颈,并将 AI 更快地融入实际应用场景。

科技新闻

【1】DeepSeek多岗位招新,实习生日薪最高上千元

招聘网站显示,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

Deepseek在美国引发热议,结果导致英伟达暴跌,因为大家发现不需要很很多显卡也能跑出很棒的大模型

【2】小红书美国日活量在19号达3千多万,相当于近1/10的美国人口。

【3】英伟达大赞DeepSeek 英伟达回应DeepSeek横空出世

英伟达称DeepSeek R1是“一项出色的人工智能进步”,尽管这家人工初创公司的崛起导致英伟达股价周一暴跌17%。

英伟达发言人周一表示:“DeepSeek是一项出色的人工智能进步,也是测试时间缩放的完美例子。”“DeepSeek的工作说明了如何使用该技术创建新模型,利用广泛可用的模型和完全符合出口管制的计算。”

在此之前,DeepSeek上周发布了R1,这是一个开源推理模型,据报道,它的表现超过了OpenAI等美国公司的最佳模型。R1自我报告的培训成本不到600万美元,与硅谷公司花费数十亿美元建立人工智能模型的成本相比,这只是一个零头。

英伟达的声明表明,它认为DeepSeek的突破将为这家美国芯片制造商的图形处理单元(GPU)创造更多的工作。

“推理需要大量的英伟达GPU和高性能网络,”发言人补充说。“我们现在有三个缩放定律:训练前定律和训练后定律,它们会继续,还有新的测试时间缩放定律。”

【4】扎克伯格谈DeepSeek全球爆火

#扎克伯格说中美之间的AI差距非常小#近一周,来自中国的深度求索(DeepSeek)全球爆红,尤其让美国硅谷极为震撼和恐慌。其最新发布的R1大模型不仅在性能上比肩甚至超越了OpenAI的o1,并完全开源,且以对手3%的超低成本实现了这一突破。

AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)接受电视媒体公开采访时表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI差距非常小。扎克伯格还表示,中国正在全力冲刺,如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。

【5】英伟达平台已上线DeepSeek

据中新网,英伟达网站显示,DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。英伟达网站介绍称,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。

现在,美国科技公司亚马逊、英伟达、微软等已上线部署支持用户访问DeepSeek-R1模型。

【6】中方回应日本拟对华半导体等出口管制

有记者问:1月31日,日本政府宣布拟对十余种半导体相关物项实施出口管制,并将多家中国企业列入“最终用户清单”等。请问中方对此有何评论?

当前,日方相关措施正在面向社会公众征求意见。我们希望日方听取业界理性声音,从维护国际经贸规则及中日经贸合作大局出发,及时纠正相关做法,避免有关措施阻碍中日两国经贸关系健康发展,共同维护全球产业链供应链稳定畅通。中方将保留采取措施的权利,坚决维护自身合法权益。

【7】OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能

美国OpenAI公司周五正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。

【10】马斯克谈FSD进中国的困难……

优秀的项目

【1】exelban/stats

macOS system monitor in your menu bar

【2】Jiayi-Pan/TinyZero

Clean, minimal, accessible reproduction of DeepSeek R1-Zero

优秀的文章

【1】揭秘DeepSeek:一个更极致的中国技术理想主义故事

【2】光明的尾巴

【3】做播客第 4 年,我学到的十件事

【4】Jailbreaking DeepSeek R1 - Prompt Injection Using Charcodes

优秀的视频

【1】芙芙的奇妙冒险

有趣的事情

【1】“我就想试下”

【2】量化的正确用法

【3】deepseek的成功老外害不害怕先不说,百度的死活那是板上钉钉了。

【4】雍和宫现“抢头香”大场面!4万香客早7点有序进入雍和宫——零下10度排队10小时

【5】中国人饮食结构六十年变化

【6】deepseek锐评红薯、抖、b站、知乎、微博