TC分享第 164 期

2024 week 7

你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。

Total visitor

本周摄影

新闻思考

OpenAI的Sora模型发布了,这个模型可以生成长达60秒的视频,再次震惊了世界。

demo

在Sora出现之前,文生视频的创业公司也不少,但生成时间只有几秒钟,而且视频质量都比较低,但是Sora可以生成长达60秒的视频,而且质量达到了1080P,这个模型的发布对于AI文生视频创作行业来说是一个巨大的冲击。

OpenAI也发布了技术报告,可以看出是基于以Transformer为主干的扩散模型(DIT),一大创新是使用了时空patch。[解读] 相信不久的将来,我们会看到更多的开源版本的Sora, 大大提升文生视频AI的效果。

我相信开源世界肯定会达到Sora的效果,就是只是时间问题。我们可以看到,在文生图领域, OpenAI的Dalle2 是2022年1月推出的,而Midjourney是在2022年7月12日进入公开测试阶段,stable Diffusion是在 2022 年 8 月 推出的。所以估计半年就会有类似的开源版本。

开源社区在推动技术发展和促进创新方面扮演了重要角色。开源项目能够集合全球开发者的智慧和资源,通过协作促进技术的快速迭代和改进。因此,基于当前文生图像领域的发展速度和模式,预计不久的将来,类似Sora的开源版本将会出现,不仅能够达到甚至超过Sora的效果,也将进一步推动AI文生视频创作技术的发展和应用。

总的来说,Sora的推出和预期的开源发展,都将加速AI在视频创作领域的应用,拓宽创作的可能性,并为未来的技术创新和应用提供了新的方向。随着技术的进步和开源社区的贡献,我们有理由相信,AI文生视频的质量和创作能力将不断提升,为创作者提供更多的工具和可能性。

科技新闻

【1】#英伟达市值超亚马逊#和谷歌母公司Alphabet

#英伟达成全球市值第四高公司#美东时间2月12日,芯片股总体表现暂时熄火,但英伟达再刷历史新高,为最近20年来首次盘中市值一度超过亚马逊和谷歌母公司Alphabet,成为全球市值第四高的公司(前三为微软、苹果和沙特阿美)。

截至收盘,英伟达涨0.16%,报722.48美元/股,续刷历史新高,市值达1.78万亿美元,略低于亚马逊和Alphabet。

摩根士丹利策略师Michael Wilson表示,作为人工智能趋势的最大受益者,市场对英伟达的预期很高。 (中国基金报)

【2】目前使用AI最多的行业:科技、金融、媒体和电信

【3】网传家乡为张一鸣立碑 称其为“亿万青年创业者顶礼膜拜的精神偶像”

随着短视频平台抖音与其国际版Tiktok风靡全球,有中国社交媒体帖文称,抖音、Tiktok母公司、中国科技巨头字节跳动创始人张一鸣的家乡为他立了一块功德碑,赞扬他是年轻创业者崇拜的榜样。

【4】前AI高级总监Andrej Karpathy在回归OpenAI仅一年后再度离职

Karpathy当地时间周二晚间在X上发帖称:“大家好,是的,我昨天离开了OpenAI。首先,什么都没有‘发生’,这不是任何特定事件、问题或戏剧的结果(但请继续讲阴谋论,因为它们非常有趣:))。实际上,在OpenAI度过的这一年真的很棒——团队非常强大,员工很棒,路线图也非常令人兴奋,我认为我们都有很多值得期待的东西。我目前的计划是着手我的个人项目,看看会发生什么。那些跟随我一段时间的人可能会对这看起来像什么有感觉。干杯。”

【5】博主称Sora将彻底改变内容创作行业 动画师/3D艺术家们有麻烦了

2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”

但Sora模型当前也存在弱点。OpenAI称它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。例如,一个人可能咬了一口饼干后,饼干会没有咬痕,玻璃破碎的物理过程可能也无法被准确呈现。

【6】ARM股价涨疯了,三天涨了90%多,现在市值超过1500亿美金了,有种加速赶顶的感觉。春节期间海外科技股继续狂飙,节后A股相关板块应该能被拉上一把,否则责任全在美方。

2016年ARM被软银收购的时候,报价320亿美金,随后孙正义深陷WeWork等失败项目的泥潭,一度想把ARM出手。英伟达2020年曾报价400亿美金收购,被监管否决,没卖成,结果现在反而赚了。

孙正义在阿里的投资盈利超过1000亿美金,是VC/PE领域最赚钱的单一项目,对ARM的buyout是有可能打破这一纪录的。即使能在当前价格套现个20%,也是一笔了不起的投资。

当然关键还得看AIGC的第一波泡沫能持续多久了。要说孙正义这个人的命还是真好,吃完美国红利吃中国的,吃完中国的回头再吃美国的。用《茶馆》的话来说就是:“两大强国侍候着我一个人,这福气还小吗?”

优秀的项目

【1】unum-cloud/uform-gen2-qwen-500m · Hugging Face

500m 的 VLLM效果也不错

【2】LargeWorldModel/LWM

可以解析一小时的视频的LLM

【3】astral-sh/uv

An extremely fast Python package installer and resolver, written in Rust.

【4】facefusion/facefusion

Next generation face swapper and enhancer

【5】adamcohenhillel/ADeus

An open source AI wearable device that captures what you say and hear in the real world and then transcribes and stores it on your own server. You can then chat with Adeus using the app, and it will have all the right context about what you want to talk about - a truly personalized, personal AI.

【6】danswer-ai/danswer

Ask Questions in natural language and get Answers backed by private sources. Connects to tools like Slack, GitHub, Confluence, etc.

【7】reorproject/reor

AI note-taking app that runs models locally.

优秀的文章

【1】需求的本质:谋利状态

【2】“升级按钮”|元秀的学习方法论

【3】年轻人如何从现实中获得力量?

【4】年轻人在寻找自己在这个世界上的存在方式和意义

【5】一百个不分手的理由

【6】伟大的巫师经常独自行事,只要空气中的元素依然回应他的咒语和呼唤 | 歌词经理

【7】python教程

【8】Every Default macOS Wallpaper – in Glorious 6K Resolution

【9】Requests for Startups | Y Combinator

YC想要看到的创业项目

【10】How To Write Stuff No One Else Can

【11】Building a RAG-Based Digital Restaurant Menu with LlamaIndex and W&B Weave

优秀的视频

【1】[bilibili]从零开始学习大语言模型(一)_哔哩哔哩_bilibili

林亦的科普ML视频

【2】[youtube]【马督工跨年演讲】《没有草台班子,哪来伟大的时代》

【3】[youtube](限时公开)OpenAI的“指数级领先”,通过Sora看懂了吗?|原标题:我为什么没有加入一家AI公司?|会员专属7

【4】[youtube]My last video

虽然是youtuber个人产品的广告,但是这个视频真的制作的太好了,b站up主可以学习一下

【5】[bilibili]【每天走10000步】我的身体发生了什么变化?!_哔哩哔哩_bilibili

闫帅奇的视频做的一直都很赞!

有趣的事情

【1】全国压岁钱地图

我今年收到的和发出的跟去年比都少了很多

【2】山东恐怖故事

【3】这都能发现

【4】语文倒退

【5】就这……

【6】小时候想不出来网名的孩子长大后 be like:

【7】老佛爷是不用为决策后果承担责任的

【8】多邻国怎么这么疯啊啊啊啊啊啊啊我笑的晕

【9】???

【10】今年开始,越来越多的电视台在播报本地新闻联播时,采用AI主持了。可怜那些在传媒学院播音专业被老师继续忽悠做电视台新闻主播梦想的孩子们

【11】机翻害死人…… “Everyone dies, but not everyone lives.”(每个人都会死,但不是所有人都真正活过。)

【12】不是,有什么天气是我不能看的吗

【13】中西结合了