TC分享第 165 期
TC分享第 165 期
2024 week 8
你永远会低估你一周可以做的事情,在这里记录一下我这周看到的好东西。有些链接可能需要科学上网。
新闻思考
Google最近发布了 Gemini 1.5 Pro 的AI模型,它具有一个非常大的上下文窗口——高达100万个token。这个特性使其在处理大量数据时表现出卓越的性能,比如能够分析、分类和总结大量内容。它的这个大上下文窗口是目前市场上最大的,大约是OpenAI的GPT-4的八倍。Gemini 1.5 Pro能够处理约一个小时的视频、11小时的音频、3万行代码和75万个单词的数据。这种能力对于理解和推理不同的模式——包括视频——是非常重要的。已有的模型都没有这种视频理解能力,可以把整个代码库放进去,然后问它问题。让人对于应用这种模型的可能性充满了期待。
另一个Google Gemini AI在生成图像时偏向生成黑人形象的问题,Google已经公开道歉,并对其AI的“不准确性”进行了解释。用户们曾指责Google的Gemini生成的图像在性别、种族和历史人物的准确性上存在问题。例如,有用户请求生成美国开国元勋的图像,结果却出现了女性和有色人种的形象。Google承认,其试图创建“广泛范围”的结果在某些历史图像生成描述上“未达标准”,并宣布将暂停该软件生成人物图像的功能,同时表示正在努力改进这类描述。
为回应这一争议,Google暂时停止了Gemini生成人物图像的能力,并承诺将重新发布改进版的工具。这表明Google正在积极应对用户反馈,并努力解决其AI技术中的偏见和准确性问题。
这些事件凸显了生成性AI技术在确保输出的多样性、公正性和历史准确性方面面临的挑战。尽管这些工具旨在基于训练数据和其他参数产生广泛的输出,但它们仍可能反映出现有的社会偏见,导致不准确或有争议的结果。因为之前AI被说只能生成白人的形象,google对于发布模型很谨慎,所以就有点过度处理肤色问题,反而到了另一个极端。
科技新闻
【1】百度副总裁:“贴吧通过AI自动审核、实时过滤,可以迅速有效识别拼音、谐音、拆字、形近字、影射等违规文本内容。”
【2】#乌网红打假想嫁中国人的俄美女#
#AI俄美女在小红书带货被打假#一名自称来自俄罗斯的“网红”在中国社交平台带货,她在平台中频频“感谢中国”、并称“想嫁中国男人”,收获不少中国粉丝。但近日这名“网红”被揭发是“AI换脸”,其盗用的正是拥有精致面孔的乌克兰美女网红奥尔嘉(Olga Loiek)
【3】财经十一人:OpenAI依然用了超过八年的时间,才打造出突破性产品GPT4,且存在“幻觉”(也就是答非所问、胡说八道等情况)。 为什么中国公司在几个月的时间里,就能做出号称匹敌GPT4的大模型?这是谁的幻觉?
【4】Sora刷屏那天,Google很牛逼的一个更新被埋没了
【5】#字节跳动辟谣推出中文版Sora#:Boximator是视频生成领域控制对象运动的技术方法研究项目
2月20日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
【6】OpenAI 被卡脖子了
【7】一堆冒充上海老师的抖音号
【8】违反欧盟反垄断法 苹果公司将被罚7.25亿元
据报道,欧洲联盟对美国科技巨头苹果公司展开反垄断调查后,认定它在旗下平台压制音乐串流竞争对手,违反欧盟竞争规则,准备对它罚款约5亿欧元
【9】美国司法部任命首位首席人工智能官
美国司法部任命普林斯顿大学的一名学者为首位首席人工智能官和首席科技顾问。
计算机专家兼律师Jonathan Mayer将担任司法部长梅里克·加兰德(Merrick Garland)和司法部领导层在需要技术专长问题上的主要政策顾问之一,特别是与人工智能、网络安全和其他新兴技术领域有关的问题。他还将领导该部门的技术能力建设工作,例如为技术人才招聘提供建议,并在整个部门和其他联邦机构中就与新兴技术相关的问题提供建议。
Mayer目前是普林斯顿大学计算机科学系和该校公共与国际事务学院的助理教授,他曾担任过类似的技术政策咨询职位,包括在2017年至2018年期间在加州司法部和副总统卡马拉·哈里斯(Kamala Harris)的办公室工作,当时Kamala Harris是美国参议员。
根据他在领英(LinkedIn)上的个人资料,Mayer还在美国联邦通讯委员会执法局担任了大约一年的首席技术专家。
Mayer周四暂未回复置评请求。
优秀的项目
lightweight, standalone C++ inference engine for Google’s Gemma models.
SoraWebui is an open-source Sora web client, enabling users to easily create videos from text with OpenAI’s Sora model.
An intuitive GUI for GLIGEN that uses ComfyUI in the backend
【4】systemdesign42/system-design
Building the best system design resource in the internet
优秀的文章
【3】孩子抑郁症离开后
【5】你不是懒,你只是没有找到让你一辈子每天都从床上跳起来的工作。
【7】一个AI创业者的思考
优秀的视频
【1】[youtube]Let’s build the GPT Tokenizer
【2】[bilibili]【何同学】很牛,但没用丨苹果Vision Pro深度体验_哔哩哔哩_bilibili
【3】[youtube]如何积累第一桶金?|摆脱韭菜思维的最后一次努力|Leon访谈_上
有趣的事情
【1】中国靠搞ai最先富起来的可能是搞培训卖课的那帮人
【2】国内AI行业对SORA研究的现状
【3】这是Sora 团队00后成员will depue自我介绍中的一段话:
我不喜欢列举硬技能,因为我觉得它们太过限制性:我最大的“硬技能”是我是我见过的最快和最有好奇心的学习者。
请不要只根据我已经学到的来评价我,而应该考虑我在未来能够深入理解什么。例如,我从零开始,在不到两周的时间里就构建了WebGPT项目,即使之前对这个主题一无所知。
【4】各国人民每天花在吃吃喝喝上的时间…法国/意大利/西班牙是最讲究的,美国/加拿大是最不讲究的
【5】好久没上微博了,今天为了这图上来发一下让大家看看北京的四季。这张图前后凑了五六年,不是每次都有合适的机会和天气去拍,今天的雪景终于成就了它
【6】晚清官员凭想象绘制的纽约第一高楼
【7】瑞幸超越星巴克
【8】据说有 AI 生成候选人的脸和声音代面试……
【9】我觉得AI的方向搞错了