英伟达席卷Computex展会,本周人工智能新闻一网打尽!
作者:FancyPig | 发布时间: | 更新时间:
相关阅读
视频讲解
欢迎回到人工智能新闻周刊!本期的大头条,英伟达无处不在:Computex展会、台湾夜市、台湾大学毕业典礼——CEO黄仁勋亲自上阵,讲述英伟达辉煌的成长故事。H100新品发布,更有令人惊艳的游戏NPC对话演示,宛如真人互动!
除此之外,英伟达还推出了首款CPU Grace,再次颠覆行业认知。市场风云变幻,英伟达股票飙升,FANG不再,MANGA崛起!而就在英伟达大展拳脚之际,微软2023开发者大会也悄然举行,亮点产品Windows Copilot助你轻松驾驭PC,Bing Chat插件、GPT助手训练管道等一应俱全。
此外,我们还为大家带来了各种神奇的AI应用:从实时面试转录、深度学习预测心脏病发作,到3D角色动画制作、神经连接科技Neuralink,无所不包。Deepfake技术逼真程度直逼汤姆·克鲁斯,图像生成领域不断创新,以Voyager探索Minecraft世界为例,展示了AI技术的无限可能。
相关资料
- 安德烈·卡帕西在微软开发者大会上的完整演讲 https://build.microsoft.com/en-US/sessions/db3f4859-cd30-4445-a0cd-553c3304f8e2
- 大语言模型作为工具制造商 https://arxiv.org/abs/2305.17126
- Falcon 40B https://falconllm.tii.ae/
- DarkBERT(暗网大语言模型) https://arxiv.org/abs/2305.08596
- 模仿专有的大语言模型的虚假承诺 https://arxiv.org/abs/2305.15717
- 在线工作面试人工智能助手 https://github.com/SevaSk/ecoute
- 心脏病发作的DL斑块分析 https://pubmed.ncbi.nlm.nih.gov/37215775/
- 重构心灵之眼:对比学习和扩散先验的fMRI到图像转换 https://arxiv.org/abs/2305.18274
- 无提示扩散
- 航行者:一个带有大型语言模型的开放式体验代理人
- 博客 https://voyager.minedojo.org/
- Github开源项目地址 https://github.com/MineDojo/Voyager
- Metaphysic.AI https://www.metaphysic.ai/
- Img2Img 视频/多帧渲染(毛巾男变成女孩)Twitter https://twitter.com/Yokohara_h/status/1662653691906887685?s=20
- OpenPose Man 模型下载 https://civitai.com/models/76718/openpose-man
图文讲解
好了,我们回来了,又是一周的人工智能新闻。

过去一周发生了很多事情,但最大的新闻当然是我正在参加Computex展会。我会让你最喜欢我,唱起歌来吧。我非常喜欢英伟达。都是NVIDIA。

当我向左看时,是英伟达。当我看向右边时,是黄仁勋。在头条新闻上,没有人能够逃脱NVIDIA。上周,他先是出现在台湾的夜市上,

然后在台湾大学的毕业典礼上首次大露面,发表演讲,讲述他在英伟达的故事,以及英伟达如何三次差点失败,这真是个好故事。

演讲是英文的,所以你可以去看看。顺便说一下,所有的链接都会在描述中出现。而他作为NVIDIA的CEO,4年来首次在台北电脑展上做了亲自演讲。

在这次演讲中,他谈到了H100,他演示了一个有背景故事的游戏中的NPC,并且可以创造独特的对话。实际上,让我们在这里快速看一下。
嗨,JIN,你好吗?
不幸的是,不是那么好。
怎么了?
我很担心这里的犯罪情况。我的拉面店被卷入了交火中。
我可以帮忙吗?
如果你想做点什么,我听说有传言说,强大的犯罪头目青木熊,在城市里造成各种混乱。
我会和他谈谈。我在哪里可以找到他?
我听说他在城市东边的地下格斗俱乐部里混。
好,我去会会他。
小心点,凯。

还有一个全新的NVIDIA CPU,而不是GPU,它被称为CPU Grace。

莱纳斯报道过它,你可以去看看。还有很多新东西。如果你有兴趣,你应该自己去看看。

之前,人们提议用MAGMA来取代FANG。

但现在,由于英伟达正在超级疯狂,我们现在有了MANGA。

尽管NVIDIA的股票因其极好的盈利报告而飙升,但这张假的AI图像描述五角大楼遭受轰炸的事件短暂地引发了市场崩盘。巧合吗?


我真的不知道。上周还举行了微软2023年开发者大会。也许它被英伟达掩盖了。

而主要亮点是Windows Copilot,这是一个帮助你使用PC的Windows应用程序。

他们还宣布了Bing Chat插件,Bing和ChatGPT,

以及Andrej Karpathy关于GPT助手训练管道,

一些好的做法和LLM心理学的谈话。Photoshop增加了生成性工具,可以帮助你进行在外部或内部绘画。

这个工具包的晚期适应性和生成性工具的审查制度让人们记忆深刻。

还有更多的大型语言模型论文。这篇讲的是语言模型制作工具。

关于这个的笑话是,这是一篇谷歌的论文,但它使用的是GPT。

还有一种新的开源LLM,名为Falcon 40B,由技术创新研究院发布,它击败了Hugging Face开源LLM基准测试。

然后还有这个大型语言模型,是在暗网中训练出来的。

另一方面,这个语言模型在谈论如何使用像GPT-4这样好的LLM的数据来微调一个较弱的LLM,这导致了一种模仿模型,

并且引用模仿模型几乎没有缩小从基础语言模型到ChatGPT的差距,在模仿数据中没有大量支持的任务。

所以基本上这意味着微调的较弱模型仍然很糟糕。它只是善于模仿和绕过评估。它仍然有薄弱的能力,特别是在细调数据之外的领域。 在线工作面试已经不再了。这个人工智能工具能够为你和说话者进行实时转录。

然后,它可以根据面试官的现场对话,为用户生成一个完美的回答问题。

这项新研究使用深度学习和斑块分析来捕捉潜在的心脏病发作。


将视频中的人类转换为3D人物的神奇动态,通过非常精确的遮蔽和绘画,在网络上疯传。而这段视频看起来就像一个机器人在和人类进行打耳光比赛。

Neuralink首次获得美国食品和药物管理局批准进行人类临床研究,并发表了更高保真度的读心术论文,该论文对视觉脑电波进行解码。


结果看起来甚至更好。我在第一集里给大家看的可口可乐广告得到了幕后视频,看起来很有预算。

还有一种扩散模型,是不基于文本的。它被称为无提示扩散,不依靠剪辑或文字来生成图像。

所以我猜这是一种基于参考的图像生成。这对于完全不需要文字的图像生成用法是很好的,因为文字有时会以错误的方式影响图像生成。


Voyager,这是一项将GPT-4纳入玩Minecraft的研究,它能够在没有人类干预的情况下不断探索世界,获得多样化的技能,并做出新奇的发现。




它能够实现这一点,要归功于它的三个主要的组成部分,即最大限度地探索的自动课程,一个可检索的技能库,存储任何学到的复杂行为,以及像AutoGPT这样的互动提示机制,寻求错误、反馈和改进。

在基准中,有无技能库是有明显区别的,只有有了技能库,人工智能才会有获得钻石的工具。


另一项比较是与AutoGPT进行的,它显示了Voyager在解决Minecraft内的一般任务方面的效率。

Deepfake也越来越疯狂了。这是Metaphysic.ai,这不是汤姆-克鲁斯,也不是赞助。它看起来如此真实,以至于只有当阻碍相位是唯一的线索时,才能发现这是Deepfake而不是真正的汤姆·克鲁斯。

哦,上帝。然后是这个戴着毛巾的男人,变成了一个女孩。


人们也在琢磨出一些疯狂的图像到图像的视频工作流程。最后,为了结束今天的节目,这里有一个用于生成开放姿势数字人的Lora。

这真是太Meta了,我喜欢。
如果你也喜欢今天的AI时间线节目,请点赞并订阅以获取更多内容,我们下一集再见。