英伟达席卷Computex展会,本周人工智能新闻一网打尽!

作者:FancyPig | 发布时间: | 更新时间:

相关阅读

视频讲解

欢迎回到人工智能新闻周刊!本期的大头条,英伟达无处不在:Computex展会、台湾夜市、台湾大学毕业典礼——CEO黄仁勋亲自上阵,讲述英伟达辉煌的成长故事。H100新品发布,更有令人惊艳的游戏NPC对话演示,宛如真人互动!

除此之外,英伟达还推出了首款CPU Grace,再次颠覆行业认知。市场风云变幻,英伟达股票飙升,FANG不再,MANGA崛起!而就在英伟达大展拳脚之际,微软2023开发者大会也悄然举行,亮点产品Windows Copilot助你轻松驾驭PC,Bing Chat插件、GPT助手训练管道等一应俱全。

此外,我们还为大家带来了各种神奇的AI应用:从实时面试转录、深度学习预测心脏病发作,到3D角色动画制作、神经连接科技Neuralink,无所不包。Deepfake技术逼真程度直逼汤姆·克鲁斯,图像生成领域不断创新,以Voyager探索Minecraft世界为例,展示了AI技术的无限可能。

相关资料

图文讲解

好了,我们回来了,又是一周的人工智能新闻。

过去一周发生了很多事情,但最大的新闻当然是我正在参加Computex展会。我会让你最喜欢我,唱起歌来吧。我非常喜欢英伟达。都是NVIDIA。

当我向左看时,是英伟达。当我看向右边时,是黄仁勋。在头条新闻上,没有人能够逃脱NVIDIA。上周,他先是出现在台湾的夜市上,

然后在台湾大学的毕业典礼上首次大露面,发表演讲,讲述他在英伟达的故事,以及英伟达如何三次差点失败,这真是个好故事。

演讲是英文的,所以你可以去看看。顺便说一下,所有的链接都会在描述中出现。而他作为NVIDIA的CEO,4年来首次在台北电脑展上做了亲自演讲。

在这次演讲中,他谈到了H100,他演示了一个有背景故事的游戏中的NPC,并且可以创造独特的对话。实际上,让我们在这里快速看一下。

嗨,JIN,你好吗?

不幸的是,不是那么好。

怎么了?

我很担心这里的犯罪情况。我的拉面店被卷入了交火中。

我可以帮忙吗?

如果你想做点什么,我听说有传言说,强大的犯罪头目青木熊,在城市里造成各种混乱。

我会和他谈谈。我在哪里可以找到他?

我听说他在城市东边的地下格斗俱乐部里混。

好,我去会会他。

小心点,凯。

还有一个全新的NVIDIA CPU,而不是GPU,它被称为CPU Grace。

莱纳斯报道过它,你可以去看看。还有很多新东西。如果你有兴趣,你应该自己去看看。

之前,人们提议用MAGMA来取代FANG

但现在,由于英伟达正在超级疯狂,我们现在有了MANGA

尽管NVIDIA的股票因其极好的盈利报告而飙升,但这张假的AI图像描述五角大楼遭受轰炸的事件短暂地引发了市场崩盘。巧合吗?

该图片为AI生成的虚假图片

我真的不知道。上周还举行了微软2023年开发者大会。也许它被英伟达掩盖了。

而主要亮点是Windows Copilot,这是一个帮助你使用PC的Windows应用程序。

他们还宣布了Bing Chat插件,Bing和ChatGPT,

以及Andrej Karpathy关于GPT助手训练管道,

一些好的做法和LLM心理学的谈话。Photoshop增加了生成性工具,可以帮助你进行在外部或内部绘画。

这个工具包的晚期适应性和生成性工具的审查制度让人们记忆深刻。

还有更多的大型语言模型论文。这篇讲的是语言模型制作工具。

关于这个的笑话是,这是一篇谷歌的论文,但它使用的是GPT

还有一种新的开源LLM,名为Falcon 40B,由技术创新研究院发布,它击败了Hugging Face开源LLM基准测试。

然后还有这个大型语言模型,是在暗网中训练出来的。

另一方面,这个语言模型在谈论如何使用像GPT-4这样好的LLM的数据来微调一个较弱的LLM,这导致了一种模仿模型,

并且引用模仿模型几乎没有缩小从基础语言模型到ChatGPT的差距,在模仿数据中没有大量支持的任务。

所以基本上这意味着微调的较弱模型仍然很糟糕。它只是善于模仿和绕过评估。它仍然有薄弱的能力,特别是在细调数据之外的领域。 在线工作面试已经不再了。这个人工智能工具能够为你和说话者进行实时转录。

然后,它可以根据面试官的现场对话,为用户生成一个完美的回答问题。

这项新研究使用深度学习和斑块分析来捕捉潜在的心脏病发作。

将视频中的人类转换为3D人物的神奇动态,通过非常精确的遮蔽和绘画,在网络上疯传。而这段视频看起来就像一个机器人在和人类进行打耳光比赛。

Neuralink首次获得美国食品和药物管理局批准进行人类临床研究,并发表了更高保真度的读心术论文,该论文对视觉脑电波进行解码。

结果看起来甚至更好。我在第一集里给大家看的可口可乐广告得到了幕后视频,看起来很有预算。

还有一种扩散模型,是不基于文本的。它被称为无提示扩散,不依靠剪辑或文字来生成图像。

所以我猜这是一种基于参考的图像生成。这对于完全不需要文字的图像生成用法是很好的,因为文字有时会以错误的方式影响图像生成。

Voyager,这是一项将GPT-4纳入玩Minecraft的研究,它能够在没有人类干预的情况下不断探索世界,获得多样化的技能,并做出新奇的发现。

它能够实现这一点,要归功于它的三个主要的组成部分,即最大限度地探索的自动课程,一个可检索的技能库,存储任何学到的复杂行为,以及像AutoGPT这样的互动提示机制,寻求错误、反馈和改进。

在基准中,有无技能库是有明显区别的,只有有了技能库,人工智能才会有获得钻石的工具。

另一项比较是与AutoGPT进行的,它显示了Voyager在解决Minecraft内的一般任务方面的效率。

Deepfake也越来越疯狂了。这是Metaphysic.ai,这不是汤姆-克鲁斯,也不是赞助。它看起来如此真实,以至于只有当阻碍相位是唯一的线索时,才能发现这是Deepfake而不是真正的汤姆·克鲁斯。

哦,上帝。然后是这个戴着毛巾的男人,变成了一个女孩。

人们也在琢磨出一些疯狂的图像到图像的视频工作流程。最后,为了结束今天的节目,这里有一个用于生成开放姿势数字人的Lora。

这真是太Meta了,我喜欢。

如果你也喜欢今天的AI时间线节目,请点赞并订阅以获取更多内容,我们下一集再见。

标签:深度学习, 英伟达, deepfake, Computex展会, 台湾夜市, 台湾大学, 黄仁勋, H100, 游戏NPC, 对话演示, CPU Grace, FANG, MANGA, 微软, 2023开发者大会, Windows Copilot, Bing Chat插件, GPT助手, 实时面试转录, 心脏病发作, 3D角色动画, 神经连接科技, Neuralink, 汤姆·克鲁斯, 图像生成, Voyager, Minecraft世界