英伟达席卷Computex展会，本周人工智能新闻一网打尽！

作者：FancyPig | 发布时间：2023-06-07 08:47:54 | 更新时间：2023-06-07 08:47:56

相关阅读

bycloud

视频讲解

欢迎回到人工智能新闻周刊！本期的大头条，英伟达无处不在：Computex展会、台湾夜市、台湾大学毕业典礼——CEO黄仁勋亲自上阵，讲述英伟达辉煌的成长故事。H100新品发布，更有令人惊艳的游戏NPC对话演示，宛如真人互动！

除此之外，英伟达还推出了首款CPU Grace，再次颠覆行业认知。市场风云变幻，英伟达股票飙升，FANG不再，MANGA崛起！而就在英伟达大展拳脚之际，微软2023开发者大会也悄然举行，亮点产品Windows Copilot助你轻松驾驭PC，Bing Chat插件、GPT助手训练管道等一应俱全。

此外，我们还为大家带来了各种神奇的AI应用：从实时面试转录、深度学习预测心脏病发作，到3D角色动画制作、神经连接科技Neuralink，无所不包。Deepfake技术逼真程度直逼汤姆·克鲁斯，图像生成领域不断创新，以Voyager探索Minecraft世界为例，展示了AI技术的无限可能。

备用播放线路

相关资料

安德烈·卡帕西在微软开发者大会上的完整演讲 https://build.microsoft.com/en-US/sessions/db3f4859-cd30-4445-a0cd-553c3304f8e2
大语言模型作为工具制造商 https://arxiv.org/abs/2305.17126
Falcon 40B https://falconllm.tii.ae/
DarkBERT（暗网大语言模型） https://arxiv.org/abs/2305.08596
模仿专有的大语言模型的虚假承诺 https://arxiv.org/abs/2305.15717
在线工作面试人工智能助手 https://github.com/SevaSk/ecoute
心脏病发作的DL斑块分析 https://pubmed.ncbi.nlm.nih.gov/37215775/
重构心灵之眼：对比学习和扩散先验的fMRI到图像转换 https://arxiv.org/abs/2305.18274
无提示扩散
- 相关论文 https://arxiv.org/abs/2305.16223
- Github开源项目地址 https://github.com/SHI-Labs/Prompt-Free-Diffusion
航行者：一个带有大型语言模型的开放式体验代理人
- 博客 https://voyager.minedojo.org/
- Github开源项目地址 https://github.com/MineDojo/Voyager
Metaphysic.AI https://www.metaphysic.ai/
Img2Img 视频/多帧渲染（毛巾男变成女孩）Twitter https://twitter.com/Yokohara_h/status/1662653691906887685?s=20
OpenPose Man 模型下载 https://civitai.com/models/76718/openpose-man

图文讲解

好了，我们回来了，又是一周的人工智能新闻。

过去一周发生了很多事情，但最大的新闻当然是我正在参加Computex展会。我会让你最喜欢我，唱起歌来吧。我非常喜欢英伟达。都是NVIDIA。

当我向左看时，是英伟达。当我看向右边时，是黄仁勋。在头条新闻上，没有人能够逃脱NVIDIA。上周，他先是出现在台湾的夜市上，

然后在台湾大学的毕业典礼上首次大露面，发表演讲，讲述他在英伟达的故事，以及英伟达如何三次差点失败，这真是个好故事。

演讲是英文的，所以你可以去看看。顺便说一下，所有的链接都会在描述中出现。而他作为NVIDIA的CEO，4年来首次在台北电脑展上做了亲自演讲。

在这次演讲中，他谈到了H100，他演示了一个有背景故事的游戏中的NPC，并且可以创造独特的对话。实际上，让我们在这里快速看一下。

嗨，JIN，你好吗？

不幸的是，不是那么好。

怎么了？

我很担心这里的犯罪情况。我的拉面店被卷入了交火中。

我可以帮忙吗？

如果你想做点什么，我听说有传言说，强大的犯罪头目青木熊，在城市里造成各种混乱。

我会和他谈谈。我在哪里可以找到他？

我听说他在城市东边的地下格斗俱乐部里混。

好，我去会会他。

小心点，凯。

还有一个全新的NVIDIA CPU，而不是GPU，它被称为CPU Grace。

莱纳斯报道过它，你可以去看看。还有很多新东西。如果你有兴趣，你应该自己去看看。

之前，人们提议用MAGMA来取代FANG。

但现在，由于英伟达正在超级疯狂，我们现在有了MANGA。

尽管NVIDIA的股票因其极好的盈利报告而飙升，但这张假的AI图像描述五角大楼遭受轰炸的事件短暂地引发了市场崩盘。巧合吗？

该图片为AI生成的虚假图片

我真的不知道。上周还举行了微软2023年开发者大会。也许它被英伟达掩盖了。

而主要亮点是Windows Copilot，这是一个帮助你使用PC的Windows应用程序。

他们还宣布了Bing Chat插件，Bing和ChatGPT，

以及Andrej Karpathy关于GPT助手训练管道，

一些好的做法和LLM心理学的谈话。Photoshop增加了生成性工具，可以帮助你进行在外部或内部绘画。

这个工具包的晚期适应性和生成性工具的审查制度让人们记忆深刻。

还有更多的大型语言模型论文。这篇讲的是语言模型制作工具。

关于这个的笑话是，这是一篇谷歌的论文，但它使用的是GPT。

还有一种新的开源LLM，名为Falcon 40B，由技术创新研究院发布，它击败了Hugging Face开源LLM基准测试。

然后还有这个大型语言模型，是在暗网中训练出来的。

另一方面，这个语言模型在谈论如何使用像GPT-4这样好的LLM的数据来微调一个较弱的LLM，这导致了一种模仿模型，

并且引用模仿模型几乎没有缩小从基础语言模型到ChatGPT的差距，在模仿数据中没有大量支持的任务。

所以基本上这意味着微调的较弱模型仍然很糟糕。它只是善于模仿和绕过评估。它仍然有薄弱的能力，特别是在细调数据之外的领域。在线工作面试已经不再了。这个人工智能工具能够为你和说话者进行实时转录。

然后，它可以根据面试官的现场对话，为用户生成一个完美的回答问题。

这项新研究使用深度学习和斑块分析来捕捉潜在的心脏病发作。

将视频中的人类转换为3D人物的神奇动态，通过非常精确的遮蔽和绘画，在网络上疯传。而这段视频看起来就像一个机器人在和人类进行打耳光比赛。

Neuralink首次获得美国食品和药物管理局批准进行人类临床研究，并发表了更高保真度的读心术论文，该论文对视觉脑电波进行解码。

结果看起来甚至更好。我在第一集里给大家看的可口可乐广告得到了幕后视频，看起来很有预算。

还有一种扩散模型，是不基于文本的。它被称为无提示扩散，不依靠剪辑或文字来生成图像。

所以我猜这是一种基于参考的图像生成。这对于完全不需要文字的图像生成用法是很好的，因为文字有时会以错误的方式影响图像生成。

Voyager，这是一项将GPT-4纳入玩Minecraft的研究，它能够在没有人类干预的情况下不断探索世界，获得多样化的技能，并做出新奇的发现。

它能够实现这一点，要归功于它的三个主要的组成部分，即最大限度地探索的自动课程，一个可检索的技能库，存储任何学到的复杂行为，以及像AutoGPT这样的互动提示机制，寻求错误、反馈和改进。

在基准中，有无技能库是有明显区别的，只有有了技能库，人工智能才会有获得钻石的工具。

另一项比较是与AutoGPT进行的，它显示了Voyager在解决Minecraft内的一般任务方面的效率。

Deepfake也越来越疯狂了。这是Metaphysic.ai，这不是汤姆-克鲁斯，也不是赞助。它看起来如此真实，以至于只有当阻碍相位是唯一的线索时，才能发现这是Deepfake而不是真正的汤姆·克鲁斯。

哦，上帝。然后是这个戴着毛巾的男人，变成了一个女孩。

人们也在琢磨出一些疯狂的图像到图像的视频工作流程。最后，为了结束今天的节目，这里有一个用于生成开放姿势数字人的Lora。

这真是太Meta了，我喜欢。

如果你也喜欢今天的AI时间线节目，请点赞并订阅以获取更多内容，我们下一集再见。

标签：深度学习, 英伟达, deepfake, Computex展会, 台湾夜市, 台湾大学, 黄仁勋, H100, 游戏NPC, 对话演示, CPU Grace, FANG, MANGA, 微软, 2023开发者大会, Windows Copilot, Bing Chat插件, GPT助手, 实时面试转录, 心脏病发作, 3D角色动画, 神经连接科技, Neuralink, 汤姆·克鲁斯, 图像生成, Voyager, Minecraft世界