当前位置：数码通 > 评测

ChatGPT 终于有图片功能了：可以画图、识别图片

来源于数码通 2023-09-29 16:27 评测

半夜，OpenAI 又传来一个激动人心的消息：

DALL·E 3 来了！它不仅来了，还将集成到 ChatGPT 中。

也就是说，除了常见的对话、写代码、解数学题之外，集成最新DALL·E 3的ChatGPT这次终于有了图片功能。

ChatGPT+DALL·E，这一波也算是强强联合了。一个是大语言模型中的无冕之王，另一个也是Vincentian图模型中的佼佼者。真正的效果必然是1+1>2。

这个突然的官方公告被认为填补了今年年初GPT-4问世后广为流传的多模态ChatGPT的一个大漏洞。

不过，OpenAI现在才公布这个消息，具体上线时间是10月份。对于 Plus 和 Enterprise 用户，独立的 DALL·E 3 也将于今年秋季上市。

这东西威力有多大？虽然现在还不能上手，但从OpenAI发布的例子来看，还是相当具有爆发力的。

其中，有热心网友直接给中途打电话，喂给它DALL·E 3的示例提示词，让其直接比赛。

而结果只能说：中途有危险。

第一个是一个非常经典的牛油果医学表情包，提示词：一个牛油果坐在治疗师的椅子上，说“我感觉里面很空”，中间有一个小坑大小的洞。牛油果。治疗师，勺子，涂鸦笔记。

虽然乍一看似乎各有千秋，两种不同的风格。但如果仔细对比提示词，很明显中途忽略了治疗师、勺子、涂鸦笔记。对话框中的文字也是乱写的，不符合要求。

然后，他们被要求生成一张半透明的心形图片，并要求在心形下方刻上特定的引言。

提示：这是一幅由半透明玻璃制成的人类心脏的插图，站在波涛汹涌的海洋中的基座上。阳光穿透云层，照亮心灵，揭示出内心的微小宇宙。底座上刻有粗体字“发现你内心的宇宙”。

毫无疑问，这一次DALL·E 3再次击败了中途。《中途》除了没有按要求雕刻人物外，并没有表现出惊涛骇浪的海洋、内心的缩影等任何细节。

这是另一张以荔枝为灵感的球形椅子的照片。在细节方面，它需要白色凹凸不平的外观和柔和的内部，与背后的热带壁纸形成鲜明对比。

这让他们生成的图片中的所有元素都变得栩栩如生，但中途似乎仍然误解了热带壁纸和热带雨林之间的区别。

当然，误解提示词、断章取义，就相当于之前文森图模型的痼疾。

只需生成一只像寄居蟹一样的螃蟹即可。。。

让它生成 2D 拟人化森林带会产生 3D 森林带。。。

对于这些老问题，根据OpenAI自己的说法以及给出的例子，这种情况在新的DALL·E 3中基本不存在。

除了解决老问题外，DALL·E 3还对原二代版本的纹理进行了升级。

比如让他们画一个篮球运动员扣篮的场景，带有星空爆炸的元素。

本来DALL·E 2生成的图片已经达到要求了，没想到升级后的DALL·E 3更加真实。肌肉线条、宇宙色彩等细节都一一展现出来。确实是对降维的打击。

左：DALL·E 2，右：DALL·E 3

总体来说，在ChatGPT的支持下，DALL·E 3的语言理解能力直接发挥到了极致，几乎是双赢。

升级版的ChatGPT不仅不会丢失关键信息点，即使你只是到处输入几个关键词，它也能帮你自动完成描述，然后让DALL·E 3生成图片。

OpenAI抓住了当代网民“文化沙漠”的本质（狗头）。

当然，DALL·E 3与ChatGPT的集成不仅仅是能够更好地理解人类语音那么简单，它们还会产生一些奇妙的火花。

比如ChatGPT的升级版还具备绘图方面的上下文理解能力，甚至可以直接作为生产力工具使用。

到底有多强大，OpenAI官网提供了演示视频。说实话，看完之后，世超对插画师这个职业有些担心。

首先让ChatGPT生成一只超级向日葵刺猬。它会给你四张图片。选择您最喜欢的后，您可以继续对话的下一步。

然后将刺猬命名为 Larry，并让 ChatGPT 生成更多它的照片。

接下来，让我们增加难度并创建一个场景来展示拉里的家。

这个可以直接体现DALL·E 3+ChatGPT的实力。不仅拉里的外表保持不变（这对于其他AI来说可能有所改变），而且门口的邮箱也写着“拉里”这个名字。

此外，描述Larry的特点，用图片表达他的爱，甚至制作Larry的周边设备和设计一些贴纸，对于ChatGPT来说都是很容易的。

最后，让它组织一个睡前故事和一个结束姿势。 ChatGPT 也触手可及。 u1s1 我真的被这段丝滑的对话震惊了。。。

看到这一幕，世超突然有了新的灵感。之后我们写的文章就可以直接丢给ChatGPT，让它提取关键词来做封面。

如果您有任何特殊要求，可以直接告诉ChatGPT。您还可以向其添加参考图片。钓鱼技能+1+1。。。

言归正传，上述效果只是OpenAI单方面证明的。它的实际用途要等到 10 月份上线才能得知。估计到时候又会掀起一波网友开发的隐藏技巧热潮。，坐下来等待。

此外，说到AI绘画，还有一个绕不开的共同话题：版权问题。

OpenAI 仍然保持之前的位置。与第二个版本一样，使用DALL·E 3生成的图像无需许可即可使用，并且可以用于商业用途。

不过，吸取了太多过去的教训，OpenAI这次聪明了一点，表示艺术家可以选择拒绝将自己的作品喂给DALL·E，只要填写一张表格。

虽然这多少有些“不拒绝就是默认”的意思，但相比之前，至少艺术家们不再那么被动了。。。

DALL·E针对此前AI画作侵犯公众人物隐私等网络上出现的带有偏见的问题也有对策：实际使用过程中，ChatGPT会直接拒绝提示中带有公众人物姓名的请求。

也就是说，我们可能不会在ChatGPT中看到这样好玩的图片了。。。

并且他们还组建了“红队”来评估和降低模型在各个阶段可能出现的风险。

最后，OpenAI还在官网表示，他们正在开发一款识别AI绘图的工具，可以判断哪些图片是由DALL·E 3生成的。

（只是希望不要像之前的AI文字识别工具一样，因为没用，半途而废……

总的来说，带有文森图功能的ChatGPT足以在AI圈子里掀起一波热潮，而这一波又是DALL·E 3的集成升级版，很难不让人兴奋。不管怎样，世超已经迫不及待地想尝试一下了。

但有人欢喜有人忧。这波OpenAI再次大幅甩开了同行。 10月更新之后，估计很多AI初创公司都会被碾压在ChatGPT的轮子下。。。

收藏点赞 (0)

性价排名怎么看,笔记本性能性价比排名：选购指南与高性价比推荐

性价排名怎么看,笔记本性能性价比排名：选

2024年最值得购买的平板电脑推荐

2024年最值得购买的平板电脑推荐

智能家居设备选型：打造未来智能生活，你准备好了吗？

智能家居设备选型：打造未来智能生活，你准

十大游戏主机，畅享游戏体验

专业相机与手机拍照：真实与耐用的选择

专业相机与手机拍照：真实与耐用的选择

科技小秘密曝光！这些游戏主机品牌才是玩家的最佳选择！

科技小秘密曝光！这些游戏主机品牌才是玩家

稳定性卓越的无人机，让飞行更安心

稳定性卓越的无人机，让飞行更安心

机械键盘与薄膜键盘：手感差异与选择之道

机械键盘与薄膜键盘：手感差异与选择之道

4K电视和8K电视：一场视觉盛宴的差异之旅

4K电视和8K电视：一场视觉盛宴的差异之

超越极限！这款智能手表电池续航能力让你不再担忧电量问题

超越极限！这款智能手表电池续航能力让你不

电视4K和8K有什么区别？哪种更实用？

电视4K和8K有什么区别？哪种更实用？

2024年最值得购买的平板电脑：型号推荐与购买指南

2024年最值得购买的平板电脑：型号推荐

2024年最值得购买的平板电脑：一款兼具性能与价格优势的科技新品

2024年最值得购买的平板电脑：一款兼具

飞行最稳定的无人机，让你拍摄更无忧！

飞行最稳定的无人机，让你拍摄更无忧！

手机膜4K和8K，差别不止一点点！

手机膜4K和8K，差别不止一点点！

轻松成为家居代理，开启智能生活新篇章

轻松成为家居代理，开启智能生活新篇章

2024年最值得购买的平板电脑：改变你的工作和娱乐方式

2024年最值得购买的平板电脑：改变你的

智能家居使用体验感受，生活的时尚新潮，让你的家更智能

智能家居使用体验感受，生活的时尚新潮，让

机械键盘与薄膜键盘：哪款才是你的电竞利器？

机械键盘与薄膜键盘：哪款才是你的电竞利器

机械键盘与薄膜键盘：键鼠之争，哪个更适合你？

机械键盘与薄膜键盘：键鼠之争，哪个更适合

蓝牙耳机音质取决于手机还是耳机？探秘音质之谜

蓝牙耳机音质取决于手机还是耳机？探秘音质

猜你喜欢