当前位置:数码通 > 评测

ChatGPT 终于有图片功能了:可以画图、识别图片

来源于 数码通 2023-09-29 16:27

半夜,OpenAI 又传来一个激动人心的消息:

DALL·E 3 来了!它不仅来了,还将集成到 ChatGPT 中。

也就是说,除了常见的对话、写代码、解数学题之外,集成最新DALL·E 3的ChatGPT这次终于有了图片功能。

ChatGPT+DALL·E,这一波也算是强强联合了。一个是大语言模型中的无冕之王,另一个也是Vincentian图模型中的佼佼者。真正的效果必然是1+1>2。

这个突然的官方公告被认为填补了今年年初GPT-4问世后广为流传的多模态ChatGPT的一个大漏洞。

不过,OpenAI现在才公布这个消息,具体上线时间是10月份。对于 Plus 和 Enterprise 用户,独立的 DALL·E 3 也将于今年秋季上市。

这东西威力有多大?虽然现在还不能上手,但从OpenAI发布的例子来看,还是相当具有爆发力的。

其中,有热心网友直接给中途打电话,喂给它DALL·E 3的示例提示词,让其直接比赛。

而结果只能说:中途有危险。

第一个是一个非常经典的牛油果医学表情包,提示词:一个牛油果坐在治疗师的椅子上,说“我感觉里面很空”,中间有一个小坑大小的洞。牛油果。治疗师,勺子,涂鸦笔记。

虽然乍一看似乎各有千秋,两种不同的风格。但如果仔细对比提示词,很明显中途忽略了治疗师、勺子、涂鸦笔记。对话框中的文字也是乱写的,不符合要求。

然后,他们被要求生成一张半透明的心形图片,并要求在心形下方刻上特定的引言。

提示:这是一幅由半透明玻璃制成的人类心脏的插图,站在波涛汹涌的海洋中的基座上。阳光穿透云层,照亮心灵,揭示出内心的微小宇宙。底座上刻有粗体字“发现你内心的宇宙”。

毫无疑问,这一次DALL·E 3再次击败了中途。 《中途》除了没有按要求雕刻人物外,并没有表现出惊涛骇浪的海洋、内心的缩影等任何细节。

这是另一张以荔枝为灵感的球形椅子的照片。在细节方面,它需要白色凹凸不平的外观和柔和的内部,与背后的热带壁纸形成鲜明对比。

这让他们生成的图片中的所有元素都变得栩栩如生,但中途似乎仍然误解了热带壁纸和热带雨林之间的区别。

当然,误解提示词、断章取义,就相当于之前文森图模型的痼疾。

只需生成一只像寄居蟹一样的螃蟹即可。 。 。

让它生成 2D 拟人化森林带会产生 3D 森林带。 。 。

对于这些老问题,根据OpenAI自己的说法以及给出的例子,这种情况在新的DALL·E 3中基本不存在。

除了解决老问题外,DALL·E 3还对原二代版本的纹理进行了升级。

比如让他们画一个篮球运动员扣篮的场景,带有星空爆炸的元素。

本来DALL·E 2生成的图片已经达到要求了,没想到升级后的DALL·E 3更加真实。肌肉线条、宇宙色彩等细节都一一展现出来。确实是对降维的打击。

左:DALL·E 2,右:DALL·E 3

总体来说,在ChatGPT的支持下,DALL·E 3的语言理解能力直接发挥到了极致,几乎是双赢。

升级版的ChatGPT不仅不会丢失关键信息点,即使你只是到处输入几个关键词,它也能帮你自动完成描述,然后让DALL·E 3生成图片。

OpenAI抓住了当代网民“文化沙漠”的本质(狗头)。

当然,DALL·E 3与ChatGPT的集成不仅仅是能够更好地理解人类语音那么简单,它们还会产生一些奇妙的火花。

比如ChatGPT的升级版还具备绘图方面的上下文理解能力,甚至可以直接作为生产力工具使用。

到底有多强大,OpenAI官网提供了演示视频。说实话,看完之后,世超对插画师这个职业有些担心。

首先让ChatGPT生成一只超级向日葵刺猬。它会给你四张图片。选择您最喜欢的后,您可以继续对话的下一步。

然后将刺猬命名为 Larry,并让 ChatGPT 生成更多它的照片。

接下来,让我们增加难度并创建一个场景来展示拉里的家。

这个可以直接体现DALL·E 3+ChatGPT的实力。不仅拉里的外表保持不变(这对于其他AI来说可能有所改变),而且门口的邮箱也写着“拉里”这个名字。

此外,描述Larry的特点,用图片表达他的爱,甚至制作Larry的周边设备和设计一些贴纸,对于ChatGPT来说都是很容易的。

最后,让它组织一个睡前故事和一个结束姿势。 ChatGPT 也触手可及。 u1s1 我真的被这段丝滑的对话震惊了。 。 。

看到这一幕,世超突然有了新的灵感。之后我们写的文章就可以直接丢给ChatGPT,让它提取关键词来做封面。

如果您有任何特殊要求,可以直接告诉ChatGPT。您还可以向其添加参考图片。钓鱼技能+1+1。 。 。

言归正传,上述效果只是OpenAI单方面证明的。它的实际用途要等到 10 月份上线才能得知。估计到时候又会掀起一波网友开发的隐藏技巧热潮。 ,坐下来等待。

此外,说到AI绘画,还有一个绕不开的共同话题:版权问题。

OpenAI 仍然保持之前的位置。与第二个版本一样,使用DALL·E 3生成的图像无需许可即可使用,并且可以用于商业用途。

不过,吸取了太多过去的教训,OpenAI这次聪明了一点,表示艺术家可以选择拒绝将自己的作品喂给DALL·E,只要填写一张表格。

虽然这多少有些“不拒绝就是默认”的意思,但相比之前,至少艺术家们不再那么被动了。 。 。

DALL·E针对此前AI画作侵犯公众人物隐私等网络上出现的带有偏见的问题也有对策:实际使用过程中,ChatGPT会直接拒绝提示中带有公众人物姓名的请求。

也就是说,我们可能不会在ChatGPT中看到这样好玩的图片了。 。 。

并且他们还组建了“红队”来评估和降低模型在各个阶段可能出现的风险。

最后,OpenAI还在官网表示,他们正在开发一款识别AI绘图的工具,可以判断哪些图片是由DALL·E 3生成的。

(只是希望不要像之前的AI文字识别工具一样,因为没用,半途而废……

总的来说,带有文森图功能的ChatGPT足以在AI圈子里掀起一波热潮,而这一波又是DALL·E 3的集成升级版,很难不让人兴奋。不管怎样,世超已经迫不及待地想尝试一下了。

但有人欢喜有人忧。这波OpenAI再次大幅甩开了同行。 10月更新之后,估计很多AI初创公司都会被碾压在ChatGPT的轮子下。 。 。

登录后参与评论