weui-七雄外挂

如何p图
2023年4月1日发(作者:微信朋友圈刷新不了)

DALL·E这波超进化,画质艺术感双飞升,还学会了⽆痕P图

鱼⽺发⾃凹⾮寺

量⼦位|公众号QbitAI

把椅⼦上的萌⽝P成猫猫,需要⼏步?

第⼀步,圈出狗狗。第⼆步,告诉AI你的需求。⿏标⼀点,齐活。

这位AIP图⼤师,其实是位⽼朋友——OpenAI风靡全球的那位DALL·E。

现在,它刚刚完成了“2.0超进化”。不仅新学了⼀⼿出神⼊化的P图绝技,创作质量也有了飞跃式的提升。

话不多说,直接看作品感受⼀下~

这是DALL·E2在“星云爆炸状柯基头”这⼀提⽰下的创作出来的画作:

这幅萨尔⽡多·达利的画像,是不是有点萨尔⽡多·达利内味⼉了?

跟初代DALL·E⽐起来,着实是画质与艺术感双双飞升了。

△“⽇出时分安坐在⽥野⾥的狐狸,莫奈风格”

所以,研究⼈员具体如何点亮了DALL·E的新技能点?

CLIP+扩散模型

DALL·E此番进化,简单来说就是分辨率更⾼了,延迟更低了。

此外,还有更新2⼤新功能:

⾸先,在更细粒度上实现⽂本→图像功能。

也就是说,DALL·E2可以根据⾃然语⾔提⽰进⾏P图。在P图的过程中,还会考虑阴影、反射、纹理等元素的变化。

⽐如在左图标“2”的位置P⼀个⽕烈鸟泳圈,DALL-E2会把⽔⾯倒影这种细节也处理到位。

其次,是可以在保留原作核⼼元素的基础之上,赋予原作船新的风格。

并且⽣成画⾯的画质是DALL·E1的4倍,即从256×256提升到了1024×1024。

具体的实现⽅法,⽤OpenAI官⽅的话来说,就是结合了CLIP和扩散模型两种技术的优点。

CLIP是原版DALL·E功能实现的基础,是⼀个负责给图像重排序的模型,其零样本学习能⼒已经在各种视觉和语⾔任务

上⼤放异彩。

⽽扩散模型的特点在于,在牺牲多样性的前提下,能⼤⼤提升⽣成图像的逼真度。

于是,OpenAI的研究⼈员设计了这样⼀种⽅案:

在这个名为unCLIP的架构中,CLIP⽂本嵌⼊⾸先会被喂给⾃回归或扩散先验,以产⽣⼀个图像嵌⼊。

⽽后,这个嵌⼊会被⽤来调节扩散编码器,以⽣成最终的图像。

OpenAI解释称,DALL·E能够get图像和⽤于描述画⾯的⽂本之间的关系。其图像的⽣成是在“扩散”过程中完成的,可以

理解为是从“⼀堆点”出发,⽤越来越多的细节去把图像填充完整。

研究⼈员将DALL·E2与DALL·E、GLIDE等模型进⾏了对⽐。

实验结果显⽰,DALL·E2的图像⽣成质量与GLIDE相当,但DALL·E的⽣成结果更具多样性。

⽬前,DALL·E2并未对公众开放,不过如果你感兴趣,可以在线注册申请⼀发~

项⽬地址:

—完—

「⼈⼯智能」、「智能汽车」微信社群邀你加⼊!

欢迎关注⼈⼯智能、智能汽车的⼩伙伴们加⼊我们,与AI从业者交流、切磋,不错过最新⾏业发展&技术进展。

ps.加好友请务必备注您的姓名-公司-职位哦~

点这⾥

更多推荐

如何p图