群发资讯网

即梦4.5来袭,这次是真的进步了!尽管对标失败~

目录前言第一局:人像摄影交锋第二局:商业用图比拼第三局:信息图表对战第四局:多格漫画对决小结不知道大家有没发现?同样的模

目录

前言

第一局:人像摄影交锋

第二局:商业用图比拼

第三局:信息图表对战

第四局:多格漫画对决

小结

不知道大家有没发现?同样的模型,在即梦上生成的结果就是比豆包好。

可能即梦在seedream系列模型的基础上自己做了些许优化吧,豆包就是原汁原味的模型。

这不,这周一我发现即梦4.5悄悄更新了,加上字节seedream4.5模型上周在豆包上线,我还想验证一下我的猜想,于是随便整了一张图,结果确实同我的感受是一样的。同样的模型,即梦上生成的效果更好(没有空间逻辑问题)。

(上由豆包生成,下由即梦生成)

官方说seedream4.5在主体一致性、空间逻辑、排版布局、语言理解、细节修复能力上都有所增强。

不知即梦4.5能与Nano banana pro(以下简称pro)对打不?现在我组了几局,邀请屏幕前好奇的你同我一起观战。

因部分案例与上篇相同,大家请看上一篇文章(生图界的NO.1,Nano banana pro是近乎万能的神!)查找相同案例下pro的生成图:

(PS:除表情包外,文中所有图片皆由AI生成。提示词请见评论区)

第一局:人像摄影交锋

**全家福

这考验的是模型“多张参考图融合+摄影参数理解+空间逻辑应用”的能力。

(即梦4.5生成)

结果下来就是,即梦4.5整体不如pro聪明、灵活。

比如即梦4.5光写“全家福”会以抓拍形式呈现,需要写出“面对镜头”才会都看镜头,不会自动去除原来场景的其他人物;对摄影参数敏感度不高,参数差距较大的生成的图差距不太大。

即梦4.5创新能力挺好,不过也不知是否为恃才傲物,创新没用对地方,生图有时候多出自创的人物,有时候又把控不足,出现两个一模一样的人。

不过与以前的自己相比,它的颜色处理和空间逻辑确实提升了,爱因斯坦的脸色比pro还要自然。它的人物姿势也比pro自然些。

**写真组图

这次加大难度,考了即梦4.5“一致性保持+空间逻辑应用+异尺寸批产+复杂场景生成”等多项功能的组合能力。

先说结果,即梦4.5一致性有瑕疵,除空间逻辑之外的物理逻辑崩了,无法实现批批产异尺寸的图,整体质感比不上pro。

(即梦4.5生成 )

看吧,即梦4.5的人物形象变了,大多发型散了,最后一张眼影突现,最后排第二张人脸崩了;部分元素不符合场景,比如最后排第一张耳语像一起自拍,最后排行走的倒影、灯的背景太假了。而pro只有1个错误(第一张不符合提示词要求的“手捧”)

尺寸选择虽然有个“智能尺寸”选项,但这意思是批量图是同一个尺寸,但不是2:3、16:9等这些常见的尺寸。

即梦中碰到不能用的图,大家单张修改吧,至少对比之前的版本,修改的次数少些了~

人像摄影这局,pro胜出,不过即梦4.5进步挺大。

第二局:商业用图比拼

**宣传用图

这考验的是模型“中文字体渲染+排版配色”的能力。

即梦4.5这回过关了。

(即梦4.5生成)

它的宣传单设计得还不错,懂字号大小,整体符合要求,文字也没啥问题,可以直接商用。

杂志封面可能因为涉及肖像权,明星图片无法上传,它也不会智能生成对应人脸。

(即梦4.5生成)

(pro生成)

即梦4.5生成的人物姓名有问题,不过问题不大,再次修改即可。

再看pro,它在明星人脸方面灵活多了,无论是否上传明星图,都能生成对应人脸。不过也有瑕疵,人脸可能多生成几次就对应不上了,字体颜色不太符合要求。

总之,杂志封面上,pro离直接商用更近一些。

**专业设计

此处考察的是模型“材质还原+物理规律+空间逻辑+美学渲染”的能力。

就比如机械结构图:

(即梦4.5生成)

(即梦4.5生成)

(pro生成)

(pro生成)

先抛开准确性和实用性不谈,只看非专业的我们能看明白的地方。即梦4.5图上的文字或数字有些有误或不清楚,有些视图还是会重复,但pro就没有这些问题。

另外,在我生成过程中,我发现,即梦4.5不会考虑你的潜在需求,不像pro会从提示词中读懂你的“潜台词”。就比如材质信息和注释,我要在提示词中点名了,即梦4.5才能生成出来。

再来看室内设计图:

(平面布局图-即梦4.5生成)

(平面布局图-即梦4.5生成)

(平面布局图-pro生成)

就平面布局图而言,两者大致看都有模有样,不过细看就会发现有明显问题。即梦4.5多处明显不符合逻辑——室内尺寸大于外墙尺寸、客卫2个马桶、功能区标注有误、标注的尺寸不完整;而pro只有即梦4.5的室内尺寸问题。

(装修效果图-即梦4.5生成)

(装修效果图-即梦4.5生成-更改沙发面料)

(装修效果图-pro生成)

就装修效果图而言,两者装修风格都OK,只是即梦4.5的材质有问题(材质不是羊羔绒),乱搞创新(平面布局图印墙上),pro就一处问题(物品放置不会还原平面布局图样子)。

商业用图这局,pro胜出。

第三局:信息图表对战

此处考察即梦4.5“事实准确+增强知识库”的能力。

我是没想到,一句话要求下,即梦4.5连这类纯依靠增强知识库的图都能生成,还挺好看,毕竟我之前试4.0的多文字知识卡片时,自己输入图上文字,它都漏洞百出。

果然是进步很多呀~

不过对比pro,即梦4.5还是暴露出诸多毛病。

(即梦4.5生成-肝硬化科普)

(即梦4.5生成-电子墨水屏技术特点)

(pro生成-电子墨水屏技术特点)

最突出的就是图上信息量明显少于pro,其次是笔画多的文字有误,数据图表美观但作图大多不符合逻辑。

这一局,还是pro胜出,不过即梦4.5有大大进步~

第四局:多格漫画对决

这个终极对决,不用我说,大家想必也知晓谁是本次的赢家了。

对,就是pro,前面就埋下了伏笔。毕竟这局考验的能力太多了,剧情设计、增强知识库、事实准确、构图设计、一致性得都强才行。

还是放个即梦4.5的生成图,大家图一乐吧~

(无参考图的漫画-即梦4.5生成)

(上传角色参考图的漫画-即梦4.5生成)

即梦4.5的剧情逻辑、人物一致性、科普知识、图表准确性上都有问题,尤其是前两个问题更突出,甚至有时不按要求直接生成6张一模一样的多格漫画。

小结

目前即梦4.5还是没办法对pro贴脸开大,毕竟双方实力太悬殊了。

相比pro,使用过程中,即梦4.5莫名其妙的禁词和限制多样的图片让人心中窝火、创作积极性下降。

生成结果上,字节的生图模型在懂“潜台词”、保持一致性、增强物理逻辑、造复杂构图、增强数据库、运用摄影参数等方面都需要加强。

不过相比过去的自己,seedream系列模型已经有了阶梯式地提升了,未来我们还会看见更璀璨夺目的它!

今天的分享就到这里了。若你对即梦4.5和Nano banana pro有自己的感悟,过欢迎在评论区分享,也欢迎大家小绿泡讨论哦~

关注ChooseAI,和我们一起探索AI时代!