注:
- 本文有较强时效性,请关注本文发表时间与更新时间
- 本文的创作是为了指出而不是解决问题,因此不会细致分析问题出现的原因

背景

最近在研究AI绘画,以前使用过Stable Diffusion WebUI,现在在尝试ComfyUI。然而不论是Stable Diffusion v1.5还是较新的SDXL,所绘制的图片均存在一定的问题。

举下面一张图为例(AI直出的图,没有经过后处理):
生成结果
以及用于生成这张图的Workflow(注意使用的种子不是下图中的种子):
ComfyUI的Workflow

分析

这张图乍看起来似乎没毛病,但是仔细观察却能看出不少问题。当然可能不是所有的问题都被归类在这里,而且部分问题在这张图里没有体现。
将出现的问题逐类编号如下:
问题

问题1——手部缺陷

众所周知,AI画不好手,尽管绘制这张图采用的模型基于SDXL训练而来,降低了坏手的概率,但仍然避免不了手部出现问题。如果AI画的图中出现了手,那么手出问题的概率在95%左右。这样的问题的出现与手部姿势极其复杂有关,一时难以解决,也很难通过Photoshop等图像处理软件后处理来补救,只能期待技术的进步能解决这一问题。

问题2——窗户歪斜

这也是AI绘画出现的特有问题,相似的问题还有生成水印和(在书本、电脑屏幕上)生成不可读的文字等。凡是出现直线时,均有可能出现这样的问题,好在这个概率不算太高,并且相对前者更容易补救。

问题3——不合逻辑

仔细看裙子的网格,会发现阴影处有1根网格线,到了有光照的地方却突变为2根网格线,显然不符合逻辑。当遇到元素间的交叉处时,出现这种问题的概率更大且问题更明显。上个问题与这个问题的出现,可以反映出AI并不理解所画的内容。

问题4——头发杂糅

不只是画手,由于头发的复杂性,画头发也是AI面临的一个重要难题。几乎每一张图都有这个问题,只是这个问题相对比较隐蔽,没有那么明显,第一眼很难看出来,需要细看才能发现。

问题5——随机噪点

这种问题出现的概率或与模型有关,有些模型噪点出现得很多,有些却很少。不过通常它们在数量不大的情况下不怎么影响观感,也很容易通过Photoshop等软件去除。

结语

期末考试的时候做到一篇英语阅读理解,大致是讲述了元宇宙(Metaverse)看上去很有吸引力,然而亲身体验却发现效果没那么好。AI绘画或许也处于这种状态吧,表面光鲜亮丽,大有取代人类画师的可能,可实际上还存在着诸多问题,与人类画师差距依然较大。希望未来这些问题能得到解决,使AI绘画能更好地服务人类~