novelai吧 关注:356,443贴子:1,672,049

常见Anime风格CKPT与VAE效果参考

只看楼主收藏回复

公共参数:Sampler=DDIM, Steps=30, CFG=8, Seed=1796406207, Clip Sikp=2, ENSD=31337, W*H=512*768。Hires超分2倍,Latent采样20步, Upscale by 2。
使用的VAE从上到下分别为:无VAE,SD官方提供的VAE,WaifuDiffusion的VAE,NovelAI的VAE。值得一提的是,Orangemix.vae就是NovelAI的VAE,Pastel默认的VAE就是WaifuDiffusion的VAE。


IP属地:中国香港1楼2023-03-03 02:05回复
    然后是prompt。为了把模型的默认风格展现出来,词条尽可能少简洁。
    masterpiece, best quality, 1girl, solo, detailed golden eyes, long silver hair, pink bikini, shiny skin, facing viewer, standing, starry sky, beautiful detailed water
    负面词条使用了两个复合embedding减少工作量。分别是Counterfeit提供的EasyNegative,和viewermix提供的veryBadImageNegative。由于如今的二次元模型都或多或少的带有CF的血统,这两个混合嵌入对它们的效果都不错。
    EasyNegative, verybadimagenegative_v1.2-6400, (worst quality, low quality), blurry


    IP属地:中国香港2楼2023-03-03 02:05
    收起回复
      然后慢慢介绍一下各位运动员。这里面其实很多我并没有深入用过,有经验的佬们可以分享一些心得技巧。关于模型演变史的其实我没有做什么深入的考证,纯图一乐,抛砖引玉,有问题欢迎提出。如无特殊说明本贴只着眼于Anime风的模型,硬要说全都能追溯到SD1.4、1.5去,正儿八经的三次元模型没怎么了解过。
      众所周知所谓的ckpt模型准确的说是SD模型的权重集,相当于高维向量空间中的特征向量,对应着不同的ckpt的不同的表现力,而融合模型可以在某种程度上理解为几个向量的加权平均。所以有必要先介绍三大基因源,现如今的二次元模型几乎都可以向上追溯到它们。
      1. NovelAI,万恶之源(误),虽然它现在在画面表现力上已经没有出彩的地方了,但由于吸纳了海量danbooru的带标签数据,为日后所有衍生出的Anime模型的标定和tag撰写提供了极其重要的锚定点。NAI现在已经不常在别的融合模型的配料表上见到了,但它的血脉早已播撒到每个角落。想要知道他当初的光辉可以在https://rentry.org/hdgrecipes上窥见一斑。
      2. Counterfeit,在22年10月份NAI泄露之后的首批Anime私炉几乎都与原版NAI大同小异,早期的训练方法也比较受限,更多的还是embedding和hypernetwork的训练。22年11月份DreamBooth出来以后,泛化大模型的训练才开始爆发。Counterfeit应该不是最早使用这项技术的大模型,但可能是血脉流传最广的之一,主要证据就是现在绝大部分写了mix成分表的的Anime混合模型都少不了cf的身影(倒是NAI早都找不到了),另一点就是cf的EasyNegative在大多数二次元模型上都很有效。Cf的huggingface没写他们是否融了别的模,但从效果图上看,1.0、2.0还是带有很重的NAI的感觉,而2.5的人物面部则立体了许多,也许是融入了basilmix的成分。另外提一点,同参数下Cf的背景总是和其他几个模差异较大,更加印证了其独特性。
      3. Pastel,俗称蜡笔模型,虽然是个融合模型,但这个模型本身风格极其强烈,以至于它更多被用于融合。带有Pastel基因的模型通常都在面部上色上别有一番风味。从配方上来看Pastel也有Basil的成分,但是画面表现上比较难看出。
      4. 四大天王有五个应该是常识吧(笑)。Basil_mix没有被计入三大基因源内主要还是因为它是个纯三次元模型。尽管这也是个融合模型,但它在Asian face上的表现过于亮眼而被广泛传播。它在为现如今的大部分模型注入了新的数据,同时也给目前AI绘画带来了一丝风险。Basil的配方已经不可考(其实是我懒得考,真人模也不好考),只知道其中包含了一个能炼铜的模型所以你懂的。


      IP属地:中国香港3楼2023-03-03 02:06
      收起回复
        说完基因源再说下几位首席大弟子(说F1好像不太准确),虽然是融合模型但传播非常广泛:
        1. Anything,有一种NAI太子的感觉,在3.0之前NAI的感觉都还比较明显,目前的4.5看得出已经有不少的三次元血统(basil)在里面了。现在融合模型不再使用NAI之后,最常用的可能就是Anything3了?
        2. OrangeMix,这系列也是做了很长时间,主要是在涩图生产领域颇有人气。最主要的贡献就是从AOM2开始吸了basil,后来又吸了Cf。AOM3是个人目前最喜欢的二次元模型,虽然血统已经很不二了,但是仍然没有突破到2.5D的范畴,整体体验极佳。虽然例图里和Cf2.5差异挺大,但是其实整体的风味确实比较像。
        然后剩下的了解不深就一笔掠过了,大家也可以多品品主楼的例图,同参属下表现越接近说明血缘越近。有玩的多的可以多多分享。
        7th,这个的脸型有点早期NAI,上色相对较平,现在见人玩的也比较少,个人比较无感。
        grape,这个可以说是继承自AOM2分出来更加专注于NSFW的一支(可能是通过更多地继承Gape),创作SFW图效果平平,当然也不能说不好,只不过画面效果上来看太像Cf2.0或AOM2。
        viewermix,相较于Cf/Orange系很有区分度,我认为是Pastel系里最实用最有那味的一款。吧里有个用这个模的大佬创作了非常多效果极好的作品,大家可能都欣赏过不少了。
        MixPro的脸型还蛮独特的,Pastel+Basil+一些作者的独特审美,脸比较小,显得可爱。画风上也更“二”一点,色彩也不差。
        cetus和facebomb,从常规效果上来看有点过于相似了。facebomb说他是是Pastel AOM2H Cf2.5融出来的,cetus没说。注意FaceBomb的C站例图全都是加了realistic和3d face的,所以2.5D感觉很强,这模型可能对这俩词条有特殊的优化,有需要可以自行体验。
        meinav7是用facebomb和pastel融的,脸型上有一点区别,但不是很明显。


        IP属地:中国香港4楼2023-03-03 02:06
        收起回复
          干货


          IP属地:浙江5楼2023-03-03 02:39
          回复
            顶顶


            IP属地:广东来自Android客户端6楼2023-03-03 02:59
            回复
              最近用meinav7 看多了深渊橙 这个出图比较清新


              IP属地:广东来自iPhone客户端8楼2023-03-03 04:25
              回复
                帮顶


                IP属地:广西来自Android客户端9楼2023-03-03 08:19
                回复


                  IP属地:湖南来自Android客户端10楼2023-03-03 08:21
                  回复
                    好帖


                    IP属地:广东来自Android客户端12楼2023-03-03 08:36
                    回复


                      IP属地:广东来自iPhone客户端13楼2023-03-03 08:36
                      回复


                        IP属地:广东来自iPhone客户端14楼2023-03-03 08:42
                        回复


                          IP属地:四川来自Android客户端15楼2023-03-03 08:47
                          回复
                            辛苦,写的真详细


                            IP属地:北京来自Android客户端16楼2023-03-03 08:51
                            回复