你好吧主,我先介绍一下我的情况。
我刚跑了三天,租用的机器跑的(3090),用的TonyNoStark汉化版,想练一个专丹256,虚拟内存开到D盘450000M,模型使用的是原作者的RTM和RTT,RTM放入了aligned里并解压写入遮罩,RTT里文件放入了model里。遮罩模型用的是论坛里2200W的遮罩。
训练方法,因为刚学跑模型,看到有人分享的新人七步训练方法,就按照这个七步训练方法跑了。第一步到前天晚上跑到50W左右,目标损失降到0.52一直下不去,而且有反弹,反弹不高,但是数值不降下去或者非常非常慢了。而且电脑非常卡,S自动保存需要时间非常长,而且还重复自动保存,卡死了重启,模型损坏了,有备份。
DeepFacelab安装在D盘,今天我把D盘格式化了,重新安装了软件,不卡了,重新添加了数据,也把备份的文件复制到了mldel,继续按第一步参数跑,目标损失还是不降偶尔反弹,所以我就保存备份后按第二步参数选择继续训练,可是一开始训练源损失就是0.7 目标损失0.84,反而比第一步数值高了,这是怎么回事啊?
1 我的操作有问题吗?
2 虚拟内存(不懂这个)可以停了软件随时清理删除吗?对继续训练有影响吗?
3 第一步以目标损失值0.52结束训练,第二部修改了参数后继续训练开始时目标损失值却是以0.84开始,而且每次自动保存显示的都是只将了0.003左右,有的时候还没有降,请问这个是正常情况吗?每次参数修改后继续训练目标损失值都会变高吗?
下附几张图(不知道我描述的是否准确,目前61W)
望大佬指点一下,期待大佬回复,万分感谢。。。万分感谢。。。万分感谢。。。