该项目可在一个项目中切换Stable Diffusion、waifu、NovelAI三大模型及权重,支持载入自主训练模型。进入Notebook后按步骤运行代码,含解压模型、安装库等,可实现文生图、图生图、超分等功能,也可批量生成,还介绍了参数、常见问题及非界面版玩法,方便用户集中操作。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Stable Diffusion、waifu、NovelAI三大模型及其权重 ,可以使用最基本模型权重组合,也同时可载入自主训练的模型(),模型无限创作无限。
有问题的话, 讨论区留言。
点击“运行一下”后,点击“启动环境”,选择合适的 GPU,进入项目。 AIStudio 每天自动赠送 8 小时的 GPU 算力。更厉害的 GPU 可以生成更大的图片。
进入之后,点击下边的框里左上角的“点击运行”(或者点进下面的框内用快捷键 Ctrl + Enter)
下面的代码只用在你第一次进入时运行!
下面的代码里在云环境里解压了模型文件,并且自动安装了各个文件。
等到显示“加载完毕”即可。如果中间可能出现红字:ERROR:pip's .... 这个不用管,会自动继续。
(理想不超过7分钟,太慢可先用CPU环境解压,解压完了再换回GPU环境,或者去讨论区进入交流群)
#下面的只能生成512 x 1024 的图,再大像素会报错 ,第一次运行后记得重启 ,第一次运行后记得重启 ,第一次运行后记得重启 import osfrom IPython.display import clear_outputfrom utils import check_is_model_completeprint('正在解压模型')if not check_is_model_complete("./NovelAI_latest_ab21ba3c_paddle"): # 解压 latest 模型
!unzip -o "/home/aistudio/data/data171442/NovelAI_latest_ab21ba3c_paddle.zip" # if not check_is_model_complete("./model_pruned_paddle"): # full 模型# !unzip -o "/home/aistudio/data/data171442/NovelAI_pruned_paddle.zip"if not os.path.exists("diffusers_paddle"):
!unzip -o diffusers_paddle.zipprint('正在安装库')
!pip install --upgrade pip -i https://mirror.baidu.com/pypi/simple
!pip install -U fastcore paddlenlp ftfy regex --user -i https://mirror.baidu.com/pypi/simple
!pip install --upgrade paddlenlp -i https://mirror.baidu.com/pypi/simpleprint('正在安装新版飞桨')# 如果需要生成 768 x 1024 则去掉下两行开头的井号运行一次 (运行成功一次即可), 但是可能卡, 建议挑人少的时候#!mv /home/aistudio/data/data168051/paddlepaddle-develop.whl /home/aistudio/data/data168051/paddlepaddle_gpu-0.0.0.post112-cp37-cp37m-linux_x86_64.whl#!pip install "/home/aistudio/data/data168051/paddlepaddle_gpu-0.0.0.post112-cp37-cp37m-linux_x86_64.whl" --userclear_output() # 清理很长的内容print('加载完毕, 下次不用再运行这里了')加载完毕, 下次不用再运行这里了
点击上边栏的“重启内核” 重启内核图:
最后一步,点击左上角的“点击运行”运行下面的代码,等几秒加载模型就可以玩耍啦~ 以后每次进来直接运行下面这个就行啦~
# 下载及解压SD预训练模型及waifu模型 ,可能需要比较长的时间import osif not os.path.exists("CompVis-stable-diffusion-v1-4"):
!wget https://paddlenlp.bj.bcebos.com/models/community/CompVis/stable-diffusion-v1-4/CompVis-stable-diffusion-v1-4.tar.gz
!tar -zxvf CompVis-stable-diffusion-v1-4.tar.gz
!rm -rf CompVis-stable-diffusion-v1-4.tar.gzif not os.path.exists("waifu-diffusion"):
!wget http://bj.bcebos.com/paddlenlp/models/community/hakurei/waifu-diffusion/waifu-diffusion.tar.gz #waifu-diffusion-v1-2
!tar -zxvf waifu-diffusion.tar.gz
!rm -rf waifu-diffusion.tar.gz #!wget https://paddlenlp.bj.bcebos.com/models/community/hakurei/waifu-diffusion/waifu-diffusion-v1-3.tar.gz #waifu-diffusion-v1-3 注意下面移动和解压
#!tar -zxvf waifu-diffusion-v1-3.tar.gz
#!rm -rf waifu-diffusion-v1-3.tar.gz
!unzip -o "data/data168051/stable-diffusion-v1-4.zip"
!unzip -o "sd-concepts-library.zip"# if not os.path.exists("trinart_stable_diffusion_v2_95k"):# !wget http://bj.bcebos.com/paddlenlp/models/community/naclbit/trinart_stable_diffusion_v2/trinart_stable_diffusion_v2_95k.tar.gz# !tar -zxvf trinart_stable_diffusion_v2_95k.tar.gz# !rm -rf trinart_stable_diffusion_v2_95k.tar.gz# 模型和权重加载都在这里,pipe 加载的权重,vae_path 加载的本体,如果第一次运行下面报错, 就重启内核重新运行一次from diffusers_paddle import StableDiffusionPipeline, StableDiffusionImg2ImgPipelineimport paddlefrom utils import save_image_infoimport os
pipe = StableDiffusionPipeline.from_pretrained("./CompVis-stable-diffusion-v1-4") # 加载SD默认权重#pipe = StableDiffusionPipeline.from_pretrained("./waifu-diffusion") # 加载waifu权重#pipe = StableDiffusionPipeline.from_pretrained("./NovelAI_latest_ab21ba3c_paddle") # 加载NovelAI权重# pipe = StableDiffusionPipeline.from_pretrained("./model_pruned_paddle")vae_path = 'stable-diffusion-v1-4/model_state.pdparams' # 加载 SD默认 模型#vae_path = 'waifu-diffusion/unet/model_state.pdparams' # 加载 waifu 模型#vae_path = './NovelAI_latest_ab21ba3c_paddle/vae/animevae.pdparams' # 加载 NovelAI vae 模型pipe.vae.load_state_dict(paddle.load(vae_path)) # 换用更好的 vae (有效果!)# 图生图pipe_i2i = StableDiffusionImg2ImgPipeline(vae=pipe.vae,text_encoder=pipe.text_encoder,tokenizer=pipe.tokenizer,
unet=pipe.unet,scheduler=pipe.scheduler,safety_checker=pipe.safety_checker,feature_extractor=pipe.feature_extractor)print('加载完毕')加载完毕
from ui import gui_txt2img # 文生图display(gui_txt2img.gui) # 生成的图片自动保存到左侧的 outputs 的文件夹里
VBox(children=(Textarea(value='extremely detailed CG unity 8k wallpaper,black long hair,cute face,1 adult girl…
from ui import gui_img2img # 图生图, 在左侧上传图片, 然后修改 "需要转换的图片路径"display(gui_img2img.gui) # 生成的图片自动保存到左侧的 outputs 的文件夹里
VBox(children=(Textarea(value='Kurisu Makise, looking at viewer, long hair, standing, 1girl, hair ornament, ha…
from ui import gui_superres # 超分 (图片放大一倍), 在左侧上传图片, 然后修改 "需要超分的图片路径"display(gui_superres.gui) # 生成的图片自动保存到左侧的 outputs 的文件夹里
VBox(children=(Text(value='image_Kurisu.png', description='需要超分的图片路径', layout=Layout(width='100%'), style=Desc…
Q: 加载文件 main.ipynb 时出错 failed to fetch 错误是什么问题?
A:项目文件比较大有可能是挂载的问题,需要重新退出项目后再点启动项目试试,10.15后的版本已精简main文件。重新进入项目因加载模型过多各文件下的图片可能依然存在failed to fetch 错误,直接生成新图片即可.退出项目时记得保存生存图片并清理特定文件夹 同时清除全部输出!!!
Q: 能不能用使用自己训练的模型啊?
A: 可以的, 这里有2种训练方法https://aistudio.baidu.com/aistudio/projectdetail/4592929?channelType=0&channel=0。 直接把模型上传到sd-concepts-library 文件里后 就能使用,后期考虑添加相关的2种训练方法 inversion 和dreambooth 方法
Q: 能不能用中文描述啊?
A: 可以的, 但是效果不如英文。因为模型是用英语文本训练的。(可以去翻译软件里翻译一下)
Q: 生成的图怎么都一样的?
A: 如果设定了相同的随机数种子且其它参数相同,则生成的图也是一样的。
Q: 生成的时候进度条卡住, 然后弹出一个框框:The kernel for main.ipynb appears to have died. It will restart automatically.?
A: 生成图片尺寸太大了!可以重启内核改用较小的尺寸,或者重新进入更换更大的 GPU。
Q: 其它神秘问题?
A: 请去评论区进讨论群。如果是默认的参数无法生成,可以删除该项目重新 Fork 一份从头开始。
如果你不满足于上面的界面玩法, 那么不妨来试试下面的部分!(下面有图生图哦)
参数:
注:生成图片尺寸越大, 则需要时间越久
注: 描述内容太长的话, 可以用右斜线 \ 换行.
生成的图都在 outputs 文件夹里。
height = 512width = 768seed = 3354985548steps = 50cfg = 7 prompt = "miku, looking at viewer, long hair, standing, 1girl, hair ornament, hair flower, cute, jacket, white flower, white dress 精灵耳朵"#negative_prompt = "{mucha},{extremely detailed 4K CG},{original}, {{masterpiece}},lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, \#cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"image = pipe(prompt,height=height,width=width,num_inference_steps=steps,guidance_scale=cfg,seed=seed,negative_prompt=negative_prompt).images[0]print('Seed =', image.argument['seed'])
display(image)
save_image_info(image, path = './jpgout/') # 保存图片到指定位置image.argument # 查看图片生成使用的参数
{'prompt': 'miku, looking at viewer, long hair, standing, 1girl, hair ornament, hair flower, cute, jacket, white flower, white dress',
'height': 512,
'width': 768,
'num_inference_steps': 50,
'guidance_scale': 7,
'negative_prompt': 'lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry',
'eta': 0.0,
'seed': 1835537382,
'latents': None}参数:
注:批量就不要设置种子, 否则出来的图都一样。
生成的图都在 outputs 文件夹里。
# 批量文生图number = 2height = 768 width = 512steps = 50cfg = 17.5 prompt = "kitsune made out of flames, digital art, synthwave . "negative_prompt = "{mucha},{extremely detailed 4K CG},{original}, {{masterpiece}},lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"for i in range(number):
image = pipe(prompt,height=height,width=width,num_inference_steps=steps,guidance_scale=cfg,negative_prompt=negative_prompt).images[0]
save_image_info(image, path = './jpgout/')
display(image)# 批量文生图number = 2height = 768 width = 512steps = 50cfg = 17.5 prompt = "kitsune made out of flames, digital art, synthwave . "negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"for i in range(number):
image = pipe(prompt,height=height,width=width,num_inference_steps=steps,guidance_scale=cfg,negative_prompt=negative_prompt).images[0]
save_image_info(image, path = './jpgout/')
display(image)参数:
注: 描述内容太长的话, 可以用右斜线 \ 换行.
生成的图都在 outputs 文件夹里。
path = "image_Kurisu.png"steps = 50seed = 20221008strength = 0.8cfg = 7.5prompt = "kitsune made out of flames, digital art, synthwave "negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
from utils import ReadImage
init_image = ReadImage(path, height=-1, width=-1) # -1 为自动判断图片大小image2 = pipe_i2i(prompt,init_image=init_image,num_inference_steps=steps,strength=strength,guidance_scale=cfg,seed=seed,negative_prompt=negative_prompt)[0][0]print('Seed =', image2.argument['seed'])
display(image2)
save_image_info(image2, path = './outputs/') # 保存图片到指定位置image2.argument # 查看图片生成使用的参数
{'prompt': 'Kurisu Makise',
'init_image': <PIL.PngImagePlugin.PngImageFile image mode=RGB size=512x768 at 0x7F188818A610>,
'strength': 0.8,
'num_inference_steps': 50,
'guidance_scale': 7.5,
'negative_prompt': 'lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry',
'eta': 0.0,
'seed': 20221008}
### 批量图生图
参数:
注:批量就不要设置种子, 否则出来的图都一样。
生成的图都在 outputs 文件夹里。
number = 10path = "https://img.php.cn/upload/article/001/571/248/175306710847236.jpg" #替换了一个网络图片steps = 50strength = 0.8cfg = 13.5prompt = "miku is Sitting on a wooden chair with porcelain on a wooden multi-purpose shelf behind her while With incense burner at the top of the shelf, looking at viewer, long hair, standing, 1girl, hair ornament, hair flower, cute, jacket, white flower, white dress"negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
from utils import ReadImage
init_image = ReadImage(path, height=-1, width=-1) # -1 为自动判断图片大小for i in range(number):
image2 = pipe_i2i(prompt,init_image=init_image,num_inference_steps=steps,strength=strength,guidance_scale=cfg,negative_prompt=negative_prompt)[0][0]
save_image_info(image2, path = './outputs/')
display(image2)Stable Diffsuion textual_inversion训练
https://aistudio.baidu.com/aistudio/projectdetail/4592929?channelType=0&channel=0
learned_embeded_path = "sd-concepts-library/Marc_Allante-style.pdparams"for token, embeds in paddle.load(learned_embeded_path).items():
pipe.tokenizer.add_tokens(token)
pipe.text_encoder.resize_token_embeddings(len(pipe.tokenizer))
token_id = pipe.tokenizer.convert_tokens_to_ids(token) with paddle.no_grad():
pipe.text_encoder.get_input_embeddings().weight[token_id] = embeds
prompt = f"a colorful color painting of {token} styles ,kitsune made out of flames, digital art, synthwave. " #如果不是图片风格是物体 使用a photo of a {token}# negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"num_samples = 1 #图片数量 images = pipe([prompt] * num_samples, height=704, width=512, num_inference_steps=50 , guidance_scale=7.5,seed=1788937216).imagesfor img in images:
display(img)
save_image_info(img, path = './learnout/')
learned_embeded_path = "sd-concepts-library/hitokomoru-style.pdparams"for token, embeds in paddle.load(learned_embeded_path).items():
pipe.tokenizer.add_tokens(token)
pipe.text_encoder.resize_token_embeddings(len(pipe.tokenizer))
token_id = pipe.tokenizer.convert_tokens_to_ids(token) with paddle.no_grad():
pipe.text_encoder.get_input_embeddings().weight[token_id] = embeds
prompt = f"a colorful color painting of {token} styles ,kitsune made out of flames, digital art, synthwave. "# negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"num_samples = 1 #图片数量 images = pipe([prompt] * num_samples, height=704, width=512, num_inference_steps=50, guidance_scale=17.5,seed=2788937216).imagesfor img in images:
display(img)
参数:
注:批量就不要设置种子, 否则出来的图都一样。
生成的图都在 outputs 文件夹里。
# 加载权重文件pipe = StableDiffusionPipeline.from_pretrained("./waifu-diffusion")#pipe = StableDiffusionPipeline.from_pretrained("./CompVis-stable-diffusion-v1-4")#pipe = StableDiffusionPipeline.from_pretrained("./NovelAI_latest_ab21ba3c_paddle")# 加载sd-concepts-library中的训练模型 learned_embeded_path = "sd-concepts-library/huang-guang-jian-style.pdparams"# 自训练模型生成多张图片for token, embeds in paddle.load(learned_embeded_path).items():
pipe.tokenizer.add_tokens(token)
pipe.text_encoder.resize_token_embeddings(len(pipe.tokenizer))
token_id = pipe.tokenizer.convert_tokens_to_ids(token) with paddle.no_grad():
pipe.text_encoder.get_input_embeddings().weight[token_id] = embedsimport time
timestring = time.strftime('%Y%m%d%H%M%S') #a colorful painting of {token} styles,prompt = f"a colorful color painting of {token} styles ,kitsune made out of flames, digital art, synthwave. "negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"numg = 50 #图片数量 num_samples = 1for _ in range(numg): with paddle.no_grad():
image = pipe([prompt] * num_samples,num_inference_steps=100,width=1024,height=512,negative_prompt=[negative_prompt],guidance_scale=13.5).images[0]
timestring = time.strftime('%Y%m%d%H%M%S')
image.save(f"./learnout/{timestring}_.png") # image.save(f"./jpg/{timestring}.png")
with open(f'./learnout/{timestring}.txt', 'w') as f:
print(image.argument,file = f)
display(image.argument)
display(image)确保已经下载该文件 且压缩文件能正常打开
# 清理文件夹使用 确保已经下载文件#删除文件夹下面的所有文件(只删除文件,不删除文件夹)import osimport shutil#python删除文件的方法 os.remove(path)path指的是文件的绝对路径,如:def del_file(path_data):
for i in os.listdir(path_data) :# os.listdir(path_data)#返回一个列表,里面是当前目录下面的所有东西的相对路径
file_data = path_data + "/" + i#当前文件夹的下面的所有东西的绝对路径
if os.path.isfile(file_data) == True:#os.path.isfile判断是否为文件,如果是文件,就删除.如果是文件夹.递归给del_file.
os.remove(file_data) else:
del_file(file_data)#path_data = r"jpgout" # 删除TXT 生成的文件path_data = r"outputs" #删除图生图 生成的文件#path_data = r"learnout" #删除自训练文生图 生成的文件del_file(path_data)以上就是一个项目体验stable-diffusion、waifu、NovelAI三大模型的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号