使用介绍
NightVisionXL最初是一款经过简单训练、专注于摄影的 SDXL 模型,专门用于摄影输出。在过去的几个月里,NightVision 接受了数十次训练和调整,以追求令人愉悦的美学输出。随着 8.X 版本的发布,我感觉我离我的目标更近了一步,即轻松获得美观的输出,而无需令人困惑的底片或逗号分隔的废话。
NightVisionXL使用自然语言。向它发出提示就像向人类描述场景一样,您会惊讶于它能够多么好地理解和领会您的提示。
NightVisionXL V9.0.0 发行说明
这是 NightVisionXL 9.0 – 该模型是 NightVision v8.1.1 的微调,包含约 10,000 张图像,其中 40% 来自摄影数据集,40% 来自 Laion Pop(使用 GPTV 过滤和重新加注字幕),10% 来自电影数据集(与训练 CineVisionXL 所用的数据集相同),10% 是从 Civit 和 MJ 挑选的合成最爱混合图像,所有图像都是手工挑选的,并使用 GPTV 加注字幕。所有输入图像都是高质量和大尺寸的,在训练时使用各种尺寸和长宽比进行分组,从而使模型非常擅长产生连贯的输出,即使在非常宽或高的长宽比以及介于两者之间的任何长宽比下也是如此。与 8.1.1 一样,NightVision v9.0 是一个通用模型,可以输出几乎任何您喜欢的风格。 NV 继续倾向于使用自然语言提示而不是 1.5 风格(尽管它仍然有效),但是它没有 Pony 训练或混合,所以那些特定于 Pony 的提示规则在这里不起作用(抱歉)。
我没有混合任何加速或改进,也没有任何其他替代许可证模型或 LoRA。NightVisionXL 仍然是纯 SDXL 模型,并且将保持这种状态。
与我通常的更新日志(见上文)不同,我想简要介绍一下 SD3 Medium(2B 模型版本)的发布。作为这个社区的一员,我对发布的模型的状态感到非常不满。对模型的粗暴审查是不必要的,并且实际上破坏了模型,使训练几乎不可能进行(从技术角度来看,不可能应用任何类型的体面学习率,否则损失会飙升,训练会变得非常糟糕,甚至完全崩溃)。我知道我已经从现场消失了一段时间,我和许多其他训练师一样决定“等待 SD3”——现在我后悔这个决定。这个版本的 NightVision,这是我为自己和亲密朋友训练的“私人库存”版本。V8.1.1 是绝唱,v9 是我送给朋友的特别礼物,正是那些朋友说服我应该发布 v9,希望这可以帮助包扎 SD3 给社区造成的伤口。 V9 并不完美,它与所有 SDXL 模型一样具有缺陷(主要与 SDXL VAE 有关,我无法修复),但这是我制作的最好的,现在它是你的了。
我们将看看 SD3 会发生什么。我现在要说的是,除非 2B 模型在训练方面取得重大突破,否则我可能会跳过它并坚持使用 8B 模型(如果他们不破坏它的话),或者可能考虑训练不同的架构,只是还不确定是哪一个。
已知的问题
- 男性生z器更好,但仍然很奇怪。如果你需要完美的阴j,就使用 lora
- 手大概是 85/90%,这取决于姿势,但有些东西,比如拿着物体,可能会对你造成伤害。
- 上下颠倒或侧向(这是 SDXL VAE 问题)
- 在最初几代中,中等距离的面部和细节可能比较模糊(另一个 VAE 问题)
作品参照
In bold, neon letters against a backdrop of swirling lights and bright colors, (the title text "NVXL9" stand out:1.4). The poster features a futuristic scene, with a backdrop of pedestrians, robots and glowing screens, a retro futuristic bot stands menacingly
Steps: 30, Size: 832x1216, Seed: 1765264128, Model: NightVisionXL_0.9.0.0.fp16, Version: f0.0.17v1.8.0rc-latest-287-g77bdb920, Sampler: DPM++ 2M SDE SGMUniform, CFG scale: 2.5, freeu_b1: 1.3, freeu_b2: 1.02, freeu_s1: 0.99, freeu_s2: 0.95, pag_block: middle, pag_scale: 20, sag_scale: 0.25, Model hash: b3cbfd20eb, Hires steps: 20, pag_enabled: True, pag_rescale: 0, sag_enabled: True, pag_block_id: 0, Hires upscale: 1.5, freeu_enabled: True, Hires upscaler: 4x-UltraSharp, pag_block_list: , sag_blur_sigma: 2, pag_hr_override: False, dynthres_enabled: True, pag_rescale_mode: full, dynthres_cfg_mode: Constant, Denoising strength: 0.5, dynthres_sched_val: 1, pag_adaptive_scale: 0.65, dynthres_mimic_mode: Constant, dynthres_mimic_scale: 1.5, dynthres_cfg_scale_min: 0, latent_modifier_enabled: True, dynthres_interpolate_phi: 1, dynthres_mimic_scale_min: 0, dynthres_scaling_startpoint: MEAN, dynthres_variability_measure: AD, dynthres_threshold_percentile: 1, latent_modifier_affect_uncond: None, latent_modifier_combat_method: subtract, latent_modifier_tonemap_method: reinhard, latent_modifier_rescale_cfg_phi: 0, latent_modifier_combat_cfg_drift: 0, latent_modifier_extra_noise_type: gaussian, latent_modifier_sharpness_method: anisotropic, latent_modifier_spectral_mod_mode: hard_clamp, dynthres_separate_feature_channels: enable, latent_modifier_divisive_norm_size: 127, latent_modifier_extra_noise_method: add, latent_modifier_tonemap_multiplier: 0, latent_modifier_tonemap_percentile: 100, latent_modifier_contrast_multiplier: 0, latent_modifier_extra_noise_lowpass: 100, latent_modifier_dyn_cfg_augmentation: None, latent_modifier_sharpness_multiplier: 10, latent_modifier_extra_noise_multiplier: 0, latent_modifier_spectral_mod_multiplier: 0, latent_modifier_spectral_mod_percentile: 5, latent_modifier_divisive_norm_multiplier: 0
[art by Fritz Lang and Abbas Kiarostami::10], photograph, in this surreal scene, there's a male artist with vibrant red eyes and a messy smile. The man wears a magical white and burgundy iro and buba and sunglasses that seem to glow in the soft light of his flickering fluorescent lights. He holds a set of soap bubbles in one hand, reminiscent of the iridescent <unk>that inspired him, while also having an orange sunhat in the other. Moon in the night, Anime screencap, 50s Art, Light and shadow plays, film grain, Ilford HP5, 800mm lens, Sepia filter, (key visual, cinematic white Color grading)
Steps: 30, Size: 896x1152, Seed: 2065201422, Model: NightVisionXL_0.9.0.0.fp16, Version: f0.0.17v1.8.0rc-latest-287-g77bdb920, Sampler: DPM++ 2M SDE AYS, CFG scale: 2.5, freeu_b1: 1.3, freeu_b2: 1.02, freeu_s1: 0.99, freeu_s2: 0.95, pag_block: middle, pag_scale: 20, sag_scale: 0.25, Model hash: b3cbfd20eb, pag_enabled: True, pag_rescale: 0, sag_enabled: True, pag_block_id: 0, freeu_enabled: True, pag_block_list: , sag_blur_sigma: 2, dynthres_enabled: True, pag_rescale_mode: full, dynthres_cfg_mode: Constant, dynthres_sched_val: 1, pag_adaptive_scale: 0.65, dynthres_mimic_mode: Constant, dynthres_mimic_scale: 1.5, dynthres_cfg_scale_min: 0, latent_modifier_enabled: True, dynthres_interpolate_phi: 1, dynthres_mimic_scale_min: 0, dynthres_scaling_startpoint: MEAN, dynthres_variability_measure: AD, dynthres_threshold_percentile: 1, latent_modifier_affect_uncond: None, latent_modifier_combat_method: subtract, latent_modifier_tonemap_method: reinhard, latent_modifier_rescale_cfg_phi: 0, latent_modifier_combat_cfg_drift: 0, latent_modifier_extra_noise_type: gaussian, latent_modifier_sharpness_method: anisotropic, latent_modifier_spectral_mod_mode: hard_clamp, dynthres_separate_feature_channels: enable, latent_modifier_divisive_norm_size: 127, latent_modifier_extra_noise_method: add, latent_modifier_tonemap_multiplier: 0, latent_modifier_tonemap_percentile: 100, latent_modifier_contrast_multiplier: 0, latent_modifier_extra_noise_lowpass: 100, latent_modifier_dyn_cfg_augmentation: None, latent_modifier_sharpness_multiplier: 10, latent_modifier_extra_noise_multiplier: 0, latent_modifier_spectral_mod_multiplier: 0, latent_modifier_spectral_mod_percentile: 5, latent_modifier_divisive_norm_multiplier: 0
Photo of TWbabeXL01, NSFW, photorealistic, 1 girl, Sci-Fi, extremely detailed, glowing lights, beautiful magical sparkles, vibrant whimsical colors,
Negative prompt: CGI, Unreal, Airbrushed, Digital
Steps: 40, Size: 832x1216, Seed: 1978752448, Sampler: DPM++ 2M Karras, CFG scale: 5, Clip skip: 2, Created Date: 2024-06-19T0704:18.3844554Z
使用介绍
NightVisionXL v0.7.9.1 发行说明
NightVisionXL v0.7.9.1 是我迄今为止最连贯的版本。它非常适合长而复杂的提示,并且大多数现在都可以用手操作,包括握住物体并将手指放在物体另一侧的正确位置。o_O 面现在大部分已修复,但仍可以以 XL“非标准”长宽比回归。NV791 对摄影关键词的响应非常灵敏,您会发现它很容易获得逼真的模拟风格摄影,具有美丽的胶片颗粒、自然光以及对姿势和情感关键词敏感的拍摄对象。我还添加了大量的宽屏训练,因此 NV791 可以很好地处理 16:9 和 21:9 超宽输出,尤其是野生动物和自然摄影风格。
最后,NightVision 非常擅长修复自己的输出(YMMV 修复其他模型输出)。无论您使用的是 adetailer、face editor, face detailer还是其他“自动修复工具”之一,它都能很好地配合这些工具,但它真正的亮点在于使用蒙版进行直接修复。
变更日志 23 年 12 月 2 日
- 专注于模拟摄影风格的多重微调(NV的专长)
- 添加了针对许多宽屏(16:9、21:9 等)比例图像的另一项训练,重点关注摄影和电影风格
已知的问题
- 手好多了,但仍然不完全可靠
- 男性生zq
- 远处的面孔、眼睛和牙齿仍然可能存在问题,但很容易修复
- 在非常复杂的繁忙场景中仍然可能会变得古怪,例如一群人打排球,或者一群人演奏乐器
作者: | socalguitarist |
最后更新: | 2023年8月21日 |
文件类型: | CHECKPOINT MERGE |
基本模型: | SDXL 1.0 |
tag标签: | 摄影 真实 真人 动物 自然 风景 猫 鸟 狮 汽车 鞋 |
模型版本: | Beta_0.6.8.1_BakedVAE |
使用介绍
这就是NightVision XL,一个经过轻微训练的基础 SDXL 模型,然后通过社区 LORA 进一步完善,以达到现在的水平。 NightVision XL经过改进和偏向,可生成修饰后的逼真肖像输出,并为社交媒体发布做好风格化! NightVision XL具有良好的一致性,并且避免了一些奇怪的身体问题和偏差,这些问题和偏差开始困扰其他一些真实感模型。此外,NightVision XL可产生丰富的深黑色和出色的傍晚/夜间场景。它还可以产生极其明亮的输出!
NightVision XL能够进行 SFW 和 NSFW 输出。与我的所有其他模型、工具和嵌入一样,NightVision XL易于使用,更喜欢简单的提示,并让模型完成场景构建的繁重工作。
注意 – 此版本包含烘焙的 VAE,无需下载或使用“建议的”外部 VAE。
警告 – 请勿将 SDXL REFINER 与 NIGHTVISION XL 一起使用
SDXL 精炼机不兼容,如果您尝试将基本模型精炼机与NightVision XL一起使用,您的输出质量将会降低。
作品参照
Stable Diffusion提示词
art by Henri Le Sidaner, (art by Shotaro Ishinomori:1.1) , VRay, Kawasaki, Illustration, Hopeful, spotlight, 800mm lens, in the style of girl with the pearl earring, Pixel Art pixelated pixel pixel James Peaslee and by Pixar, extremely content happy smile
Steps: 20, NGMS: 4, Size: 832x1216, Seed: 1668045847, Model: NightVisionXL_Beta_0.6.8.1.fp16, Version: v1.5.1, Sampler: DPM++ 2M SDE Karras, CFG scale: 4.5, Model hash: 2f602b1df5, Hires steps: 20, Hires prompt: ["art by Henri Le Sidaner, Hires upscale: 1.5, Hires upscaler: 8x_NMKD-Superscale_150000_G, Denoising strength: 0.5, (art by Shotaro Ishinomori: 1.1) , VRay, Kawasaki, Illustration, Hopeful, spotlight, 800mm lens, in the style of girl with the pearl earring"]