Spaces:

thankfulcarp
/

Wan_FusionX_with_Loras

Running on Zero

App Files Files Community

thankfulcarp commited on 28 days ago

Commit

94c0532

1 Parent(s): efa664c

Fixed i2v

Browse files

Files changed (1) hide show

app.py +15 -4

app.py CHANGED Viewed

@@ -2,8 +2,8 @@ import spaces
 import torch
 from diffusers import AutoencoderKLWan, WanImageToVideoPipeline, UniPCMultistepScheduler, WanTransformer3DModel, AutoModel, DiffusionPipeline
 from diffusers.utils import export_to_video
-from transformers import CLIPVisionModel, UMT5EncoderModel
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline # noqa
 import tempfile
 import re
 import os
@@ -29,9 +29,17 @@ T2V_LORA_FILENAME = "FusionX_LoRa/Wan2.1_T2V_14B_FusionX_LoRA.safetensors"
 print("🚀 Loading I2V pipeline from single file...")
 i2v_pipe = None
 try:
-    # Load components needed for the pipeline from the base model repo
     i2v_image_encoder = CLIPVisionModel.from_pretrained(I2V_BASE_MODEL_ID, subfolder="image_encoder", torch_dtype=torch.float32)
     i2v_vae = AutoencoderKLWan.from_pretrained(I2V_BASE_MODEL_ID, subfolder="vae", torch_dtype=torch.float32)
     # Load the main transformer from the repo and filename
     i2v_transformer = WanTransformer3DModel.from_single_file(
@@ -42,10 +50,13 @@ try:
     # Manually assemble the pipeline with the custom transformer
     i2v_pipe = WanImageToVideoPipeline(
         vae=i2v_vae,
         image_encoder=i2v_image_encoder,
         transformer=i2v_transformer
     )
-    i2v_pipe.scheduler = UniPCMultistepScheduler.from_config(i2v_pipe.scheduler.config, flow_shift=8.0)
     i2v_pipe.to("cuda")
     print("✅ I2V pipeline loaded successfully from single file.")
 except Exception as e:

 import torch
 from diffusers import AutoencoderKLWan, WanImageToVideoPipeline, UniPCMultistepScheduler, WanTransformer3DModel, AutoModel, DiffusionPipeline
 from diffusers.utils import export_to_video
+from transformers import CLIPVisionModel, UMT5EncoderModel, CLIPTokenizer, CLIPTextModel, CLIPImageProcessor
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import tempfile
 import re
 import os
 print("🚀 Loading I2V pipeline from single file...")
 i2v_pipe = None
 try:
+    # Load ALL components needed for the pipeline from the base model repo
     i2v_image_encoder = CLIPVisionModel.from_pretrained(I2V_BASE_MODEL_ID, subfolder="image_encoder", torch_dtype=torch.float32)
     i2v_vae = AutoencoderKLWan.from_pretrained(I2V_BASE_MODEL_ID, subfolder="vae", torch_dtype=torch.float32)
+    i2v_text_encoder = CLIPTextModel.from_pretrained(I2V_BASE_MODEL_ID, subfolder="text_encoder", torch_dtype=torch.bfloat16)
+    i2v_tokenizer = CLIPTokenizer.from_pretrained(I2V_BASE_MODEL_ID, subfolder="tokenizer")
+    i2v_image_processor = CLIPImageProcessor.from_pretrained(I2V_BASE_MODEL_ID, subfolder="image_processor")
+    # Create scheduler with custom flow_shift
+    scheduler_config = UniPCMultistepScheduler.load_config(I2V_BASE_MODEL_ID, subfolder="scheduler")
+    scheduler_config['flow_shift'] = 8.0
+    i2v_scheduler = UniPCMultistepScheduler.from_config(scheduler_config)
     # Load the main transformer from the repo and filename
     i2v_transformer = WanTransformer3DModel.from_single_file(
     # Manually assemble the pipeline with the custom transformer
     i2v_pipe = WanImageToVideoPipeline(
         vae=i2v_vae,
+        text_encoder=i2v_text_encoder,
+        tokenizer=i2v_tokenizer,
         image_encoder=i2v_image_encoder,
+        image_processor=i2v_image_processor,
+        scheduler=i2v_scheduler,
         transformer=i2v_transformer
     )
     i2v_pipe.to("cuda")
     print("✅ I2V pipeline loaded successfully from single file.")
 except Exception as e: