Spaces:

thankfulcarp
/

Wan_FusionX_with_Loras

Running on Zero

App Files Files Community

thankfulcarp commited on 24 days ago

Commit

b6b20fb

1 Parent(s): afd898a

fps fix and frame fix

Browse files

Files changed (2) hide show

app.py +7 -8
requirements.txt +1 -0

app.py CHANGED Viewed

@@ -20,11 +20,6 @@ I2V_BASE_MODEL_ID = "Wan-AI/Wan2.1-I2V-14B-480P-Diffusers" # Used for VAE/encode
 I2V_FUSIONX_REPO_ID = "vrgamedevgirl84/Wan14BT2VFusioniX"
 I2V_FUSIONX_FILENAME = "Wan14Bi2vFusioniX.safetensors"
-# --- T2V (Text-to-Video) Configuration ---
-T2V_BASE_MODEL_ID = "Wan-AI/Wan2.1-T2V-14B-Diffusers"
-T2V_LORA_REPO_ID = "vrgamedevgirl84/Wan14BT2VFusioniX"
-T2V_LORA_FILENAME = "FusionX_LoRa/Wan2.1_T2V_14B_FusionX_LoRA.safetensors"
 # --- Load Pipelines ---
 print("🚀 Loading I2V pipeline from single file...")
 i2v_pipe = None
@@ -43,7 +38,7 @@ try:
     # Load the main transformer from the repo and filename
     i2v_transformer = WanTransformer3DModel.from_single_file(
-        "https://huggingface.co/vrgamedevgirl84/Wan14BT2VFusioniX/blob/main/Wan14Bi2vFusioniX_fp16.safetensors",
         torch_dtype=torch.bfloat16
     )
@@ -74,7 +69,7 @@ SLIDER_MIN_H, SLIDER_MAX_H = 128, 1024
 SLIDER_MIN_W, SLIDER_MAX_W = 128, 1024
 MAX_SEED = np.iinfo(np.int32).max
-FIXED_FPS = 24
 T2V_FIXED_FPS = 16
 MIN_FRAMES_MODEL = 8
 MAX_FRAMES_MODEL = 81
@@ -149,7 +144,11 @@ def generate_i2v_video(input_image, prompt, height, width,
     target_h = max(MOD_VALUE, (int(height) // MOD_VALUE) * MOD_VALUE)
     target_w = max(MOD_VALUE, (int(width) // MOD_VALUE) * MOD_VALUE)
-    num_frames = np.clip(int(round(duration_seconds * FIXED_FPS)), MIN_FRAMES_MODEL, MAX_FRAMES_MODEL)
     current_seed = random.randint(0, MAX_SEED) if randomize_seed else int(seed)
     resized_image = input_image.resize((target_w, target_h))
     enhanced_prompt = f"{prompt}, cinematic quality, smooth motion, detailed animation, dynamic lighting"

 I2V_FUSIONX_REPO_ID = "vrgamedevgirl84/Wan14BT2VFusioniX"
 I2V_FUSIONX_FILENAME = "Wan14Bi2vFusioniX.safetensors"
 # --- Load Pipelines ---
 print("🚀 Loading I2V pipeline from single file...")
 i2v_pipe = None
     # Load the main transformer from the repo and filename
     i2v_transformer = WanTransformer3DModel.from_single_file(
+        "https://huggingface.co/vrgamedevgirl84/Wan14BT2VFusioniX/blob/main/Wan14Bi2vFusioniX.safetensors",
         torch_dtype=torch.bfloat16
     )
 SLIDER_MIN_W, SLIDER_MAX_W = 128, 1024
 MAX_SEED = np.iinfo(np.int32).max
+FIXED_FPS = 16
 T2V_FIXED_FPS = 16
 MIN_FRAMES_MODEL = 8
 MAX_FRAMES_MODEL = 81
     target_h = max(MOD_VALUE, (int(height) // MOD_VALUE) * MOD_VALUE)
     target_w = max(MOD_VALUE, (int(width) // MOD_VALUE) * MOD_VALUE)
+    # Calculate and adjust num_frames to be compatible with video codecs
+    target_frames = int(round(duration_seconds * FIXED_FPS))
+    adjusted_frames = 4 * round((target_frames - 1) / 4) + 1
+    num_frames = int(np.clip(adjusted_frames, MIN_FRAMES_MODEL, MAX_FRAMES_MODEL))
     current_seed = random.randint(0, MAX_SEED) if randomize_seed else int(seed)
     resized_image = input_image.resize((target_w, target_h))
     enhanced_prompt = f"{prompt}, cinematic quality, smooth motion, detailed animation, dynamic lighting"

requirements.txt CHANGED Viewed

@@ -5,5 +5,6 @@ safetensors
 sentencepiece
 peft
 ftfy
 imageio-ffmpeg
 opencv-python

 sentencepiece
 peft
 ftfy
+imageio
 imageio-ffmpeg
 opencv-python