Spaces:

bytedance-research
/

UNO-FLUX

Running on Zero

App Files Files Community

fenfan commited on Apr 4

Commit

3408cd5

verified ·

1 Parent(s): 0a6db9d

fix: update app.py to fix zero gpu in original style.

Browse files

Files changed (1) hide show

app.py +81 -60

app.py CHANGED Viewed

@@ -11,75 +11,96 @@
 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
 import gradio as gr
 import torch
 import spaces
 from uno.flux.pipeline import UNOPipeline
-model_type = "flux-dev"
-offload = False
-device = "cuda"
-pipeline = UNOPipeline(model_type, device, offload, only_lora=True, lora_rank=512)
-## it seems must use decorator can be trigger zero GPU
-## not work by mannualy decorate by fn = spaces.GPU(duration=120)(fn)
-@spaces.GPU(duration=120)
-def generate_callback(*args, **kwargs):
-    return pipeline.gradio_generate(*args, **kwargs)
-with gr.Blocks() as demo:
-    gr.Markdown(f"# UNO by UNO team")
-    with gr.Row():
-        with gr.Column():
-            prompt = gr.Textbox(label="Prompt", value="handsome woman in the city")
-            with gr.Row():
-                image_prompt1 = gr.Image(label="ref img1", visible=True, interactive=True, type="pil")
-                image_prompt2 = gr.Image(label="ref img2", visible=True, interactive=True, type="pil")
-                image_prompt3 = gr.Image(label="ref img3", visible=True, interactive=True, type="pil")
-                image_prompt4 = gr.Image(label="ref img4", visible=True, interactive=True, type="pil")
-            with gr.Row():
-                with gr.Column():
-                    ref_long_side = gr.Slider(128, 512, 512, step=16, label="Long side of Ref Images")
-                with gr.Column():
-                    gr.Markdown("📌 **The recommended ref scale** is related to the ref img number.\n")
-                    gr.Markdown("   1->512 / 2->320 / 3...n->256")
-            with gr.Row():
-                with gr.Column():
-                    width = gr.Slider(512, 2048, 512, step=16, label="Gneration Width")
-                    height = gr.Slider(512, 2048, 512, step=16, label="Gneration Height")
-                with gr.Column():
-                    gr.Markdown("📌 The model trained on 512x512 resolution.\n")
-                    gr.Markdown(
-                        "The size closer to 512 is more stable,"
-                        " and the higher size gives a better visual effect but is less stable"
-                    )
-            with gr.Accordion("Generation Options", open=False):
-                with gr.Row():
-                    num_steps = gr.Slider(1, 50, 25, step=1, label="Number of steps")
-                    guidance = gr.Slider(1.0, 5.0, 4.0, step=0.1, label="Guidance", interactive=True)
-                    seed = gr.Number(-1, label="Seed (-1 for random)")
-            generate_btn = gr.Button("Generate")
-        with gr.Column():
-            output_image = gr.Image(label="Generated Image")
-            download_btn = gr.File(label="Download full-resolution", type="filepath", interactive=False)
-        inputs = [
-            prompt, width, height, guidance, num_steps,
-            seed, ref_long_side, image_prompt1, image_prompt2, image_prompt3, image_prompt4
-        ]
-        generate_btn.click(
-            fn=generate_callback,
-            inputs=inputs,
-            outputs=[output_image, download_btn],
         )
-demo.launch()

 # WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 # See the License for the specific language governing permissions and
 # limitations under the License.
+import dataclasses
 import gradio as gr
 import torch
 import spaces
 from uno.flux.pipeline import UNOPipeline
+def create_demo(
+    model_type: str,
+    device: str = "cuda" if torch.cuda.is_available() else "cpu",
+    offload: bool = False,
+):
+    pipeline = UNOPipeline(model_type, device, offload, only_lora=True, lora_rank=512)
+    pipeline.gradio_generate = spaces.GPU(duratioin=120)(pipeline.gradio_generate)
+    with gr.Blocks() as demo:
+        gr.Markdown(f"# UNO by UNO team")
+        with gr.Row():
+            with gr.Column():
+                prompt = gr.Textbox(label="Prompt", value="handsome woman in the city")
+                with gr.Row():
+                    image_prompt1 = gr.Image(label="ref img1", visible=True, interactive=True, type="pil")
+                    image_prompt2 = gr.Image(label="ref img2", visible=True, interactive=True, type="pil")
+                    image_prompt3 = gr.Image(label="ref img3", visible=True, interactive=True, type="pil")
+                    image_prompt4 = gr.Image(label="ref img4", visible=True, interactive=True, type="pil")
+                with gr.Row():
+                    with gr.Column():
+                        ref_long_side = gr.Slider(128, 512, 512, step=16, label="Long side of Ref Images")
+                    with gr.Column():
+                        gr.Markdown("📌 **The recommended ref scale** is related to the ref img number.\n")
+                        gr.Markdown("   1->512 / 2->320 / 3...n->256")
+                with gr.Row():
+                    with gr.Column():
+                        width = gr.Slider(512, 2048, 512, step=16, label="Gneration Width")
+                        height = gr.Slider(512, 2048, 512, step=16, label="Gneration Height")
+                    with gr.Column():
+                        gr.Markdown("📌 The model trained on 512x512 resolution.\n")
+                        gr.Markdown(
+                            "The size closer to 512 is more stable,"
+                            " and the higher size gives a better visual effect but is less stable"
+                        )
+                with gr.Accordion("Generation Options", open=False):
+                    with gr.Row():
+                        num_steps = gr.Slider(1, 50, 25, step=1, label="Number of steps")
+                        guidance = gr.Slider(1.0, 5.0, 4.0, step=0.1, label="Guidance", interactive=True)
+                        seed = gr.Number(-1, label="Seed (-1 for random)")
+                generate_btn = gr.Button("Generate")
+            with gr.Column():
+                output_image = gr.Image(label="Generated Image")
+                download_btn = gr.File(label="Download full-resolution", type="filepath", interactive=False)
+            inputs = [
+                prompt, width, height, guidance, num_steps,
+                seed, ref_long_side, image_prompt1, image_prompt2, image_prompt3, image_prompt4
+            ]
+            generate_btn.click(
+                fn=pipeline.gradio_generate,
+                inputs=inputs,
+                outputs=[output_image, download_btn],
+            )
+    return demo
+if __name__ == "__main__":
+    from typing import Literal
+    from transformers import HfArgumentParser
+    @dataclasses.dataclass
+    class AppArgs:
+        name: Literal["flux-dev", "flux-dev-fp8", "flux-schnell"] = "flux-dev"
+        device: Literal["cuda", "cpu"] = "cuda" if torch.cuda.is_available() else "cpu"
+        offload: bool = dataclasses.field(
+            default=False,
+            metadata={"help": "If True, sequantial offload the models(ae, dit, text encoder) to CPU if not used."}
         )
+        port: int = 7860
+    parser = HfArgumentParser([AppArgs])
+    args_tuple = parser.parse_args_into_dataclasses() # type: tuple[AppArgs]
+    args = args_tuple[0]
+    demo = create_demo(args.name, args.device, args.offload)
+    demo.launch(server_port=args.port)