Kimi-VL-A3B

Running on Zero

Haoyu Lu commited on 15 days ago

Commit

9ab6f3e

1 Parent(s): 1d2ac98

Feats: Update inference

Files changed (2) hide show

kimi_vl/serve/inference.py CHANGED Viewed

@@ -4,7 +4,7 @@ from threading import Thread
 from typing import List, Optional
 import torch
-import space
 from transformers import (
     AutoModelForCausalLM,
     AutoProcessor,
@@ -154,7 +154,7 @@ def preprocess(
 @torch.inference_mode()
-@space.GPU
 def kimi_vl_generate(
     model: torch.nn.Module,
     processor: AutoProcessor,

 from typing import List, Optional
 import torch
+import spaces
 from transformers import (
     AutoModelForCausalLM,
     AutoProcessor,
 @torch.inference_mode()
+@spaces.GPU
 def kimi_vl_generate(
     model: torch.nn.Module,
     processor: AutoProcessor,

requirements.txt CHANGED Viewed

@@ -6,6 +6,7 @@ attrdict
 einops
 tiktoken
 blobfile
 https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.4.post1/flash_attn-2.7.4.post1+cu12torch2.5cxx11abiFALSE-cp310-cp310-linux_x86_64.whl
 # for gradio demo

 einops
 tiktoken
 blobfile
+spaces
 https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.4.post1/flash_attn-2.7.4.post1+cu12torch2.5cxx11abiFALSE-cp310-cp310-linux_x86_64.whl
 # for gradio demo