Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

config.json +2 -285
model-00001-of-00009.safetensors +3 -0
model-00002-of-00009.safetensors +3 -0
model-00003-of-00009.safetensors +3 -0
model-00004-of-00009.safetensors +3 -0
model-00005-of-00009.safetensors +3 -0
model-00006-of-00009.safetensors +3 -0
model-00007-of-00009.safetensors +3 -0
model-00008-of-00009.safetensors +3 -0
model-00009-of-00009.safetensors +3 -0
model.safetensors.index.json +0 -0

config.json CHANGED Viewed

@@ -1,293 +1,10 @@
 {
-  "_name_or_path": "/mnt/asabet/llama-recipes/finetuned_model/fine-tuned-meta-llama/Llama-3.2-11B-Vision-Instruct/hf-weights",
   "architectures": [
     "MllamaForConditionalGeneration"
   ],
   "image_token_index": 128256,
   "model_type": "mllama",
-  "quantization_config": {
-    "config_groups": {
-      "group_0": {
-        "input_activations": {
-          "actorder": null,
-          "block_structure": null,
-          "dynamic": true,
-          "group_size": null,
-          "num_bits": 8,
-          "observer": null,
-          "observer_kwargs": {},
-          "strategy": "token",
-          "symmetric": true,
-          "type": "int"
-        },
-        "output_activations": null,
-        "targets": [
-          "Linear"
-        ],
-        "weights": {
-          "actorder": null,
-          "block_structure": null,
-          "dynamic": false,
-          "group_size": null,
-          "num_bits": 8,
-          "observer": "minmax",
-          "observer_kwargs": {},
-          "strategy": "channel",
-          "symmetric": true,
-          "type": "int"
-        }
-      }
-    },
-    "format": "int-quantized",
-    "global_compression_ratio": 1.3639314687910544,
-    "ignore": [
-      "vision_model.transformer.layers.0.self_attn.q_proj",
-      "vision_model.transformer.layers.0.self_attn.k_proj",
-      "vision_model.transformer.layers.0.self_attn.v_proj",
-      "vision_model.transformer.layers.0.self_attn.o_proj",
-      "vision_model.transformer.layers.0.mlp.fc1",
-      "vision_model.transformer.layers.0.mlp.fc2",
-      "vision_model.transformer.layers.1.self_attn.q_proj",
-      "vision_model.transformer.layers.1.self_attn.k_proj",
-      "vision_model.transformer.layers.1.self_attn.v_proj",
-      "vision_model.transformer.layers.1.self_attn.o_proj",
-      "vision_model.transformer.layers.1.mlp.fc1",
-      "vision_model.transformer.layers.1.mlp.fc2",
-      "vision_model.transformer.layers.2.self_attn.q_proj",
-      "vision_model.transformer.layers.2.self_attn.k_proj",
-      "vision_model.transformer.layers.2.self_attn.v_proj",
-      "vision_model.transformer.layers.2.self_attn.o_proj",
-      "vision_model.transformer.layers.2.mlp.fc1",
-      "vision_model.transformer.layers.2.mlp.fc2",
-      "vision_model.transformer.layers.3.self_attn.q_proj",
-      "vision_model.transformer.layers.3.self_attn.k_proj",
-      "vision_model.transformer.layers.3.self_attn.v_proj",
-      "vision_model.transformer.layers.3.self_attn.o_proj",
-      "vision_model.transformer.layers.3.mlp.fc1",
-      "vision_model.transformer.layers.3.mlp.fc2",
-      "vision_model.transformer.layers.4.self_attn.q_proj",
-      "vision_model.transformer.layers.4.self_attn.k_proj",
-      "vision_model.transformer.layers.4.self_attn.v_proj",
-      "vision_model.transformer.layers.4.self_attn.o_proj",
-      "vision_model.transformer.layers.4.mlp.fc1",
-      "vision_model.transformer.layers.4.mlp.fc2",
-      "vision_model.transformer.layers.5.self_attn.q_proj",
-      "vision_model.transformer.layers.5.self_attn.k_proj",
-      "vision_model.transformer.layers.5.self_attn.v_proj",
-      "vision_model.transformer.layers.5.self_attn.o_proj",
-      "vision_model.transformer.layers.5.mlp.fc1",
-      "vision_model.transformer.layers.5.mlp.fc2",
-      "vision_model.transformer.layers.6.self_attn.q_proj",
-      "vision_model.transformer.layers.6.self_attn.k_proj",
-      "vision_model.transformer.layers.6.self_attn.v_proj",
-      "vision_model.transformer.layers.6.self_attn.o_proj",
-      "vision_model.transformer.layers.6.mlp.fc1",
-      "vision_model.transformer.layers.6.mlp.fc2",
-      "vision_model.transformer.layers.7.self_attn.q_proj",
-      "vision_model.transformer.layers.7.self_attn.k_proj",
-      "vision_model.transformer.layers.7.self_attn.v_proj",
-      "vision_model.transformer.layers.7.self_attn.o_proj",
-      "vision_model.transformer.layers.7.mlp.fc1",
-      "vision_model.transformer.layers.7.mlp.fc2",
-      "vision_model.transformer.layers.8.self_attn.q_proj",
-      "vision_model.transformer.layers.8.self_attn.k_proj",
-      "vision_model.transformer.layers.8.self_attn.v_proj",
-      "vision_model.transformer.layers.8.self_attn.o_proj",
-      "vision_model.transformer.layers.8.mlp.fc1",
-      "vision_model.transformer.layers.8.mlp.fc2",
-      "vision_model.transformer.layers.9.self_attn.q_proj",
-      "vision_model.transformer.layers.9.self_attn.k_proj",
-      "vision_model.transformer.layers.9.self_attn.v_proj",
-      "vision_model.transformer.layers.9.self_attn.o_proj",
-      "vision_model.transformer.layers.9.mlp.fc1",
-      "vision_model.transformer.layers.9.mlp.fc2",
-      "vision_model.transformer.layers.10.self_attn.q_proj",
-      "vision_model.transformer.layers.10.self_attn.k_proj",
-      "vision_model.transformer.layers.10.self_attn.v_proj",
-      "vision_model.transformer.layers.10.self_attn.o_proj",
-      "vision_model.transformer.layers.10.mlp.fc1",
-      "vision_model.transformer.layers.10.mlp.fc2",
-      "vision_model.transformer.layers.11.self_attn.q_proj",
-      "vision_model.transformer.layers.11.self_attn.k_proj",
-      "vision_model.transformer.layers.11.self_attn.v_proj",
-      "vision_model.transformer.layers.11.self_attn.o_proj",
-      "vision_model.transformer.layers.11.mlp.fc1",
-      "vision_model.transformer.layers.11.mlp.fc2",
-      "vision_model.transformer.layers.12.self_attn.q_proj",
-      "vision_model.transformer.layers.12.self_attn.k_proj",
-      "vision_model.transformer.layers.12.self_attn.v_proj",
-      "vision_model.transformer.layers.12.self_attn.o_proj",
-      "vision_model.transformer.layers.12.mlp.fc1",
-      "vision_model.transformer.layers.12.mlp.fc2",
-      "vision_model.transformer.layers.13.self_attn.q_proj",
-      "vision_model.transformer.layers.13.self_attn.k_proj",
-      "vision_model.transformer.layers.13.self_attn.v_proj",
-      "vision_model.transformer.layers.13.self_attn.o_proj",
-      "vision_model.transformer.layers.13.mlp.fc1",
-      "vision_model.transformer.layers.13.mlp.fc2",
-      "vision_model.transformer.layers.14.self_attn.q_proj",
-      "vision_model.transformer.layers.14.self_attn.k_proj",
-      "vision_model.transformer.layers.14.self_attn.v_proj",
-      "vision_model.transformer.layers.14.self_attn.o_proj",
-      "vision_model.transformer.layers.14.mlp.fc1",
-      "vision_model.transformer.layers.14.mlp.fc2",
-      "vision_model.transformer.layers.15.self_attn.q_proj",
-      "vision_model.transformer.layers.15.self_attn.k_proj",
-      "vision_model.transformer.layers.15.self_attn.v_proj",
-      "vision_model.transformer.layers.15.self_attn.o_proj",
-      "vision_model.transformer.layers.15.mlp.fc1",
-      "vision_model.transformer.layers.15.mlp.fc2",
-      "vision_model.transformer.layers.16.self_attn.q_proj",
-      "vision_model.transformer.layers.16.self_attn.k_proj",
-      "vision_model.transformer.layers.16.self_attn.v_proj",
-      "vision_model.transformer.layers.16.self_attn.o_proj",
-      "vision_model.transformer.layers.16.mlp.fc1",
-      "vision_model.transformer.layers.16.mlp.fc2",
-      "vision_model.transformer.layers.17.self_attn.q_proj",
-      "vision_model.transformer.layers.17.self_attn.k_proj",
-      "vision_model.transformer.layers.17.self_attn.v_proj",
-      "vision_model.transformer.layers.17.self_attn.o_proj",
-      "vision_model.transformer.layers.17.mlp.fc1",
-      "vision_model.transformer.layers.17.mlp.fc2",
-      "vision_model.transformer.layers.18.self_attn.q_proj",
-      "vision_model.transformer.layers.18.self_attn.k_proj",
-      "vision_model.transformer.layers.18.self_attn.v_proj",
-      "vision_model.transformer.layers.18.self_attn.o_proj",
-      "vision_model.transformer.layers.18.mlp.fc1",
-      "vision_model.transformer.layers.18.mlp.fc2",
-      "vision_model.transformer.layers.19.self_attn.q_proj",
-      "vision_model.transformer.layers.19.self_attn.k_proj",
-      "vision_model.transformer.layers.19.self_attn.v_proj",
-      "vision_model.transformer.layers.19.self_attn.o_proj",
-      "vision_model.transformer.layers.19.mlp.fc1",
-      "vision_model.transformer.layers.19.mlp.fc2",
-      "vision_model.transformer.layers.20.self_attn.q_proj",
-      "vision_model.transformer.layers.20.self_attn.k_proj",
-      "vision_model.transformer.layers.20.self_attn.v_proj",
-      "vision_model.transformer.layers.20.self_attn.o_proj",
-      "vision_model.transformer.layers.20.mlp.fc1",
-      "vision_model.transformer.layers.20.mlp.fc2",
-      "vision_model.transformer.layers.21.self_attn.q_proj",
-      "vision_model.transformer.layers.21.self_attn.k_proj",
-      "vision_model.transformer.layers.21.self_attn.v_proj",
-      "vision_model.transformer.layers.21.self_attn.o_proj",
-      "vision_model.transformer.layers.21.mlp.fc1",
-      "vision_model.transformer.layers.21.mlp.fc2",
-      "vision_model.transformer.layers.22.self_attn.q_proj",
-      "vision_model.transformer.layers.22.self_attn.k_proj",
-      "vision_model.transformer.layers.22.self_attn.v_proj",
-      "vision_model.transformer.layers.22.self_attn.o_proj",
-      "vision_model.transformer.layers.22.mlp.fc1",
-      "vision_model.transformer.layers.22.mlp.fc2",
-      "vision_model.transformer.layers.23.self_attn.q_proj",
-      "vision_model.transformer.layers.23.self_attn.k_proj",
-      "vision_model.transformer.layers.23.self_attn.v_proj",
-      "vision_model.transformer.layers.23.self_attn.o_proj",
-      "vision_model.transformer.layers.23.mlp.fc1",
-      "vision_model.transformer.layers.23.mlp.fc2",
-      "vision_model.transformer.layers.24.self_attn.q_proj",
-      "vision_model.transformer.layers.24.self_attn.k_proj",
-      "vision_model.transformer.layers.24.self_attn.v_proj",
-      "vision_model.transformer.layers.24.self_attn.o_proj",
-      "vision_model.transformer.layers.24.mlp.fc1",
-      "vision_model.transformer.layers.24.mlp.fc2",
-      "vision_model.transformer.layers.25.self_attn.q_proj",
-      "vision_model.transformer.layers.25.self_attn.k_proj",
-      "vision_model.transformer.layers.25.self_attn.v_proj",
-      "vision_model.transformer.layers.25.self_attn.o_proj",
-      "vision_model.transformer.layers.25.mlp.fc1",
-      "vision_model.transformer.layers.25.mlp.fc2",
-      "vision_model.transformer.layers.26.self_attn.q_proj",
-      "vision_model.transformer.layers.26.self_attn.k_proj",
-      "vision_model.transformer.layers.26.self_attn.v_proj",
-      "vision_model.transformer.layers.26.self_attn.o_proj",
-      "vision_model.transformer.layers.26.mlp.fc1",
-      "vision_model.transformer.layers.26.mlp.fc2",
-      "vision_model.transformer.layers.27.self_attn.q_proj",
-      "vision_model.transformer.layers.27.self_attn.k_proj",
-      "vision_model.transformer.layers.27.self_attn.v_proj",
-      "vision_model.transformer.layers.27.self_attn.o_proj",
-      "vision_model.transformer.layers.27.mlp.fc1",
-      "vision_model.transformer.layers.27.mlp.fc2",
-      "vision_model.transformer.layers.28.self_attn.q_proj",
-      "vision_model.transformer.layers.28.self_attn.k_proj",
-      "vision_model.transformer.layers.28.self_attn.v_proj",
-      "vision_model.transformer.layers.28.self_attn.o_proj",
-      "vision_model.transformer.layers.28.mlp.fc1",
-      "vision_model.transformer.layers.28.mlp.fc2",
-      "vision_model.transformer.layers.29.self_attn.q_proj",
-      "vision_model.transformer.layers.29.self_attn.k_proj",
-      "vision_model.transformer.layers.29.self_attn.v_proj",
-      "vision_model.transformer.layers.29.self_attn.o_proj",
-      "vision_model.transformer.layers.29.mlp.fc1",
-      "vision_model.transformer.layers.29.mlp.fc2",
-      "vision_model.transformer.layers.30.self_attn.q_proj",
-      "vision_model.transformer.layers.30.self_attn.k_proj",
-      "vision_model.transformer.layers.30.self_attn.v_proj",
-      "vision_model.transformer.layers.30.self_attn.o_proj",
-      "vision_model.transformer.layers.30.mlp.fc1",
-      "vision_model.transformer.layers.30.mlp.fc2",
-      "vision_model.transformer.layers.31.self_attn.q_proj",
-      "vision_model.transformer.layers.31.self_attn.k_proj",
-      "vision_model.transformer.layers.31.self_attn.v_proj",
-      "vision_model.transformer.layers.31.self_attn.o_proj",
-      "vision_model.transformer.layers.31.mlp.fc1",
-      "vision_model.transformer.layers.31.mlp.fc2",
-      "vision_model.global_transformer.layers.0.self_attn.q_proj",
-      "vision_model.global_transformer.layers.0.self_attn.k_proj",
-      "vision_model.global_transformer.layers.0.self_attn.v_proj",
-      "vision_model.global_transformer.layers.0.self_attn.o_proj",
-      "vision_model.global_transformer.layers.0.mlp.fc1",
-      "vision_model.global_transformer.layers.0.mlp.fc2",
-      "vision_model.global_transformer.layers.1.self_attn.q_proj",
-      "vision_model.global_transformer.layers.1.self_attn.k_proj",
-      "vision_model.global_transformer.layers.1.self_attn.v_proj",
-      "vision_model.global_transformer.layers.1.self_attn.o_proj",
-      "vision_model.global_transformer.layers.1.mlp.fc1",
-      "vision_model.global_transformer.layers.1.mlp.fc2",
-      "vision_model.global_transformer.layers.2.self_attn.q_proj",
-      "vision_model.global_transformer.layers.2.self_attn.k_proj",
-      "vision_model.global_transformer.layers.2.self_attn.v_proj",
-      "vision_model.global_transformer.layers.2.self_attn.o_proj",
-      "vision_model.global_transformer.layers.2.mlp.fc1",
-      "vision_model.global_transformer.layers.2.mlp.fc2",
-      "vision_model.global_transformer.layers.3.self_attn.q_proj",
-      "vision_model.global_transformer.layers.3.self_attn.k_proj",
-      "vision_model.global_transformer.layers.3.self_attn.v_proj",
-      "vision_model.global_transformer.layers.3.self_attn.o_proj",
-      "vision_model.global_transformer.layers.3.mlp.fc1",
-      "vision_model.global_transformer.layers.3.mlp.fc2",
-      "vision_model.global_transformer.layers.4.self_attn.q_proj",
-      "vision_model.global_transformer.layers.4.self_attn.k_proj",
-      "vision_model.global_transformer.layers.4.self_attn.v_proj",
-      "vision_model.global_transformer.layers.4.self_attn.o_proj",
-      "vision_model.global_transformer.layers.4.mlp.fc1",
-      "vision_model.global_transformer.layers.4.mlp.fc2",
-      "vision_model.global_transformer.layers.5.self_attn.q_proj",
-      "vision_model.global_transformer.layers.5.self_attn.k_proj",
-      "vision_model.global_transformer.layers.5.self_attn.v_proj",
-      "vision_model.global_transformer.layers.5.self_attn.o_proj",
-      "vision_model.global_transformer.layers.5.mlp.fc1",
-      "vision_model.global_transformer.layers.5.mlp.fc2",
-      "vision_model.global_transformer.layers.6.self_attn.q_proj",
-      "vision_model.global_transformer.layers.6.self_attn.k_proj",
-      "vision_model.global_transformer.layers.6.self_attn.v_proj",
-      "vision_model.global_transformer.layers.6.self_attn.o_proj",
-      "vision_model.global_transformer.layers.6.mlp.fc1",
-      "vision_model.global_transformer.layers.6.mlp.fc2",
-      "vision_model.global_transformer.layers.7.self_attn.q_proj",
-      "vision_model.global_transformer.layers.7.self_attn.k_proj",
-      "vision_model.global_transformer.layers.7.self_attn.v_proj",
-      "vision_model.global_transformer.layers.7.self_attn.o_proj",
-      "vision_model.global_transformer.layers.7.mlp.fc1",
-      "vision_model.global_transformer.layers.7.mlp.fc2",
-      "language_model.lm_head",
-      "multi_modal_projector"
-    ],
-    "kv_cache_scheme": null,
-    "quant_method": "compressed-tensors",
-    "quantization_status": "compressed"
-  },
   "text_config": {
     "_name_or_path": "",
     "add_cross_attention": false,
@@ -504,4 +221,4 @@
     "use_bfloat16": false,
     "vision_output_dim": 7680
   }
-}

 {
+  "_name_or_path": "meta-llama/Llama-3.2-11B-Vision-Instruct",
   "architectures": [
     "MllamaForConditionalGeneration"
   ],
   "image_token_index": 128256,
   "model_type": "mllama",
   "text_config": {
     "_name_or_path": "",
     "add_cross_attention": false,
     "use_bfloat16": false,
     "vision_output_dim": 7680
   }
+}

model-00001-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:52afbb29bfe008fa22a7d707eb4167ac76b872054de14a664f20b0f755b66368
+size 3454336036

model-00002-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c824e075243363e5ccaf8af15c90a939f9f07c3bd3649d0b29ef326160c45db
+size 4886615752

model-00003-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b8a3acb48223e6d7466c318db5fdcac09f8c94144fc02574f6ba48e502e3d04
+size 4832009696

model-00004-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d62ae738a977fc5294c5a36d731a08d1c0270bc0aeee49ccfff92c2cf8400022
+size 4999798928

model-00005-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eecf2fc2fd34ed9f9ddb7c61750691eb294d83000a031e89c093ddbabaaf01cc
+size 4999815448

model-00006-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:76507f859b0f34afc37471cd706d46f2af915c5d92dc92a4cf3c374292483b19
+size 4832009736

model-00007-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b45ea0558d1a8cb6df9c32e8368c95f5e063f13d547c7493ab0fe1541c8ae47
+size 4999815448

model-00008-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03352956bb59ec1bd19dd02794af121262427f6257285d736e97029055962df1
+size 4999815448

model-00009-of-00009.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f2a33560433b818a6ef8af701a181f850a0828bb4bc65670df5a40447a229fc
+size 4676785016

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff