BSC-LT
/

salamandra-2b-instruct-gptq

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/home/jsainz/PycharmProjects/ibm-quantized-models/salamandra-2b-instruct-gptq-grp64",
   "architectures": [
     "LlamaForCausalLM"
   ],
@@ -18,13 +18,14 @@
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "num_key_value_heads": 16,
-  "num_layers": 24,
   "pretraining_tp": 1,
   "quantization_config": {
     "batch_size": 1,
     "bits": 4,
     "block_name_to_quantize": null,
     "cache_block_outputs": true,
     "damp_percent": 0.1,
     "dataset": null,
     "desc_act": false,
@@ -33,6 +34,7 @@
     },
     "group_size": 64,
     "max_input_length": null,
     "model_seqlen": null,
     "module_name_preceding_first_block": null,
     "modules_in_block_to_quantize": null,
@@ -49,7 +51,7 @@
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
-  "transformers_version": "4.46.2",
   "use_cache": true,
   "vocab_size": 256000
 }

 {
+  "_name_or_path": "/gpfs/projects/bsc88/text/models/salamandra_quantized_speculative/V1.1/salamandra-2b-instruct-gptq",
   "architectures": [
     "LlamaForCausalLM"
   ],
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "num_key_value_heads": 16,
   "pretraining_tp": 1,
   "quantization_config": {
+    "backend": null,
     "batch_size": 1,
     "bits": 4,
     "block_name_to_quantize": null,
     "cache_block_outputs": true,
+    "checkpoint_format": "gptq",
     "damp_percent": 0.1,
     "dataset": null,
     "desc_act": false,
     },
     "group_size": 64,
     "max_input_length": null,
+    "meta": null,
     "model_seqlen": null,
     "module_name_preceding_first_block": null,
     "modules_in_block_to_quantize": null,
   "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
+  "transformers_version": "4.49.0",
   "use_cache": true,
   "vocab_size": 256000
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
-  "transformers_version": "4.46.2"
 }

   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "transformers_version": "4.49.0"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:99c95a632c806d16daee0d5fceaed550c1f12befda2ca812a7927c041ad07852
 size 2748604656

 version https://git-lfs.github.com/spec/v1
+oid sha256:3b8c2e21d5c72bbd141a08b5e4813d6febcb4ff71e29762b1f7b2651d01f4d56
 size 2748604656

tokenizer_config.json CHANGED Viewed

@@ -1092,6 +1092,7 @@
   "chat_template": "{%- if not date_string is defined %}{%- set date_string = \"2024-09-30\" %}{%- endif %}{%- set system_message = messages[0].content if messages[0].role == \"system\" else \"I am Salamandra, an AI language model developed at the Barcelona Supercomputing Centre (BSC) by the Language Technologies Unit. My knowledge base was last updated on August 2023. Today Date: \"+ date_string +\"\nSoy Salamandra, un modelo lingüístico de IA desarrollado en el Barcelona Supercomputing Centre (BSC) por la Language Technologies Unit. Mi base de conocimientos se actualizó por última vez en agosto de 2023.\nSoc Salamandra, un model de llenguatge d'IA desenvolupat al Barcelona Supercomputing Centre (BSC) per la Language Technologies Unit. La meva base de coneixement es va actualitzar per última vegada l'agost de 2023.\" -%}{%- if messages[0].role == \"system\" -%}{%- set messages = messages[1:] -%}{%- endif -%}{{ \"<|im_start|>system\n\" + system_message + \"<|im_end|>\n\" }}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
   "legacy": true,
   "model_max_length": 8192,
   "pad_token": "<unk>",

   "chat_template": "{%- if not date_string is defined %}{%- set date_string = \"2024-09-30\" %}{%- endif %}{%- set system_message = messages[0].content if messages[0].role == \"system\" else \"I am Salamandra, an AI language model developed at the Barcelona Supercomputing Centre (BSC) by the Language Technologies Unit. My knowledge base was last updated on August 2023. Today Date: \"+ date_string +\"\nSoy Salamandra, un modelo lingüístico de IA desarrollado en el Barcelona Supercomputing Centre (BSC) por la Language Technologies Unit. Mi base de conocimientos se actualizó por última vez en agosto de 2023.\nSoc Salamandra, un model de llenguatge d'IA desenvolupat al Barcelona Supercomputing Centre (BSC) per la Language Technologies Unit. La meva base de coneixement es va actualitzar per última vegada l'agost de 2023.\" -%}{%- if messages[0].role == \"system\" -%}{%- set messages = messages[1:] -%}{%- endif -%}{{ \"<|im_start|>system\n\" + system_message + \"<|im_end|>\n\" }}{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}{% if add_generation_prompt %}{{ '<|im_start|>assistant\n' }}{% endif %}",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
+  "extra_special_tokens": {},
   "legacy": true,
   "model_max_length": 8192,
   "pad_token": "<unk>",