RedHatAI
/

Mistral-Small-3.1-24B-Instruct-2503-quantized.w4a16

Image-Text-to-Text

compressed-tensors

Model card Files Files and versions Community

Mistral-Small-3.1-24B-Instruct-2503-quantized.w4a16 / recipe.yaml

alexmarques's picture

Upload folder using huggingface_hub

a98a66a verified 15 days ago

history blame contribute delete

423 Bytes

	quant_stage:
	quant_modifiers:
	GPTQModifier:
	ignore: [language_model.lm_head, 're:vision_tower.', 're:multi_modal_projector.']
	sequential_targets: [MistralDecoderLayer]
	dampening_frac: 0.01
	config_groups:
	group0:
	targets: [Linear]
	weights: {num_bits: 4, type: int, strategy: group, group_size: 128, symmetric: true,
	actorder: weight, observer: minmax}