Spaces:

Ahmadzei
/

RAG

Runtime error

added 3 more tables for large emb model

5fa1a76 over 1 year ago

341 Bytes

	py
	import torch
	from transformers import AutoModelForCausalLM, GPTQConfig
	gptq_config = GPTQConfig(bits=4, use_exllama=False)
	model = AutoModelForCausalLM.from_pretrained("{your_username}/opt-125m-gptq", device_map="cpu", quantization_config=gptq_config)
	bitsandbytes
	bitsandbytes is the easiest option for quantizing a model to 8 and 4-bit.