Upload GptOssForCausalLM quantized wheights for compatibility with vLLM

by ArthurZ HF Staff - opened 4 days ago

base: refs/heads/main

←

from: refs/pr/5

Discussion Files changed

+472

-442

Upload GptOssForCausalLMde861b77

ArthurZ

4 days ago

•

edited 4 days ago

import torch
from transformers import Mxfp4Config, GptOssForCausalLM, AutoTokenizer
model_name = "jxm/gpt-oss-20b-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = GptOssForCausalLM.from_pretrained(
    model_name,
    revision="refs/pr/5",
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
print(tokenizer.batch_decode(model.generate(**tokenizer("Once upon a time", return_tensors="pt").to(model.device))))

gave:

['Once upon a time, there was a young student named Lian. He was always a happy and enthusiastic individual, but']

ArthurZ changed pull request title from Upload GptOssForCausalLM to Upload GptOssForCausalLM quantized wheights for compatibility with vLLM 4 days ago

Delete model-00001-of-00009.safetensorsec3d7e51

Delete model-00002-of-00009.safetensorsae41e43a

Delete model-00003-of-00009.safetensors9fd7e3d6

Delete model-00004-of-00009.safetensors08111342

Delete model-00005-of-00009.safetensors698a9be5

Delete model-00006-of-00009.safetensors7e3d8d92

Delete model-00007-of-00009.safetensorsae7a964b

Delete model-00008-of-00009.safetensorsc8fe4bb9

Delete model-00009-of-00009.safetensorsc02dbc42

jxm

Owner 4 days ago

Thank you so much

jxm changed pull request status to merged 4 days ago

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment