Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

trl-lib/Capybara

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

36

Full-text search

Active filters: trl-lib/Capybara

lewtun/Llama-3.1-8B-SFT-LoRA-packing

Updated Sep 30, 2024

lewtun/Llama-3.1-8B-SFT-LoRA-no-packing

Updated Sep 30, 2024

lewtun/Llama-3.1-8B-SFT-full-packing

Text Generation • 8B • Updated Sep 30, 2024 • 11

lewtun/Llama-3.1-8B-SFT-LoRA-packing-pad-token-eos

Updated Sep 30, 2024

lewtun/Llama-3.1-8B-SFT-LoRA-packing-no-saved-modules

Updated Sep 30, 2024

lewtun/Llama-3.1-8B-SFT-QLoRA-packing

Updated Sep 30, 2024

lewtun/Llama-3.1-8B-SFT-LoRA-packing-no-lm-head

Updated Sep 30, 2024

qgallouedec/Qwen2-0.5B-Instruct-SFT-Capybara

Text Generation • 0.5B • Updated Oct 2, 2024 • 8

Audreygyj/Qwen2.5-0.5B-SFT

Updated Dec 10, 2024

XueyingJia/Qwen2.5-1.5B-SFT

Updated Dec 10, 2024

Audreygyj/Qwen2.5-7B-SFT

Updated Dec 10, 2024

summerstay/models-moved

Text Generation • 0.5B • Updated Jan 14 • 12 •

kashif/Gemma2-2B-SFT

Text Generation • 3B • Updated Jan 20 • 4

mehmetkeremturkcan/SmollerLM-63M-Instruct-ft

0.0B • Updated Jan 28 • 4

mehmetkeremturkcan/Quant-SFT2

Text Generation • 0.0B • Updated Jan 28 • 5

JohnConnor123/pythia-70m-SFT

XiangyuWen/Qwen2-0.5B-SFT

Updated 25 days ago

flyingbugs/OpenR1-Qwen-1.5B-SFT-utility

Text Generation • 2B • Updated Mar 3 • 5

nishitha256/Qwen2-0.5B-SFT

diao-92/Qwen2-0.5B-SFT

Text Generation • 0.5B • Updated Mar 5 • 6

diao-92/Qwen2-0.5B-SFT-2

Text Generation • 0.5B • Updated Mar 6 • 5

burtenshaw/gemma-3-4b-it-capybara-test

Image-Text-to-Text • 4B • Updated Mar 16 • 7

gpucce/Qwen2-0.5B-SFT

lewtun/Llama-3.2-1B-SFT-Capybara-No-Packing-ChatML

Text Generation • 1B • Updated Apr 15 • 7

lewtun/Qwen2.5-1.5B-SFT-Capybara-No-Packing

Text Generation • 2B • Updated Apr 15 • 8

lewtun/Llama-3.2-1B-SFT-Capybara-No-Packing-Llama

Text Generation • 1B • Updated Apr 16 • 9

lewtun/does-deepspeed-still-work-sft

Text Generation • 2B • Updated Apr 16 • 8

Novaciano/Llama-3.2-1B-NSFW-Dominatrix

Text Generation • 1B • Updated Apr 20 • 12

Novaciano/Llama-3.2-1B-NSFW-Dominatrix-Q5_K_M-GGUF

1B • Updated Apr 20 • 25

Novaciano/Llama-3.2-1B-NSFW-Dominatrix-Q4_K_M-GGUF

1B • Updated Apr 20 • 31