Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

arxiv: 2408.11796

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

25

Full-text search

Active filters: 2408.11796

nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • 5B • Updated Feb 14 • 3.97k • 192

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Text Generation • 5B • Updated Feb 14 • 744 • 21

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • 8B • Updated Aug 22, 2024 • 3.06k • 176

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

8B • Updated Aug 23, 2024 • 251 • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

5B • Updated Aug 23, 2024 • 58

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

5B • Updated Aug 24, 2024 • 781 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • 8B • Updated Sep 9, 2024 • 6

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

5B • Updated Sep 26, 2024 • 102 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

8B • Updated Nov 5, 2024 • 151

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

4B • Updated Dec 3, 2024 • 13 • 6

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Width-Base-4bits

3B • Updated Mar 23 • 8

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Width-Base-8bits

5B • Updated Mar 23 • 4

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Depth-Base-4bits

3B • Updated Mar 23 • 6

RichardErkhov/nvidia_-_Llama-3.1-Minitron-4B-Depth-Base-8bits

5B • Updated Mar 23 • 6

nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1

Text Generation • 5B • Updated Oct 15 • 1.96k • 109

unsloth/Llama-3.1-Nemotron-Nano-4B-v1.1

Text Generation • 5B • Updated May 24 • 67 • 5

duyntnet/Llama-3.1-Nemotron-Nano-4B-v1.1-imatrix-GGUF

Text Generation • 5B • Updated May 21 • 257

Mungert/Llama-3.1-Nemotron-Nano-4B-v1.1-GGUF

Text Generation • 5B • Updated Sep 24 • 466 • 2

unsloth/Llama-3.1-Nemotron-Nano-4B-v1.1-unsloth-bnb-4bit

Text Generation • 3B • Updated May 24 • 17

unsloth/Llama-3.1-Nemotron-Nano-4B-v1.1-bnb-4bit

Text Generation • 3B • Updated May 24 • 361

naveenencipher1/trialup

Text Generation • 5B • Updated May 28 • 8

nis12ram/qwen2.5-0.5B-Instruct-pruned-Inshort

Text Generation • 0.3B • Updated Jun 18 • 12

Mungert/Llama-3.1-Minitron-4B-Width-Base-GGUF

Text Generation • 5B • Updated Sep 24 • 421

Mungert/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Text Generation • 5B • Updated Sep 24 • 603

jncraton/Llama-3.1-Nemotron-Nano-4B-v1.1-ct2-int8

Text Generation • Updated Jul 26 • 5