Inference Providers
Active filters: ModelOpt
nvidia/diffusiongemma-26B-A4B-it-NVFP4
Text Generation
• 14B • Updated • 29.7k
• 50
nvidia/DeepSeek-V4-Flash-NVFP4
Text Generation
• 167B • Updated • 99.5k
• 24
nvidia/Qwen3.6-35B-A3B-NVFP4
Text Generation
• 19B • Updated • 755k
• 218
nvidia/Qwen3.5-122B-A10B-NVFP4
Text Generation
• 65B • Updated • 7.1k
• 17
Text Generation
• 2B • Updated • 371
• 8
nvidia/Gemma-4-31B-IT-NVFP4
Text Generation
• 21B • Updated • 1.46M
• 509
nvidia/MiniMax-M2.7-NVFP4
Text Generation
• 116B • Updated • 266k
• 57
Text Generation
• 382B • Updated • 28.1k
• 36
NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4
Text Generation
• 16B • Updated • 5k
• 33
nvidia/Qwen3-30B-A3B-NVFP4
Text Generation
• 16B • Updated • 42.3k
• 34
nvidia/Gemma-4-26B-A4B-NVFP4
Text Generation
• 14B • Updated • 972k
• 75
Text Generation
• Updated • 825k
• 36
nvidia/Wan2.2-T2V-A14B-Diffusers-NVFP4
Text-to-Video
• Updated • 11
nvidia/DeepSeek-V4-Pro-NVFP4
Text Generation
• 910B • Updated • 37k
• 60
nvidia/Phi-4-multimodal-instruct-NVFP4
4B • Updated • 7.02k
• 12
nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4
Text Generation
• Updated • 20.2k
• 42
Text Generation
• Updated • 735k
• 86
Image-Text-to-Text
• 3B • Updated • 1.89k
• 4
Image-Text-to-Text
• 2B • Updated • 955
• 3
nvidia/Kimi-K2.5-Thinking-Eagle3
Text Generation
• 2B • Updated • 9.11k
• 16
nvidia/gpt-oss-120b-Eagle3-v3
Text Generation
• 0.8B • Updated • 9.99k
• 9
nvidia/DeepSeek-V3-0324-NVFP4
Text Generation
• 397B • Updated • 40.3k
• 17
nvidia/DeepSeek-R1-0528-NVFP4
Text Generation
• 397B • Updated • 2.2k
• 44
NVFP4/DeepSeek-Prover-V2-7B-FP4
4B • Updated • 7
• 1
NVFP4/DeepSeek-R1-0528-Qwen3-8B-FP4
5B • Updated • 13
• 1
Text Generation
• 19B • Updated • 247
• 4
NVFP4/Polaris-4B-Preview-FP4
2B • Updated • 106
• 1
NVFP4/Polaris-7B-Preview-FP4
5B • Updated • 5
• 1
nvidia/Qwen3-235B-A22B-FP8
Text Generation
• 235B • Updated • 140
• 5
nvidia/Qwen3-235B-A22B-NVFP4
Text Generation
• 133B • Updated • 41.3k
• 18