SoTA Feed — Every open-weights release from the labs that matter

Ad: Read SoTA Feed without this slot — ad-free site plus a personal ad-free feed URL $3/month

·

diffusiongemma-26B-A4B-it-NVFP4

Jun 10, 2026 · NVIDIA · 18.8 GB · MoE: 26B total, 4B (≈2.9 GB) active · NVFP4 · apache-2.0

diffusiongemma-26B-A4B-it

Jun 9, 2026 · Google · 52 GB · MoE: 26B total, 4B (≈7.9 GB) active · apache-2.0

MiMo-V2.5-Pro-FP4-DFlash

Jun 8, 2026 · Xiaomi MiMo · 570 GB · MoE: 1.02T total, 42B (≈23 GB) active · FP4 · mit

gemma-4-12B-it-qat-q4_0-gguf

Jun 5, 2026 · Google · 7.2 GB · 12B dense · GGUF · apache-2.0

gemma-4-31B-it-qat-w4a16-ct

Jun 4, 2026 · Google · 23 GB · 34B dense · W4A16 · apache-2.0

NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Jun 3, 2026 · NVIDIA · 352 GB · MoE: 550B total, 55B (≈35 GB) active · NVFP4 · other

NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

Jun 3, 2026 · NVIDIA · 1121 GB · MoE: 550B total, 55B (≈112 GB) active · other

gemma-4-31B-it-qat-q4_0-unquantized-assistant

May 29, 2026 · Google · 0.94 GB · 0.5B dense · apache-2.0

gemma-4-26B-A4B-it-qat-q4_0-unquantized-assistant

May 29, 2026 · Google · 0.84 GB · MoE: 26B total, 4B (≈0.13 GB) active · apache-2.0

Qwen3.6-35B-A3B-NVFP4

May 27, 2026 · NVIDIA · 23 GB · MoE: 35B total, 3B (≈2 GB) active · NVFP4 · apache-2.0

NVIDIA-Nemotron-3-Ultra-550B-A55B-GenRM

May 26, 2026 · NVIDIA · 1121 GB · MoE: 550B total, 55B (≈112 GB) active · other

Qwen-Image-Bench

May 21, 2026 · Alibaba Qwen · 55 GB · 27B dense · apache-2.0

MiMo-V2.5-Pro

Apr 27, 2026 · Xiaomi MiMo · 1033 GB · MoE: 1.02T total, 42B (≈42 GB) active · mit

MiMo-V2.5-Pro-Base

Apr 27, 2026 · Xiaomi MiMo · 1033 GB · MoE: 1.02T total, 42B (≈42 GB) active · mit

DeepSeek-V4-Pro

Apr 22, 2026 · DeepSeek · 865 GB · MoE: 1.6T total, 49B (≈26 GB) active · mit

DeepSeek-V4-Flash

Apr 22, 2026 · DeepSeek · 160 GB · MoE: 284B total, 13B (≈7.3 GB) active · mit

Qwen3.6-27B-FP8

Apr 21, 2026 · Alibaba Qwen · 31 GB · 28B dense · FP8 · apache-2.0

Kimi-K2.6

Apr 14, 2026 · Moonshot AI · 595 GB · MoE: 1.06T total, 32B (≈18 GB) active · other

MiniMax-M2.7

Apr 9, 2026 · MiniMax · 230 GB · MoE: 229B total, ≈11B (≈11.1 GB) active · other

GLM-5.1-FP8

Apr 3, 2026 · Z.ai · 756 GB · MoE: 754B total, ≈42B (≈43 GB) active · FP8 · mit

GLM-5.1

Apr 3, 2026 · Z.ai · 1508 GB · MoE: 754B total, ≈42B (≈85 GB) active · mit

MiniMax-M2.5

Feb 12, 2026 · MiniMax · 230 GB · MoE: 229B total, ≈11B (≈11.1 GB) active · other

GLM-5

Feb 11, 2026 · Z.ai · 1508 GB · MoE: 754B total, 40B (≈80 GB) active · mit

GLM-5-FP8

Feb 11, 2026 · Z.ai · 756 GB · MoE: 754B total, 40B (≈40 GB) active · FP8 · mit

GLM-OCR

Jan 30, 2026 · Z.ai · 2.7 GB · 1.3B dense · mit

GLM-4.7-Flash

Jan 19, 2026 · Z.ai · 62 GB · MoE: 31B total, ≈4.6B (≈9.2 GB) active · mit

Kimi-K2.5

Jan 1, 2026 · Moonshot AI · 595 GB · MoE: 1.06T total, 32B (≈18 GB) active · other

GLM-4.7-FP8

Dec 22, 2025 · Z.ai · 362 GB · MoE: 358B total, ≈36B (≈36 GB) active · FP8 · mit

GLM-4.7

Dec 22, 2025 · Z.ai · 717 GB · MoE: 358B total, ≈36B (≈71 GB) active · mit

MiniMax-M2.1

Dec 20, 2025 · MiniMax · 230 GB · MoE: 229B total, ≈11B (≈11.1 GB) active · other

MiMo-V2-Flash-Base

Dec 16, 2025 · Xiaomi MiMo · 313 GB · MoE: 310B total, 15B (≈15.2 GB) active · mit

MiMo-V2-Flash

Dec 16, 2025 · Xiaomi MiMo · 313 GB · MoE: 310B total, 15B (≈15.2 GB) active · mit

AutoGLM-Phone-9B-Multilingual

Dec 9, 2025 · Z.ai · 21 GB · 0B dense · mit

AutoGLM-Phone-9B

Dec 8, 2025 · Z.ai · 21 GB · 0B dense · mit

DeepSeek-V3.2

Dec 1, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈41B (≈41 GB) active · mit

DeepSeek-Math-V2

Nov 27, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈41B (≈41 GB) active · apache-2.0

MiMo-Embodied-7B

Nov 19, 2025 · Xiaomi MiMo · 18 GB · 8.3B dense · mit

Kimi-K2-Thinking

Nov 4, 2025 · Moonshot AI · 594 GB · MoE: 1.06T total, 32B (≈18 GB) active · other

Kimi-Linear-48B-A3B-Base

Oct 30, 2025 · Moonshot AI · 98 GB · MoE: 48B total, 3B (≈6.1 GB) active · mit

Kimi-Linear-48B-A3B-Instruct

Oct 30, 2025 · Moonshot AI · 98 GB · MoE: 48B total, 3B (≈6.1 GB) active · mit

MiniMax-M2

Oct 22, 2025 · MiniMax · 230 GB · MoE: 229B total, ≈11B (≈11.1 GB) active · other

DeepSeek-V3.2-Exp

Sep 29, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈41B (≈41 GB) active · mit

DeepSeek-V3.2-Exp-Base

Sep 29, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈41B (≈41 GB) active · mit

DeepSeek-V3.1-Terminus

Sep 22, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈40B (≈40 GB) active · mit

gpt-oss-safeguard-20b

Sep 18, 2025 · OpenAI · 13.8 GB · MoE: 22B total, ≈4.8B (≈3.1 GB) active · apache-2.0

gpt-oss-safeguard-120b

Sep 18, 2025 · OpenAI · 65 GB · MoE: 120B total, ≈9.3B (≈5.1 GB) active · apache-2.0

Kimi-K2-Instruct-0905

Sep 3, 2025 · Moonshot AI · 1029 GB · MoE: 1.03T total, 32B (≈32 GB) active · other

DeepSeek-V3.1

Aug 21, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈40B (≈40 GB) active · mit

DeepSeek-V3.1-Base

Aug 19, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈40B (≈40 GB) active · mit

MiMo-VL-7B-RL-2508

Aug 7, 2025 · Xiaomi MiMo · 16.6 GB · 8.3B dense · mit

MiMo-VL-7B-SFT-2508

Aug 7, 2025 · Xiaomi MiMo · 16.6 GB · 8.3B dense · mit

gpt-oss-20b

Aug 4, 2025 · OpenAI · 28 GB · MoE: 22B total, ≈4.8B (≈6.1 GB) active · apache-2.0

gpt-oss-120b

Aug 4, 2025 · OpenAI · 130 GB · MoE: 120B total, ≈9.3B (≈10.1 GB) active · apache-2.0

Kimi-K2-Instruct

Jul 11, 2025 · Moonshot AI · 1029 GB · MoE: 1.03T total, 32B (≈32 GB) active · other

Kimi-K2-Base

Jul 3, 2025 · Moonshot AI · 1029 GB · MoE: 1.03T total, 32B (≈32 GB) active · other

MiniMax-M1-40k-hf

Jul 1, 2025 · MiniMax · 912 GB · MoE: 456B total, ≈48B (≈97 GB) active · apache-2.0

MiniMax-M1-80k-hf

Jul 1, 2025 · MiniMax · 912 GB · MoE: 456B total, ≈48B (≈97 GB) active · apache-2.0

Kimi-VL-A3B-Thinking-2506

Jun 21, 2025 · Moonshot AI · 33 GB · MoE: 16B total, 3B (≈6 GB) active · mit

Kimi-Dev-72B

Jun 16, 2025 · Moonshot AI · 145 GB · 73B dense · mit

MiniMax-M1-80k

Jun 13, 2025 · MiniMax · 912 GB · MoE: 456B total, ≈48B (≈97 GB) active · apache-2.0

MiniMax-M1-40k

Jun 5, 2025 · MiniMax · 912 GB · MoE: 456B total, ≈48B (≈97 GB) active · apache-2.0

MiniMax-Text-01-hf

Jun 3, 2025 · MiniMax · 915 GB · MoE: 456B total, ≈48B (≈97 GB) active · other

SynLogic-7B

Jun 3, 2025 · MiniMax · 15.2 GB · 7.6B dense · mit

SynLogic-Mix-3-32B

May 30, 2025 · MiniMax · 66 GB · 33B dense · mit

SynLogic-32B

May 30, 2025 · MiniMax · 66 GB · 33B dense · mit

DeepSeek-R1-0528-Qwen3-8B

May 29, 2025 · DeepSeek · 16.4 GB · 8.2B dense · mit

DeepSeek-R1-0528

May 28, 2025 · DeepSeek · 689 GB · MoE: 685B total, ≈40B (≈40 GB) active · mit

Llama-Guard-4-12B

Apr 23, 2025 · Meta · 24 GB · 12B dense · other

Kimi-VL-A3B-Thinking

Apr 9, 2025 · Moonshot AI · 33 GB · MoE: 16B total, 3B (≈6 GB) active · mit

Kimi-VL-A3B-Instruct

Apr 9, 2025 · Moonshot AI · 33 GB · MoE: 16B total, 3B (≈6 GB) active · mit

Llama-4-Maverick-17B-128E

Apr 2, 2025 · Meta · 803 GB · 402B dense · other

Llama-4-Scout-17B-16E

Apr 2, 2025 · Meta · 217 GB · 109B dense · other

Llama-4-Scout-17B-16E-Instruct

Apr 2, 2025 · Meta · 217 GB · 109B dense · other

Llama-4-Maverick-17B-128E-Instruct

Apr 1, 2025 · Meta · 803 GB · 402B dense · other

Llama-4-Maverick-17B-128E-Instruct-FP8

Apr 1, 2025 · Meta · 417 GB · 402B dense · FP8 · other

Moonlight-16B-A3B-Instruct

Feb 22, 2025 · Moonshot AI · 32 GB · MoE: 16B total, 3B (≈6 GB) active · mit

MiniMax-VL-01

Jan 12, 2025 · MiniMax · 915 GB · MoE: 456B total, ≈49B (≈98 GB) active

Llama-3.3-70B-Instruct

Nov 26, 2024 · Meta · 141 GB · 71B dense · llama3.3