Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model 12 minutes ago

inference-optimization/MiniMax-M2.5.w4a16

reed-meyerson updated a model 3 days ago

inference-optimization/Qwen3.5-9B-quantized.w4a16

reed-meyerson published a model 3 days ago

inference-optimization/Qwen3.5-9B-quantized.w4a16

View all activity

inference-optimization 's models 320

inference-optimization/Qwen3-30B-A3B-5-bits-mode-noise-per-tensor

19B • Updated 5 days ago • 20

inference-optimization/Qwen3-30B-A3B-5-bits-mode-hybrid-per-tensor

19B • Updated 5 days ago • 20

inference-optimization/Qwen3-30B-A3B-5-bits-mode-heuristic-per-tensor

19B • Updated 5 days ago • 37

inference-optimization/Qwen3-8B-7-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 22

inference-optimization/Qwen3-8B-7-bits-mode-hybrid-per-tensor

7B • Updated 5 days ago • 22

inference-optimization/Qwen3-8B-7-bits-mode-heuristic-per-tensor

7B • Updated 5 days ago • 21

inference-optimization/Qwen3-8B-6.5-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 22

inference-optimization/Qwen3-8B-6.5-bits-mode-hybrid-per-tensor

7B • Updated 5 days ago • 19

inference-optimization/Qwen3-8B-6.5-bits-mode-heuristic-per-tensor

7B • Updated 5 days ago • 21

inference-optimization/Qwen3-8B-6-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 22

inference-optimization/Qwen3-8B-6-bits-mode-hybrid-per-tensor

6B • Updated 5 days ago • 20

inference-optimization/Qwen3-8B-6-bits-mode-heuristic-per-tensor

6B • Updated 5 days ago • 24

inference-optimization/Qwen3-8B-5.5-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 24

inference-optimization/Qwen3-8B-5.5-bits-mode-hybrid-per-tensor

6B • Updated 5 days ago • 21

inference-optimization/Qwen3-8B-5.5-bits-mode-heuristic-per-tensor

6B • Updated 5 days ago • 21

inference-optimization/Qwen3-8B-5-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 21

inference-optimization/Qwen3-8B-5-bits-mode-hybrid-per-tensor

6B • Updated 5 days ago • 27

inference-optimization/Qwen3-8B-5-bits-mode-heuristic-per-tensor

6B • Updated 5 days ago • 22

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-noise-per-tensor

7B • Updated 5 days ago • 23

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-hybrid-per-tensor

7B • Updated 5 days ago • 21

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-heuristic-per-tensor

7B • Updated 5 days ago • 28

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-noise-per-tensor

7B • Updated 5 days ago • 20

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-hybrid-per-tensor

7B • Updated 5 days ago • 34

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-heuristic-per-tensor

7B • Updated 5 days ago • 26

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 32

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-hybrid-per-tensor

6B • Updated 5 days ago • 33

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-heuristic-per-tensor

6B • Updated 5 days ago • 41

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-noise-per-tensor

6B • Updated 5 days ago • 23

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-hybrid-per-tensor

6B • Updated 5 days ago • 28

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-heuristic-per-tensor

6B • Updated 5 days ago • 23