Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

reed-meyerson updated a model 38 minutes ago

inference-optimization/Qwen3.5-9B-quantized.w4a16

reed-meyerson published a model 42 minutes ago

inference-optimization/Qwen3.5-9B-quantized.w4a16

nm-research updated a dataset 1 day ago

inference-optimization/laguna-xs-ultrachat-responses

View all activity

Collections 6

View 6 collections

models 320

inference-optimization/Qwen3.5-9B-quantized.w4a16

Image-Text-to-Text • 9B • Updated 18 minutes ago

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-noise-per-tensor

26B • Updated 1 day ago • 16

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-hybrid-per-tensor

27B • Updated 1 day ago • 13

inference-optimization/Qwen3-30B-A3B-Instruct-2507-7-bits-mode-heuristic-per-tensor

27B • Updated 1 day ago • 15

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-noise-per-tensor

25B • Updated 1 day ago • 15

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-hybrid-per-tensor

25B • Updated 1 day ago • 15

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6.5-bits-mode-heuristic-per-tensor

25B • Updated 1 day ago • 16

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-noise-per-tensor

23B • Updated 1 day ago • 16

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-hybrid-per-tensor

23B • Updated 1 day ago • 16

inference-optimization/Qwen3-30B-A3B-Instruct-2507-6-bits-mode-heuristic-per-tensor

23B • Updated 1 day ago • 14

View 320 models

datasets 13

inference-optimization/laguna-xs-ultrachat-responses

Viewer • Updated 1 day ago • 208k • 10

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated 1 day ago • 205k • 11

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated 1 day ago • 300k • 13

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated 1 day ago • 298k • 11

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated 6 days ago • 84

inference-optimization/speculators_benchmarks_tool_call

Viewer • Updated 9 days ago • 4.9k • 67

inference-optimization/speculators-qwen3-30b-a3b-instruct-2507

Preview • Updated 17 days ago • 32

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated 29 days ago • 62

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated 29 days ago • 71

inference-optimization/gpt-oss-20b-nan-hidden-states-repro

Updated Mar 19 • 52

View 13 datasets