Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 7 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt3

nm-research published a model about 7 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt3

orestis-z updated a model about 15 hours ago

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-qwen3arch-ckpt1

View all activity

Collections 2

models 172

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt3

2B • Updated about 7 hours ago

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-qwen3arch-ckpt1

1B • Updated about 15 hours ago

inference-optimization/dflash-DeepSeek-V4-Flash-swa-muon-speculators-50k

2B • Updated 1 day ago • 32

inference-optimization/Nemotron-3-Super-prepared-data

Updated 1 day ago

inference-optimization/Nemotron-Super-120B-Dflash-SWA

1B • Updated 1 day ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step210040

2B • Updated 1 day ago • 132

inference-optimization/Qwen3-8B-speculator.dflash.swa.causal-qwen235b-instruct-bs16-ckpt2

2B • Updated 1 day ago • 7

inference-optimization/Phi-3.5-MoE-0.8B-A0.2B

Text Generation • 0.8B • Updated 2 days ago • 47

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle31-llamaarch-ckpt1

1B • Updated 2 days ago • 57

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step189036

2B • Updated 5 days ago • 127

View 172 models

datasets 26

inference-optimization/every-eval-ever-demo

Viewer • Updated 7 days ago • 1 • 54

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated 8 days ago • 508k • 35

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 13 days ago • 7.47k • 91

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 20 days ago • 7.47k • 130

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 20 days ago • 7.67k • 62

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 21 days ago • 207

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 21 days ago • 67

inference-optimization/gpt-oss-120b-responses

Preview • Updated 21 days ago • 16

inference-optimization/Qwen3-32B-responses

Preview • Updated 21 days ago • 50

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated 27 days ago • 5.61k • 48 • 1

View 26 datasets