Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model 3 days ago

inference-optimization/updated-ctest-Qwen3-8B-speculator.dflash

ChibuUkachi published a model 3 days ago

inference-optimization/updated-ctest-Qwen3-8B-speculator.dflash

ChibuUkachi updated a dataset 3 days ago

inference-optimization/updated-ctest-Qwen3-8B-speculator-dataset

View all activity

Collections 4

View 4 collections

models 336

inference-optimization/updated-ctest-Qwen3-8B-speculator.dflash

2B • Updated 3 days ago • 42

inference-optimization/qwen3_8b_7.0_bits_mode_noise_stiched

7B • Updated 3 days ago • 27

inference-optimization/qwen3_8b_7.0_bits_mode_hybrid_stiched

7B • Updated 3 days ago • 27

inference-optimization/qwen3_8b_7.0_bits_mode_heuristic_stiched

7B • Updated 3 days ago • 27

inference-optimization/qwen3_8b_6.5_bits_mode_noise_stiched

7B • Updated 3 days ago • 29

inference-optimization/qwen3_8b_6.5_bits_mode_hybrid_stiched

7B • Updated 3 days ago • 24

inference-optimization/qwen3_8b_6.5_bits_mode_heuristic_stiched

7B • Updated 3 days ago • 27

inference-optimization/qwen3_8b_6.0_bits_mode_noise_stiched

6B • Updated 3 days ago • 27

inference-optimization/qwen3_8b_6.0_bits_mode_hybrid_stiched

6B • Updated 3 days ago • 21

inference-optimization/qwen3_8b_6.0_bits_mode_heuristic_stiched

6B • Updated 3 days ago • 26

View 336 models

datasets 14

inference-optimization/updated-ctest-Qwen3-8B-speculator-dataset

Viewer • Updated 3 days ago • 10k • 25

inference-optimization/laguna-xs-ultrachat-responses

Viewer • Updated 12 days ago • 208k • 328

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated 18 days ago • 205k • 137

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated 18 days ago • 300k • 28

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated 18 days ago • 298k • 28

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated 23 days ago • 280

inference-optimization/speculators_benchmarks_tool_call

Viewer • Updated 26 days ago • 4.9k • 123

inference-optimization/speculators-qwen3-30b-a3b-instruct-2507

Preview • Updated Apr 7 • 12

inference-optimization/speculators-qwen3-30b-a3b-instruct

Preview • Updated Mar 26 • 25

inference-optimization/speculators-qwen3-32b-instruct

Preview • Updated Mar 26 • 41

View 14 datasets