Zihao Ye's picture

Zihao Ye

zhye

·

yzh119

AI & ML interests

None yet

Organizations

New activity in flashinfer-ai/flashinfer-trace 2 months ago

Vectorize dsa_sparse_attention_h16_ckv512_kpe64_topk2048_ps64 reference

#258 opened 2 months ago by

feat: add gqa_paged_prefill_causal_h24_kv4_d128_ps64 (Mixtral 8x22B TP=2 prefill)

#196 opened 3 months ago by

feat: add gqa_paged_decode_h24_kv4_d128_ps64 workloads (Mixtral 8x22B TP=2)

#195 opened 3 months ago by

feat: add gqa_paged_prefill_causal_h24_kv4_d128_ps1 workloads, solution, and definition

#199 opened 3 months ago by

Add gqa_paged_decode_h48_kv8_d128_ps1: solution + workloads + def + tests

#162 opened 3 months ago by

workloads: add gqa_paged_prefill_causal_h16_kv1_d128_ps64 (Qwen3-235B-A22B, TP=4)

#152 opened 3 months ago by

fix: mark missing fp8/scale tensors as random in MoE workload

#228 opened 2 months ago by

New activity in flashinfer-ai/flashinfer-trace 3 months ago

test claude auto workload collection skill: fuse_add_rms_norm_h5120

#28 opened 3 months ago by

gdn workload update: all tensors are dumped; add flashinfer gdn baseline

#21 opened 3 months ago by

fix: gdn workload path and shape

#19 opened 3 months ago by

fix: error when copying definition

#18 opened 3 months ago by

fix: missing mtp tp2 workload

#13 opened 3 months ago by

fix: real k for gdn prefill (tp4)

#14 opened 3 months ago by

fix: real k for gdn prefill (tp2)

#15 opened 3 months ago by

New activity in flashinfer-ai/flashinfer-trace 4 months ago

add gdn tp2 mtp workload

#12 opened 4 months ago by

add gdn tp4 prefill/decode workload

#11 opened 4 months ago by

update gdn tp4 decode: more batch size

#10 opened 4 months ago by

add gdn tp4 mtp workload

#8 opened 4 months ago by

add gdn tp4 mtp workload

#8 opened 4 months ago by