🏆 ICML 2026 — Efficient Qwen Leaderboard

Minimizing Inference Latency for Qwen3.5-4B on A10G

Hardware: NVIDIA A10G (ml.g5.xlarge) | Ranked by average speedup over baseline

Baseline (unoptimized Qwen3.5-4B): Short: 2,582 ms | Medium: 5,441 ms | Long: 6,576 ms | Avg: 4,866 ms

#	Team	Avg Speedup	Short (64t)	Medium (2048t)	Long (8192t)	MMLU-Pro ≥62.1%	IFEval ≥81.4%	GPQA-Diamond ≥63.0%
1	AFM-e4e9muaf	7.745x	225 ms	652 ms	1,912 ms	✅ 0.644	✅ 0.845	✅ 0.687
2	AFM-6j6duhm6	7.708x	240 ms	620 ms	1,833 ms	✅ 0.674	✅ 0.881	✅ 0.677
3	AFM-as4vvw34	7.514x	320 ms	637 ms	1,106 ms	✅ 0.643	✅ 0.821	✅ 0.667
4	AFM-k5984d3s	6.978x	232 ms	782 ms	2,313 ms	✅ 0.659	✅ 0.845	✅ 0.667
5	AFM-v8ws998a	6.197x	278 ms	794 ms	2,691 ms	✅ 0.646	✅ 0.833	✅ 0.636
6	AFM-gv7e2ebxAFM-gv7e2ebx	6.118x	310 ms	703 ms	2,891 ms	✅ 0.657	✅ 0.857	✅ 0.657
7	AFM-qd39x2e6	5.366x	345 ms	881 ms	2,684 ms	✅ 0.661	✅ 0.845	✅ 0.667
8	AFM-cpykb5cu	5.090x	387 ms	972 ms	2,198 ms	✅ 0.656	✅ 0.833	✅ 0.687
9	AFM-34qt8st6	5.084x	338 ms	988 ms	3,128 ms	✅ 0.671	✅ 0.857	✅ 0.687
10	AFM-v4we4h8u	5.056x	389 ms	941 ms	2,403 ms	✅ 0.685	✅ 0.869	✅ 0.677
11	AFM-dcakuxwp	4.280x	439 ms	1,212 ms	2,657 ms	✅ 0.654	✅ 0.845	✅ 0.687
12	AFM-bxwzjeaf	4.150x	385 ms	1,624 ms	2,753 ms	✅ 0.642	✅ 0.857	✅ 0.636
13	AFM-y6vkzu7s	4.099x	409 ms	1,306 ms	3,622 ms	✅ 0.670	✅ 0.869	✅ 0.636
14	AFM-pzpknzq8	3.880x	418 ms	1,485 ms	3,666 ms	✅ 0.667	✅ 0.857	✅ 0.657
15	AFM-69568ssx	3.224x	650 ms	1,525 ms	3,089 ms	✅ 0.648	✅ 0.833	✅ 0.667
16	AFM-gv7e2ebx	3.145x	663 ms	1,587 ms	3,115 ms	✅ 0.653	✅ 0.821	✅ 0.657
17	AFM-fbdrr789	3.097x	644 ms	1,448 ms	4,324 ms	✅ 0.671	✅ 0.845	✅ 0.636
18	AFM-hnknxz5w	2.997x	674 ms	1,549 ms	3,996 ms	✅ 0.658	✅ 0.845	✅ 0.707
19	AFM-xpvr9w7k	2.982x	700 ms	1,687 ms	3,234 ms	✅ 0.650	✅ 0.833	✅ 0.677
20	AFM-7mpasa9x	2.974x	735 ms	1,575 ms	3,365 ms	✅ 0.681	✅ 0.881	✅ 0.717
21	AFM-nqjfd547	2.887x	718 ms	1,465 ms	4,865 ms	✅ 0.672	✅ 0.833	✅ 0.667
22	AFM-wp5spjm8	2.878x	733 ms	1,765 ms	3,245 ms	✅ 0.640	✅ 0.869	✅ 0.646
23	AFM-pysuua5t	2.723x	795 ms	1,884 ms	3,235 ms	✅ 0.652	✅ 0.857	✅ 0.636
24	AFM-xbp9kss9	2.698x	901 ms	1,897 ms	2,785 ms	✅ 0.655	✅ 0.857	✅ 0.657
25	AFM-jvzphzua	2.694x	867 ms	1,803 ms	3,150 ms	✅ 0.687	✅ 0.833	✅ 0.646
26	AFM-g4yrpeuv	2.479x	769 ms	2,029 ms	4,710 ms	✅ 0.677	✅ 0.869	✅ 0.677
27	AFM-ppyvszdy	2.362x	929 ms	2,148 ms	3,710 ms	✅ 0.666	✅ 0.857	✅ 0.667
28	AFM-x9qzaft6	2.170x	1,047 ms	2,378 ms	3,745 ms	✅ 0.688	✅ 0.845	✅ 0.657
29	AFM-ayxvmqbj	2.155x	1,126 ms	2,452 ms	3,367 ms	✅ 0.663	✅ 0.821	✅ 0.657
30	AFM-kwuct7tx	2.154x	1,126 ms	2,449 ms	3,378 ms	✅ 0.652	✅ 0.821	✅ 0.646
31	AFM-z9qv547h	2.153x	1,126 ms	2,451 ms	3,382 ms	✅ 0.644	✅ 0.821	✅ 0.677
32	AFM-r2csu47t	2.011x	1,060 ms	2,876 ms	3,858 ms	✅ 0.672	✅ 0.845	✅ 0.707
33	AFM-za9buwuh	1.749x	1,308 ms	2,996 ms	4,518 ms	✅ 0.681	✅ 0.857	✅ 0.677
34	AFM-f57gsqmt	1.629x	1,537 ms	3,297 ms	4,224 ms	✅ 0.684	✅ 0.857	✅ 0.636
35	AFM-tr24e5tc	1.621x	1,553 ms	3,306 ms	4,228 ms	✅ 0.661	✅ 0.881	✅ 0.657
36	AFM-npq35pxt	1.604x	1,588 ms	3,337 ms	4,225 ms	✅ 0.669	✅ 0.845	✅ 0.636
37	AFM-yac279yz	1.366x	1,874 ms	3,963 ms	4,885 ms	✅ 0.671	✅ 0.845	✅ 0.677
38	AFM-fh8yvvt4	1.018x	2,588 ms	5,382 ms	6,297 ms	✅ 0.690	✅ 0.869	✅ 0.657
39	AFM-s9gqdtb6	1.011x	2,608 ms	5,431 ms	6,325 ms	✅ 0.681	✅ 0.845	✅ 0.636
40	AFM-newrkm40	1.000x	2,585 ms	5,443 ms	6,577 ms	✅ 0.691	✅ 0.857	✅ 0.667
41	Baseline	0.999x	2,585 ms	5,444 ms	6,577 ms	✅ 0.685	✅ 0.857	✅ 0.697
42	AFM-6bhtn7up	0.000x	0 ms	0 ms	0 ms	✅ 0.675	✅ 0.821	✅ 0.646
43	AFM-42qgh9wu	0.000x	1,147 ms	2,611 ms	0 ms	✅ 0.687	✅ 0.845	✅ 0.646