AI Vision Model Rankings

Updated 10 minutes ago

Explore top-performing models across computer vision tasks. Compare accuracy, speed, and user votes to find the best AI models.

Votes power rankings.

Overall Model Rankings

Average performance across all supported vision tasks

Rank	Model	Score	Tasks	Avg Latency
1	SAM 3	1402	1	2.68 s
2	Gemini 2.5 Pro	1269	5	15.82 s
3	Gemini 3 Flash	1265	5	8.41 s
4	Gemini 3.5 Flash	1255	2	23.55 s
5	Claude Fable 5	1249	1	9.33 s

Loading chart...

Models that detect and localize objects in images.

Rank	Model	Score	Tasks	Avg Latency
1	Gemini 3 Flash	1452	5	11.74 s
2	SAM 3	1402	1	2.68 s
3	Gemini 2.5 Pro	1333	5	17.19 s
4	GPT-5.5	1317	3	12.50 s
5	GPT-5.4	1313	5	4.67 s

Loading chart...

Models that classify images into categories.

Rank	Model	Score	Tasks	Avg Latency
1	Gemini 3 Flash	1224	5	3.69 s
2	Gemini 2.5 Pro	1215	5	7.76 s
3	GPT-5.4 Mini	1212	4	2.48 s
4	GPT-5 Nano	1212	5	6.87 s
5	GPT-5.6 Sol	1212	2	10.53 s

Loading chart...

Models that extract text from images.

Rank	Model	Score	Tasks	Avg Latency
1	GPT-5 Mini	1263	5	20.06 s
2	Gemini 2.5 Flash	1260	5	7.44 s
3	Gemini 3 Flash	1247	5	9.39 s
4	GPT-5.2	1244	5	7.13 s
5	Claude Sonnet 4.5	1238	5	12.54 s

Loading chart...

Models that generate descriptive captions for images.

Rank	Model	Score	Tasks	Avg Latency
1	Gemini 2.5 Pro	1278	5	21.10 s
2	Qwen3 VL 235B A22B Instruct	1246	3	11.54 s
3	Gemini 2.5 Flash	1245	5	10.85 s
4	Qwen VL Max	1245	3	12.32 s
5	Claude Opus 4.1	1236	5	12.21 s

Loading chart...

Models that interpret free-form prompts on images.

Rank	Model	Score	Tasks	Avg Latency
1	Gemini 2.5 Pro	1311	5	17.39 s
2	GPT-5 Mini	1287	5	31.91 s
3	Gemini 2.5 Flash	1262	5	9.99 s
4	GPT-5.4	1244	5	5.83 s
5	Qwen3.5 122B A10B	1235	3	11.91 s

Loading chart...