Skills & Capabilities

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	diffusiongemma-26B-A4B-it-NVFP4NVIDIA	95.0	1	---	Free Free	Start Free Trial
2	GPT-4oOpenAI	90.2	1	$197M	$2.50/M Cheapest verified	Subscribe
3	GPT-4oOpenAI	90.2	1	$232M	$2.50/M Cheapest verified	Subscribe
4	GPT-4oOpenAI	90.2	1	$204M	$2.50/M Cheapest verified	Subscribe
5	GPT-4oOpenAI	90.2	1	$230M	$5.00/M Cheapest verified	Subscribe
6	Nemotron-Cascade-2-30B-A3BNVIDIA	89.3	1	$22M	---	Start Free Trial
7	Llama 3.1 405B InstructMeta	89.0	1	$25M	Free Free	Start Free Trial
8	meta-llama-3.1-405b-instructMeta	89.0	1	$31M	Free Free	Start Free Trial
9	llama-3.1-405b-instructMeta	89.0	1	$36M	Free Free	Start Free Trial
10	Llama 3.3 70BMeta	88.4	1	$34M	Free Free	Start Free Trial

Reasoning & Logic

Complex reasoning, problem solving, and critical thinking· ranked by average benchmark score

Top Performer

Grok-3

Avg score 96.5 across 1 benchmark.

Best Budget Pick

Llama 3.3 70B

Free access path · Free

Best Access Path

ChatGPT Plus

Subscribe for GPT-4o

Value 69 · Trust 100

Open Weights Leader

Llama 3.3 70B

Avg score 93.5 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	Grok-3xAI	96.5	1	$143M	---	Subscribe
2	GPT-4oOpenAI	96.4	1	$204M	$2.50/M Cheapest verified	Subscribe
3	GPT-4oOpenAI	96.4	1	$232M	$2.50/M Cheapest verified	Subscribe
4	GPT-4oOpenAI	96.4	1	$230M	$5.00/M Cheapest verified	Subscribe
5	GPT-4oOpenAI	96.4	1	$197M	$2.50/M Cheapest verified	Subscribe
6	GPT-5.5OpenAI	93.6	1	$344M	$5.00/M Cheapest verified	Subscribe
7	GPT-5.5OpenAI	93.6	1	$275M	---	Subscribe
8	Llama 3.3 70BMeta	93.5	1	$34M	Free Free	Start Free Trial
9	Llama 4 MaverickMeta	93.5	1	$35M	Free Free	Start Free Trial
10	Gemini 2.0 FlashGoogle	93.0	1	$24M	---	Subscribe

Mathematics

Mathematical problem solving and computation· ranked by average benchmark score

Top Performer

R1 0528

Avg score 97.5 across 1 benchmark.

Best Budget Pick

DeepSeek-R1

Free access path · Free

Best Access Path

Claude Pro

Subscribe for Claude Opus 4.6

Value 53 · Trust 100

Open Weights Leader

R1 0528

Avg score 97.5 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	R1 0528DeepSeek	97.5	1	$44M	$0.5000/M Cheapest verified	View
2	DeepSeek-R1DeepSeek Open SourceToday	97.3	2	$59M	Free Free	Start Free Trial
3	deepseek-r1DeepSeek	97.3	1	---	Free Free	Start Free Trial
4	R1DeepSeek Open SourceToday	97.3	1	$46M	$0.7000/M Cheapest verified	Start Free Trial
5	o4-miniOpenAI	94.0	1	$111M	---	Get API Access
6	o4-miniOpenAI	94.0	1	$137M	$1.10/M Cheapest verified	Get API Access
7	deepseek-v3DeepSeek	90.2	1	---	Free Free	Start Free Trial
8	DeepSeek V3DeepSeek	90.2	1	$56M	$0.2002/M Cheapest verified	Start Free Trial
9	DeepSeek-V3DeepSeek	85.1	2	$60M	Free Free	Start Free Trial
10	Claude Opus 4.6Anthropic	85.0	1	$246M	$5.00/M Cheapest verified	Subscribe

Browser Automation

Web browsing, form filling, and browser-based tasks· ranked by average benchmark score

Top Performer

Claude Opus 4.8

Avg score 84.0 across 1 benchmark.

Best Budget Pick

DeepSeek-V3.2

Free access path · Free

Best Access Path

Claude Pro

Subscribe for Claude Opus 4.8

Value 53 · Trust 100

Open Weights Leader

DeepSeek V3.2

Avg score 74.3 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	Claude Opus 4.8Anthropic	84.0	1	$284M	$5.00/M Cheapest verified	Subscribe
2	DeepSeek V3.2DeepSeek	74.3	1	$44M	$0.2288/M Cheapest verified	Start Free Trial
3	DeepSeek-V3.2DeepSeek	74.3	1	$42M	Free Free	Start Free Trial

Language & Writing

Text generation, translation, and communication· ranked by average benchmark score

Top Performer

Claude Opus 4.6

Avg score 91.5 across 1 benchmark.

Best Budget Pick

deepseek-r1

Free access path · Free

Best Access Path

ChatGPT Plus

Subscribe for GPT-5.2

Value 69 · Trust 100

Open Weights Leader

R1 0528

Avg score 91.0 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	Claude Opus 4.6Anthropic	91.5	1	$246M	$5.00/M Cheapest verified	Subscribe
2	Claude 4 OpusAnthropic	91.0	1	$307M	---	Subscribe
3	R1 0528DeepSeek	91.0	1	$44M	$0.5000/M Cheapest verified	View
4	deepseek-r1DeepSeek	90.8	1	---	Free Free	Start Free Trial
5	DeepSeek-R1DeepSeek Open SourceToday	90.8	1	$59M	Free Free	Start Free Trial
6	R1DeepSeek Open SourceToday	90.8	1	$46M	$0.7000/M Cheapest verified	Start Free Trial
7	Claude 4 SonnetAnthropic	90.4	1	$203M	---	Subscribe
8	GPT-5.2OpenAI	89.6	1	$171M	$1.75/M Cheapest verified	Subscribe
9	GPT-5.2OpenAI	89.6	1	$168M	$1.75/M Cheapest verified	Subscribe
10	GPT-5.2OpenAI	89.6	1	$133M	---	Subscribe

Agent & Tool Use

Autonomous task execution and tool orchestration· ranked by average benchmark score

Top Performer

GPT-5.1

Avg score 95.6 across 1 benchmark.

Best Budget Pick

LTX-2.3-Multiple-Subject-Reference

Free access path · Free

Best Access Path

ChatGPT Plus

Subscribe for GPT-5.1

Value 69 · Trust 100

Open Weights Leader

LTX-2.3-Multiple-Subject-Reference

Avg score 84.5 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	GPT-5.1OpenAI	95.6	1	---	---	Subscribe
2	GPT-5.1OpenAI	95.6	1	$135M	---	Subscribe
3	GPT-5.1OpenAI	95.6	1	$166M	$1.25/M Cheapest verified	Subscribe
4	GPT-5.5OpenAI	86.5	3	$275M	---	Subscribe
5	GPT-5.5OpenAI	86.5	3	$344M	$5.00/M Cheapest verified	Subscribe
6	LTX-2.3-Multiple-Subject-ReferenceLiconStudio	84.5	1	---	Free Free	View
7	Qwen-Image-Edit-2511-Multiple-Angles-LoRAfal	84.5	1	---	Free Free	View
8	GPT-5OpenAI	84.3	2	$146M	$1.25/M Cheapest verified	Subscribe
9	GLM-5.2-FP8Z.ai	82.7	1	---	Free Free	Subscribe
10	GPT-5.2OpenAI	81.8	2	$137M	---	Subscribe

Knowledge & QA

Factual knowledge retrieval and question answering· ranked by average benchmark score

Top Performer

Claude Opus 4.6

Avg score 91.5 across 1 benchmark.

Best Budget Pick

deepseek-r1

Free access path · Free

Best Access Path

ChatGPT Plus

Subscribe for GPT-5.2

Value 69 · Trust 100

Open Weights Leader

R1 0528

Avg score 91.0 with public weights.

#	Model	Avg Score	Benchmarks	Est. Value	Cheapest Verified	Try It
1	Claude Opus 4.6Anthropic	91.5	1	$246M	$5.00/M Cheapest verified	Subscribe
2	Claude 4 OpusAnthropic	91.0	1	$307M	---	Subscribe
3	R1 0528DeepSeek	91.0	1	$44M	$0.5000/M Cheapest verified	View
4	deepseek-r1DeepSeek	90.8	1	---	Free Free	Start Free Trial
5	DeepSeek-R1DeepSeek Open SourceToday	90.8	1	$59M	Free Free	Start Free Trial
6	R1DeepSeek Open SourceToday	90.8	1	$46M	$0.7000/M Cheapest verified	Start Free Trial
7	Claude 4 SonnetAnthropic	90.4	1	$203M	---	Subscribe
8	GPT-5.2OpenAI	89.6	1	$171M	$1.75/M Cheapest verified	Subscribe
9	GPT-5.2OpenAI	89.6	1	$168M	$1.75/M Cheapest verified	Subscribe
10	GPT-5.2OpenAI	89.6	1	$133M	---	Subscribe

Need a model for a specific skill?

Browse the marketplace for fine-tuned models, API access, and specialized solutions tailored to your use case.

Browse Marketplace Full Leaderboards