Add qwen3-max-thinking via OpenRouter, move kimi-k2.5 to Fireworks by ericc59 · Pull Request #84 · arcprize/arc-agi-benchmarking

ericc59 · 2026-02-10T21:21:57Z

Summary

Add qwen3-max-thinking-openrouter model config using OpenRouter (qwen/qwen3-max-thinking, $1.20/$6.00 per 1M tokens)
Switch kimi-k2.5 from OpenRouter to Fireworks (accounts/fireworks/models/kimi-k2p5)
Hardcode store=False in FireworksAdapter._chat_completion() to opt out of Fireworks conversation data retention

Test plan

Verified qwen3-max-thinking-openrouter runs successfully on a single v2 eval task (0934a4d8)
Verify kimi-k2.5 via Fireworks once FIREWORKS_API_KEY is configured

- Add qwen3-max-thinking-openrouter model config (qwen/qwen3-max-thinking) - Switch kimi-k2.5 from OpenRouter to Fireworks (accounts/fireworks/models/kimi-k2p5) - Hardcode store=False in FireworksAdapter to opt out of conversation data retention

Allow models to specify a custom capacity in their rate_limit config, falling back to the existing calculated default when not provided.

ericc59 added 2 commits February 10, 2026 15:21

Support model-level rate limit capacity override

1f9a3bc

Allow models to specify a custom capacity in their rate_limit config, falling back to the existing calculated default when not provided.

gkamradt merged commit 7a2efa0 into main Feb 10, 2026
6 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add qwen3-max-thinking via OpenRouter, move kimi-k2.5 to Fireworks#84

Add qwen3-max-thinking via OpenRouter, move kimi-k2.5 to Fireworks#84
gkamradt merged 2 commits intomainfrom
add-qwen3-max-thinking-openrouter-kimi-k2p5-fireworks

ericc59 commented Feb 10, 2026 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

ericc59 commented Feb 10, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Summary

Test plan

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

ericc59 commented Feb 10, 2026 •

edited

Loading