对 9 家平台的 Coding 订阅套餐进行系统性流式延迟基准测试。覆盖 4 档上下文规格(100 / 1K / 10K / 100K tokens),白天 & 夜间双轮采样,每格 5 次有效重复。
| 套餐 | 平台 | 模型数 | 覆盖模型 | 白天 | 夜间 | 备注 |
|---|---|---|---|---|---|---|
| 火山-Coding | 字节·火山引擎 | 6 | doubao-seed-2.0-pro, doubao-seed-2.0-code, doubao-seed-code, deepseek-v3.2, glm-4.7, kimi-k2.5 | ✓ | ✓ | — |
| GLM-Coding | 智谱 BigModel | 6 | glm-4.5-air, glm-4.5, glm-4.6, glm-4.7, glm-5, glm-5-turbo | ✓ | ✓ | — |
| KIMI-Coding | 月之暗面 | 1 | kimi-for-coding | ✓ | ✓ | — |
| MiniMax-Coding | MiniMax | 4 | m2.1, m2.5, m2.7, m2.7-highspeed | ✓ | ✓ | — |
| 阿里CodingPlan | 阿里云百炼 | 8 | qwen3-coder-next/plus, qwen3.5-plus, qwen3-max, glm-4.7, glm-5, kimi-k2.5, minimax-m2.5 | ✓ | ✓ | — |
| 硅基流动(参照组) | SiliconFlow | 6 | kimi-k2.5, deepseek-v3.1-terminus/v3.2, glm-4.7, glm-5, minimax-m2.5 | ✓ | ✓ | 无 Coding Plan,按量付费 API |
| 腾讯CodingPlan | 腾讯云 LKEAP | 8 | hunyuan-t1, hunyuan-2.0-thinking/instruct, hunyuan-turbos, tc-auto, kimi-k2.5, minimax-m2.5, glm-5 | ✓ | 缺失 | 夜测当晚 API Key 未续期失效 |
| 无问芯穹-Coding | Infini-AI | 5 | kimi-k2.5, minimax-m2.5, minimax-m2.7, glm-5, deepseek-v3.2-thinking | ✓ | ✓ | — |
| 优云智算-Coding | ModelVerse | 2 | kimi-k2.5, minimax-m2.1 | 全部失败 | 全部失败 | 账号异常,不纳入比较 |
各平台月费档位、配额限制、当前促销及社区口碑。数据以官网为准,交叉验证 V2EX / 知乎 / 即刻等社区讨论,更新于 2026-03-29。
| 提供商 | 档位 | 月费 | 首月促销 | 配额(5h / 周 / 月) | 模型数 | 社区口碑 |
|---|---|---|---|---|---|---|
| 火山-Coding 方舟 Coding Plan · 字节跳动 |
Lite | ¥40/月 | ¥9.9 | 1,200次 / — / — | 6 | V2EX 差评较多:高峰 20s+ 等待、配额消耗快(按 API 请求计数非 prompt)。doubao-seed-2.0-pro 速度尚可,但其他模型体验不稳定。首购限量每日 10:30 抢购。 |
| Pro | ¥200/月 | ¥49.9 | 6,000次 / — / — | 6 | ||
| Max | ¥400/月 | — | — / — / — | 6 | ||
| GLM-Coding 智谱 BigModel · 2026.02.12 涨价 30% |
Lite | ¥49/月 | 已取消 | 80 prompt / 400 / — | 6 | 模型质量公认最强(GLM-5 对标 Opus 4.6),但涨价后争议大。Lite 用户投诉 2 个 prompt 消耗 97% 额度。GLM-5 仅 Pro/Max 可用且消耗 3 倍配额。年付 Lite 仅 ¥34/月。 |
| Pro | ¥149/月 | 已取消 | 400 prompt / 2,000 / — | 7+ | ||
| Max | ¥469/月 | 已取消 | 1,600 prompt / 8,000 / — | 7+ | ||
| KIMI-Coding 月之暗面 · kimi-k2.5 专属 |
Andante | ¥49/月 | 年付 ¥39/月 | — / ~26 prompt / — | 1 | 前端/视觉编码强(截图还原 80-90%),K2.5 代码专项训练。但周配额极紧(Andante 仅 ~26 轮/周),后端能力平庸。Allegretto 起支持 Agent Swarm 多智能体并行。 |
| Moderato | ¥99/月 | 年付 ¥79/月 | — / ~104 prompt / — | 1 | ||
| Allegretto | ¥199/月 | — | — / ~520 prompt / — | 1 | ||
| Allegro | ¥699/月 | — | — / ~1,560 prompt / — | 1 | ||
| MiniMax Token Plan · 2026.03.23 起新增周配额 |
标准 Starter | ¥29/月 | 年付 ¥24/月 | 600次 / ~6,000 / — | 1 | M2.7 被称「国产 SOTA」(SWE-Pro 56%),速度 ~100 TPS。¥29 起步性价比高。3/23 起新增周配额 + 高峰限速(工作日 15:00-17:30),部分用户不满。极速版延迟更低。 |
| 标准 Plus | ¥49/月 | 年付 ¥41/月 | 1,500次 / ~15,000 / — | 1 | ||
| 标准 Max | ¥119/月 | 年付 ¥99/月 | 4,500次 / ~45,000 / — | 1 | ||
| 极速 Plus | ¥98/月 | 年付 ¥82/月 | 1,500次 / ~15,000 / — | 1 | ||
| 极速 Max | ¥199/月 | 年付 ¥166/月 | 4,500次 / ~45,000 / — | 1 | ||
| 极速 Ultra | ¥899/月 | 年付 ¥749/月 | 30,000次 / ~300,000 / — | 1 | ||
| 阿里CodingPlan 阿里云百炼 · Lite 已停售新用户 |
Lite(停售) | ¥40/月 | ¥7.9 | ~2,000次 / ~9,000 / 18,000 | 8 | 模型最多(8 款跨 4 厂商),¥7.9 首月最低。但按自然月计费(月末买亏)、非阿里模型无缓存(配额消耗更快)、输出低至 2.4 TPS、内容审查严格(403 封禁)。Lite 已对新用户停售。 |
| Pro | ¥200/月 | ¥39.9 | 6,000次 / 45,000 / 90,000 | 8 | ||
| 腾讯CodingPlan 腾讯云 LKEAP · 优惠至 4/19 |
Lite | ¥40/月 | ¥7.9(次月 ¥20) | ~1,200次 / ~9,000 / 18,000 | 4+ | 3/5 新上线,双协议支持(OpenAI + Anthropic),含混元自研模型。新推 Token Plan 被社区猛批「比 Coding Plan 贵数倍」。混元模型在独立测评中推理任务交白卷。企业生态集成是优势。 |
| Pro | ¥200/月 | ¥39.9(次月 ¥100) | ~6,000次 / ~45,000 / 90,000 | 4+ | ||
| 无问芯穹-Coding Infini-AI · 多模型聚合 |
Lite | ¥40/月 | 前 2 月 ¥19.9 | 1,000次 / 6,000 / 12,000 | 8 | 促销价 ¥19.9 性价比高,正价 ¥40 与阿里持平。无 RPM/TPM 限制,适合轻度使用。品牌知名度低,售后响应慢,模型更新不及大厂。 |
| Pro | ¥200/月 | 前 2 月 ¥99.9 | 5,000次 / 30,000 / 60,000 | 8 | ||
| 硅基流动(参照组) SiliconFlow · 按量付费 · 非订阅制 |
GLM-5 Pro | ¥4+22/M tok | — | RPM 500–10,000(按充值等级) | 30+ | 纯按量付费,无月费。社区评价「体验丝滑」「把价格打下来了」。新注册送 ¥7 额度。R1 高峰可能等待数分钟。适合按需调用、多模型实验。 |
| Kimi-K2.5 Pro | ¥4+21/M tok | — | 同上 | — | ||
| DeepSeek-V3.2 | ¥2+3/M tok | — | 同上 | — |
所有模型 × 4 档上下文。热力图色阶基于绝对阈值,与实际使用体验对应。
| @100 tokens | @1K tokens | @10K tokens | @100K tokens | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 套餐 | 模型 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 |
| GLM-Coding | glm-4.5 | 1.13 | 56 | 6.97 | 1.86 | 57 | 11.57 | 2.78 | 76 | 6.68 | 11.72 | 33 | 22.04 |
| GLM-Coding | glm-4.5-air | 1.11 | 97 | 3.48 | 1.10 | 121 | 3.33 | 1.89 | 103 | 4.74 | 18.77 | 75 | 23.64 |
| GLM-Coding | glm-4.6 | 2.64 | 54 | 9.45 | 1.80 | 65 | 9.95 | 2.44 | 64 | 7.36 | 14.26 | 19 | 34.87 |
| GLM-Coding | glm-4.7 | 6.73 | 25 | 22.52 | 1.12 | 53 | 9.10 | 3.16 | 64 | 7.62 | 8.83 | 57 | 18.66 |
| GLM-Coding | glm-5 | 3.88 | 28 | 12.57 | 3.87 | 30 | 12.76 | 7.82 | 23 | 18.73 | 6.47 | 28 | 16.50 |
| GLM-Coding | glm-5-turbo | 1.19 | 51 | 7.72 | 1.07 | 49 | 7.69 | 1.43 | 53 | 7.36 | 5.39 | 56 | 11.20 |
| 火山-Coding | deepseek-v3.2 | 2.77 | 32 | 10.78 | 2.21 | 31 | 10.50 | 5.66 | 31 | 16.04 | 18.30 | 30 | 27.81 |
| 火山-Coding | doubao-seed-2.0-code | 10.04 | 48 | 16.84 | 9.45 | 47 | 16.47 | 12.00 | 51 | 18.31 | 45.12 | 53 | 51.20 |
| 火山-Coding | doubao-seed-2.0-pro | 2.18 | 84 | 6.04 | 2.39 | 86 | 6.20 | 3.29 | 76 | 7.55 | 12.18 | 77 | 16.36 |
| 火山-Coding | doubao-seed-code | 1.56 | 37 | 10.36 | 1.34 | 38 | 9.77 | 2.62 | 37 | 11.22 | 18.17 | 40 | 26.20 |
| 火山-Coding | glm-4.7 | 28.86 | 32 | 39.36 | 27.06 | 36 | 37.13 | 21.52 | 27 | 33.66 | 80.07 | 42 | 87.95 |
| 火山-Coding | kimi-k2.5 | 17.50 | 25 | 30.56 | 17.09 | 24 | 30.80 | 22.82 | 23 | 36.70 | 89.98 | 22 | 104.35 |
| 阿里CodingPlan | glm-4.7 | 3.24 | 74 | 7.60 | 3.95 | 78 | 8.09 | 2.76 | 41 | 12.17 | 14.15 | 66 | 20.21 |
| 阿里CodingPlan | glm-5 | 1.53 | 30 | 12.38 | 7.33 | 36 | 16.54 | 8.20 | 36 | 17.26 | 12.01 | 32 | 22.06 |
| 阿里CodingPlan | kimi-k2.5 | 23.35 | 38 | 30.19 | 10.94 | 34 | 21.55 | 6.75 | 39 | 14.51 | 28.75 | 29 | 51.19 |
| 阿里CodingPlan | minimax-m2.5 | 4.12 | 45 | 11.77 | 4.74 | 61 | 10.14 | 4.52 | 66 | 9.43 | 13.11 | 35 | 29.01 |
| 阿里CodingPlan | qwen3-coder-next | 3.98 | 147 | 6.24 | 3.51 | 104 | 6.79 | 11.58 | 67 | 24.88 | 15.28 | 92 | 18.88 |
| 阿里CodingPlan | qwen3-coder-plus | 3.04 | 46 | 8.20 | 3.22 | 47 | 9.61 | 4.41 | 53 | 10.15 | 28.09 | 66 | 32.74 |
| 阿里CodingPlan | qwen3-max-2026-01-23 | 2.49 | 31 | 11.59 | 2.37 | 32 | 12.07 | 4.88 | 30 | 15.20 | 11.02 | 33 | 20.41 |
| 阿里CodingPlan | qwen3.5-plus | 3.73 | 61 | 8.97 | 4.54 | 64 | 9.53 | 4.48 | 76 | 8.93 | 8.58 | 125 | 11.19 |
| MiniMax-Coding | m2.1 | 4.12 | 42 | 11.76 | 1.57 | 48 | 8.23 | 2.44 | 45 | 9.58 | 4.64 | 43 | 12.08 |
| MiniMax-Coding | m2.5 | 2.12 | 36 | 11.06 | 1.42 | 51 | 7.59 | 5.54 | 48 | 13.32 | 8.34 | 102 | 12.80 |
| MiniMax-Coding | m2.7 | 2.06 | 37 | 10.63 | 1.98 | 43 | 9.47 | 2.03 | 43 | 9.47 | 5.28 | 42 | 12.90 |
| KIMI-Coding | kimi-for-coding | 3.85 | 31 | 12.21 | 5.39 | 34 | 13.37 | 5.71 | 35 | 14.23 | 11.20 | 48 | 17.28 |
| 无问芯穹-Coding | deepseek-v3.2-thinking | 2.96 | 26 | 15.06 | 3.70 | 26 | 16.26 | 3.26 | 24 | 16.82 | — | — | — |
| 无问芯穹-Coding | glm-5 | 3.42 | 26 | 15.63 | 4.66 | 33 | 14.44 | 3.70 | 29 | 14.66 | 9.26 | 30 | 20.09 |
| 无问芯穹-Coding | kimi-k2.5 | 38.17 | 25 | 51.10 | 14.61 | 26 | 27.02 | 7.76 | 25 | 20.78 | 18.87 | 25 | 31.97 |
| 无问芯穹-Coding | minimax-m2.5 | 4.54 | 50 | 11.01 | 4.28 | 52 | 10.61 | 5.30 | 51 | 11.74 | 6.88 | 57 | 12.55 |
| 无问芯穹-Coding | minimax-m2.7 | 3.67 | 47 | 10.50 | 3.19 | 53 | 9.43 | 3.87 | 53 | 9.95 | 7.49 | 48 | 14.26 |
| 腾讯CodingPlan | auto | 5.39 | 28 | 16.58 | 2.27 | 37 | 11.13 | 3.94 | 34 | 13.27 | 5.63 | 33 | 15.58 |
| 腾讯CodingPlan | hunyuan-2.0-instruct | 1.35 | 42 | 8.57 | 1.65 | 52 | 7.56 | 3.08 | 68 | 8.50 | 10.82 | 62 | 16.13 |
| 腾讯CodingPlan | hunyuan-2.0-thinking | 1.15 | 83 | 4.98 | 1.34 | 85 | 5.15 | 2.51 | 76 | 6.73 | 16.24 | 87 | 19.87 |
| 腾讯CodingPlan | minimax-m2.5 | 1.72 | 31 | 11.97 | 1.33 | 41 | 9.16 | 1.92 | 40 | 9.85 | 3.24 | 43 | 10.66 |
| 腾讯CodingPlan | kimi-k2.5 | 2.46 | 29 | 13.76 | 0.96 | 37 | 9.73 | 12.38 | 44 | 19.60 | 13.43 | 47 | 20.39 |
| 腾讯CodingPlan | glm-5 | 3.96 | 28 | 33.88 | 2.02 | 32 | 12.66 | 2.64 | 30 | 13.76 | 5.18 | 39 | 13.54 |
| 腾讯CodingPlan | hunyuan-t1 | 1.05 | 76 | 5.30 | 1.20 | 84 | 4.99 | 2.35 | 61 | 7.69 | 6.01 | 58 | 11.47 |
| 腾讯CodingPlan | hunyuan-turbos | 1.24 | 29 | 10.69 | 1.84 | 29 | 12.71 | 2.56 | 29 | 13.52 | 6.82 | 29 | 18.04 |
| 硅基流动-Pro | minimax-m2.5 | 2.19 | 72 | 7.96 | 1.61 | 85 | 6.23 | 1.89 | 79 | 6.41 | 3.77 | 74 | 8.62 |
| 硅基流动-Pro | glm-5 | 2.20 | 37 | 11.32 | 1.50 | 44 | 8.73 | 3.04 | 36 | 12.17 | 6.36 | 24 | 21.31 |
| 硅基流动-Pro | kimi-k2.5 | 0.99 | 29 | 12.26 | 1.37 | 29 | 12.39 | 1.75 | 33 | 11.59 | 5.65 | 30 | 16.31 |
| 硅基流动-Pro | glm-4.7 | 3.59 | 66 | 8.42 | 0.78 | 70 | 5.33 | 1.43 | 71 | 5.98 | 10.71 | 64 | 15.77 |
| 硅基流动-Pro | deepseek-v3.2 | 2.51 | 9 | 57.77 | 9.28 | 29 | 22.11 | 7.95 | 27 | 21.22 | 12.35 | 23 | 29.27 |
| 硅基流动-Pro | deepseek-v3.1-terminus | 1.02 | 21 | 12.24 | 1.36 | 20 | 14.51 | 1.66 | 20 | 14.50 | 5.38 | 20 | 17.55 |
| 优云智算-Coding | kimi-k2.5 | — | — | — | — | — | — | — | — | — | — | — | — |
| 优云智算-Coding | minimax-m2.1 | — | — | — | — | — | — | — | — | — | — | — | — |
| @100 tokens | @1K tokens | @10K tokens | @100K tokens | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 套餐 | 模型 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 | TTFT | TPS | 耗时 |
| GLM-Coding | glm-4.5 | 1.71 | 130 | 4.11 | 1.78 | 157 | 3.71 | 2.15 | 142 | 4.04 | 7.32 | 129 | 9.83 |
| GLM-Coding | glm-4.5-air | 1.89 | 84 | 4.97 | 1.87 | 110 | 4.38 | 2.73 | 76 | 6.51 | 18.22 | 72 | 22.88 |
| GLM-Coding | glm-4.6 | 1.78 | 47 | 9.43 | 1.75 | 66 | 7.08 | 5.14 | 97 | 9.51 | 9.29 | 92 | 12.92 |
| GLM-Coding | glm-4.7 | 1.94 | 73 | 6.17 | 2.11 | 60 | 6.99 | 7.65 | 78 | 12.97 | 5.31 | 117 | 7.93 |
| GLM-Coding | glm-5 | 3.58 | 38 | 10.26 | 2.21 | 39 | 8.63 | 5.42 | 33 | 13.04 | 7.85 | 32 | 16.90 |
| GLM-Coding | glm-5-turbo | 1.75 | 65 | 6.81 | 1.90 | 62 | 7.75 | 2.39 | 77 | 6.36 | 7.09 | 70 | 11.74 |
| 火山-Coding | deepseek-v3.2 | 2.67 | 29 | 11.15 | 2.96 | 29 | 12.26 | 9.78 | 29 | 20.21 | 44.60 | 30 | 54.57 |
| 火山-Coding | doubao-seed-2.0-code | 3.38 | 49 | 9.92 | 5.98 | 64 | 11.11 | 6.29 | 69 | 11.06 | 29.30 | 59 | 34.74 |
| 火山-Coding | doubao-seed-2.0-pro | 3.02 | 91 | 6.59 | 2.35 | 101 | 5.57 | 6.91 | 93 | 10.38 | 20.65 | 80 | 24.68 |
| 火山-Coding | doubao-seed-code | 1.93 | 54 | 7.84 | 2.02 | 49 | 8.70 | 3.97 | 51 | 10.34 | 23.38 | 54 | 29.31 |
| 火山-Coding | glm-4.7 | 2.71 | 40 | 10.89 | 3.41 | 35 | 13.86 | 6.46 | 39 | 14.63 | 39.86 | 37 | 48.65 |
| 火山-Coding | kimi-k2.5 | 2.08 | 18 | 20.11 | 2.10 | 19 | 18.88 | 4.46 | 16 | 25.27 | 30.87 | 16 | 51.72 |
| 阿里CodingPlan | glm-4.7 | 1.85 | 73 | 6.29 | 2.23 | 80 | 6.27 | 2.83 | 82 | 6.79 | 8.83 | 87 | 12.55 |
| 阿里CodingPlan | glm-5 | 2.37 | 37 | 11.11 | 2.09 | 43 | 9.74 | 2.92 | 38 | 11.40 | 11.22 | 35 | 20.52 |
| 阿里CodingPlan | kimi-k2.5 | 5.65 | 21 | 22.78 | 5.31 | 17 | 28.02 | 6.24 | 20 | 24.26 | 9.20 | 41 | 16.73 |
| 阿里CodingPlan | minimax-m2.5 | 5.27 | 73 | 9.85 | 4.44 | 62 | 9.66 | 5.35 | 62 | 10.57 | 9.16 | 53 | 15.21 |
| 阿里CodingPlan | qwen3-coder-next | 2.51 | 84 | 13.39 | 2.00 | 139 | 4.44 | 2.64 | 131 | 5.06 | 11.76 | 128 | 14.24 |
| 阿里CodingPlan | qwen3-coder-plus | 1.96 | 49 | 6.86 | 2.49 | 49 | 8.88 | 2.86 | 50 | 8.94 | 19.36 | 69 | 23.89 |
| 阿里CodingPlan | qwen3-max-2026-01-23 | 3.94 | 31 | 13.28 | 1.99 | 32 | 11.05 | 6.04 | 31 | 15.95 | 20.38 | 34 | 29.63 |
| 阿里CodingPlan | qwen3.5-plus | 2.30 | 53 | 8.42 | 2.32 | 58 | 7.91 | 5.63 | 96 | 8.98 | 7.37 | 118 | 11.38 |
| MiniMax-Coding | m2.1 | 2.98 | 45 | 10.94 | 2.41 | 49 | 9.97 | 2.80 | 65 | 7.78 | 8.74 | 53 | 17.31 |
| MiniMax-Coding | m2.5 | 3.13 | 62 | 8.35 | 2.86 | 52 | 9.84 | 3.87 | 64 | 8.89 | 7.85 | 39 | 22.50 |
| MiniMax-Coding | m2.7 | 2.90 | 53 | 9.05 | 2.04 | 51 | 8.36 | 2.76 | 66 | 7.72 | 6.31 | 51 | 12.60 |
| KIMI-Coding | kimi-for-coding | 3.08 | 27 | 12.14 | 3.73 | 28 | 13.53 | 3.41 | 30 | 13.27 | 7.70 | 35 | 16.64 |
| 无问芯穹-Coding | deepseek-v3.2-thinking | 2.70 | 28 | 14.18 | 2.71 | 29 | 13.70 | 3.66 | 27 | 15.88 | — | — | — |
| 无问芯穹-Coding | glm-5 | 2.36 | 32 | 12.45 | 2.35 | 38 | 10.96 | 3.27 | 32 | 13.23 | 8.97 | 32 | 19.05 |
| 无问芯穹-Coding | kimi-k2.5 | 2.38 | 28 | 13.92 | 3.97 | 27 | 16.04 | 3.29 | 25 | 15.96 | 9.60 | 26 | 21.81 |
| 无问芯穹-Coding | minimax-m2.5 | 4.14 | 62 | 9.42 | 4.16 | 70 | 8.92 | 9.95 | 64 | 15.04 | 8.19 | 63 | 13.85 |
| 无问芯穹-Coding | minimax-m2.7 | 4.12 | 47 | 11.12 | 3.25 | 50 | 9.76 | 3.99 | 49 | 10.62 | 6.69 | 50 | 13.21 |
| 腾讯CodingPlan | auto | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | hunyuan-2.0-instruct | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | hunyuan-2.0-thinking | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | minimax-m2.5 | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | kimi-k2.5 | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | glm-5 | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | hunyuan-t1 | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 腾讯CodingPlan | hunyuan-turbos | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — | 缺失 | — | — |
| 硅基流动-Pro | minimax-m2.5 | 2.23 | 46 | 50.84 | 2.47 | 88 | 6.17 | 5.16 | 97 | 8.50 | 4.10 | 76 | 8.36 |
| 硅基流动-Pro | glm-5 | 0.78 | 57 | 6.40 | 0.78 | 61 | 6.04 | 0.98 | 55 | 6.82 | 3.77 | 48 | 10.52 |
| 硅基流动-Pro | kimi-k2.5 | 1.72 | 44 | 9.60 | 1.16 | 52 | 8.08 | 1.20 | 48 | 9.74 | 3.66 | 53 | 10.34 |
| 硅基流动-Pro | glm-4.7 | 0.60 | 73 | 4.96 | 0.76 | 77 | 4.91 | 0.75 | 74 | 5.08 | 2.45 | 77 | 6.61 |
| 硅基流动-Pro | deepseek-v3.2 | 2.60 | 34 | 12.10 | 2.49 | 31 | 13.04 | 4.29 | 34 | 13.85 | 6.93 | 18 | 30.10 |
| 硅基流动-Pro | deepseek-v3.1-terminus | 1.64 | 20 | 13.25 | 2.46 | 19 | 16.94 | 2.11 | 18 | 16.68 | 7.45 | 17 | 23.03 |
| 优云智算-Coding | kimi-k2.5 | — | — | — | — | — | — | — | — | — | — | — | — |
| 优云智算-Coding | minimax-m2.1 | — | — | — | — | — | — | — | — | — | — | — | — |
随上下文从 100 增长到 100K tokens,各模型 TPS 的保持情况(白天数据)。TPS 保持率 = TPS@100K ÷ TPS@100(越高越好,100% = 无衰减)。耗时倍增 = 总耗时@100K ÷ 总耗时@100。按保持率升序排列,衰减最严重的在上方。
| 套餐 | 模型 | TPS @100 | TPS @1K | TPS @10K | TPS @100K | TPS 保持率 | 耗时 @100 | 耗时 @100K | 耗时倍增 |
|---|---|---|---|---|---|---|---|---|---|
| GLM-Coding | glm-4.6 | 54 | 65 | 64 | 19 | 35% | 9.4s | 34.9s | 3.7× |
| GLM-Coding | glm-4.5 | 56 | 57 | 76 | 33 | 59% | 7.0s | 22.0s | 3.2× |
| 阿里CodingPlan | qwen3-coder-next | 147 | 104 | 67 | 92 | 62% | 6.2s | 18.9s | 3.0× |
| 硅基流动-Pro | glm-5 | 37 | 44 | 36 | 24 | 64% | 11.3s | 21.3s | 1.9× |
| 阿里CodingPlan | kimi-k2.5 | 38 | 34 | 39 | 29 | 77% | 30.2s | 51.2s | 1.7× |
| 腾讯CodingPlan | hunyuan-t1 | 76 | 84 | 61 | 58 | 77% | 5.3s | 11.5s | 2.2× |
| 阿里CodingPlan | minimax-m2.5 | 45 | 61 | 66 | 35 | 77% | 11.8s | 29.0s | 2.5× |
| GLM-Coding | glm-4.5-air | 97 | 121 | 103 | 75 | 77% | 3.5s | 23.6s | 6.8× |
| 阿里CodingPlan | glm-4.7 | 74 | 78 | 41 | 66 | 89% | 7.6s | 20.2s | 2.7× |
| 火山-Coding | kimi-k2.5 | 25 | 24 | 23 | 22 | 91% | 30.6s | 104.3s | 3.4× |
| 火山-Coding | doubao-seed-2.0-pro | 84 | 86 | 76 | 77 | 92% | 6.0s | 16.4s | 2.7× |
| 硅基流动-Pro | deepseek-v3.1-terminus | 21 | 20 | 20 | 20 | 94% | 12.2s | 17.6s | 1.4× |
| 硅基流动-Pro | glm-4.7 | 66 | 70 | 71 | 64 | 96% | 8.4s | 15.8s | 1.9× |
| 火山-Coding | deepseek-v3.2 | 32 | 31 | 31 | 30 | 96% | 10.8s | 27.8s | 2.6× |
| 无问芯穹-Coding | kimi-k2.5 | 25 | 26 | 25 | 25 | 99% | 51.1s | 32.0s | 0.6× |
| 腾讯CodingPlan | hunyuan-turbos | 29 | 29 | 29 | 29 | 99% | 10.7s | 18.0s | 1.7× |
| GLM-Coding | glm-5 | 28 | 30 | 23 | 28 | 100% | 12.6s | 16.5s | 1.3× |
| 无问芯穹-Coding | minimax-m2.7 | 47 | 53 | 53 | 48 | 102% | 10.5s | 14.3s | 1.4× |
| 硅基流动-Pro | minimax-m2.5 | 72 | 85 | 79 | 74 | 102% | 8.0s | 8.6s | 1.1× |
| MiniMax-Coding | m2.1 | 42 | 48 | 45 | 43 | 103% | 11.8s | 12.1s | 1.0× |
| 硅基流动-Pro | kimi-k2.5 | 29 | 29 | 33 | 30 | 104% | 12.3s | 16.3s | 1.3× |
| 腾讯CodingPlan | hunyuan-2.0-thinking | 83 | 85 | 76 | 87 | 104% | 5.0s | 19.9s | 4.0× |
| 阿里CodingPlan | qwen3-max-2026-01-23 | 31 | 32 | 30 | 33 | 104% | 11.6s | 20.4s | 1.8× |
| 阿里CodingPlan | glm-5 | 30 | 36 | 36 | 32 | 108% | 12.4s | 22.1s | 1.8× |
| 火山-Coding | doubao-seed-code | 37 | 38 | 37 | 40 | 110% | 10.4s | 26.2s | 2.5× |
| GLM-Coding | glm-5-turbo | 51 | 49 | 53 | 56 | 110% | 7.7s | 11.2s | 1.5× |
| 火山-Coding | doubao-seed-2.0-code | 48 | 47 | 51 | 53 | 111% | 16.8s | 51.2s | 3.0× |
| 无问芯穹-Coding | minimax-m2.5 | 50 | 52 | 51 | 57 | 112% | 11.0s | 12.6s | 1.1× |
| MiniMax-Coding | m2.7 | 37 | 43 | 43 | 42 | 113% | 10.6s | 12.9s | 1.2× |
| 无问芯穹-Coding | glm-5 | 26 | 33 | 29 | 30 | 114% | 15.6s | 20.1s | 1.3× |
| 腾讯CodingPlan | auto | 28 | 37 | 34 | 33 | 114% | 16.6s | 15.6s | 0.9× |
| 火山-Coding | glm-4.7 | 32 | 36 | 27 | 42 | 129% | 39.4s | 88.0s | 2.2× |
| 腾讯CodingPlan | minimax-m2.5 | 31 | 41 | 40 | 43 | 138% | 12.0s | 10.7s | 0.9× |
| 腾讯CodingPlan | glm-5 | 28 | 32 | 30 | 39 | 142% | 33.9s | 13.5s | 0.4× |
| 阿里CodingPlan | qwen3-coder-plus | 46 | 47 | 53 | 66 | 143% | 8.2s | 32.7s | 4.0× |
| 腾讯CodingPlan | hunyuan-2.0-instruct | 42 | 52 | 68 | 62 | 149% | 8.6s | 16.1s | 1.9× |
| KIMI-Coding | kimi-for-coding | 31 | 34 | 35 | 48 | 158% | 12.2s | 17.3s | 1.4× |
| 腾讯CodingPlan | kimi-k2.5 | 29 | 37 | 44 | 47 | 164% | 13.8s | 20.4s | 1.5× |
| 阿里CodingPlan | qwen3.5-plus | 61 | 64 | 76 | 125 | 204% | 9.0s | 11.2s | 1.2× |
| GLM-Coding | glm-4.7 | 25 | 53 | 64 | 57 | 228% | 22.5s | 18.7s | 0.8× |
| 硅基流动-Pro | deepseek-v3.2 | 9 | 29 | 27 | 23 | 248% | 57.8s | 29.3s | 0.5× |
| MiniMax-Coding | m2.5 | 36 | 51 | 48 | 102 | 285% | 11.1s | 12.8s | 1.2× |
| 无问芯穹-Coding | deepseek-v3.2-thinking | 26 | 26 | 24 | — | — | 15.1s | — | — |
相同基础模型在不同平台上的表现差异(白天数据),揭示平台基础设施和调度能力的差距。@100 和 @100K 两档对比。
| 平台 | TTFT @100 | TPS @100 | 耗时 @100 | TTFT @100K | TPS @100K | 耗时 @100K |
|---|---|---|---|---|---|---|
| 硅基流动 | 0.99 | 29 | 12.26 | 5.65 | 30 | 16.31 |
| 腾讯 | 2.46 | 29 | 13.76 | 13.43 | 47 | 20.39 |
| KIMI | 3.85 | 31 | 12.21 | 11.20 | 48 | 17.28 |
| 火山 | 17.50 | 25 | 30.56 | 89.98 | 22 | 104.35 |
| 阿里 | 23.35 | 38 | 30.19 | 28.75 | 29 | 51.19 |
| 无问芯穹 | 38.17 | 25 | 51.10 | 18.87 | 25 | 31.97 |
| 平台 | TTFT @100 | TPS @100 | 耗时 @100 | TTFT @100K | TPS @100K | 耗时 @100K |
|---|---|---|---|---|---|---|
| GLM | 1.19 | 51 | 7.72 | 5.39 | 56 | 11.20 |
| 阿里 | 1.53 | 30 | 12.38 | 12.01 | 32 | 22.06 |
| 硅基流动 | 2.20 | 37 | 11.32 | 6.36 | 24 | 21.31 |
| 无问芯穹 | 3.42 | 26 | 15.63 | 9.26 | 30 | 20.09 |
| GLM | 3.88 | 28 | 12.57 | 6.47 | 28 | 16.50 |
| 腾讯 | 3.96 | 28 | 33.88 | 5.18 | 39 | 13.54 |
| 平台 | TTFT @100 | TPS @100 | 耗时 @100 | TTFT @100K | TPS @100K | 耗时 @100K |
|---|---|---|---|---|---|---|
| 腾讯 | 1.72 | 31 | 11.97 | 3.24 | 43 | 10.66 |
| MiniMax | 2.12 | 36 | 11.06 | 8.34 | 102 | 12.80 |
| 硅基流动 | 2.19 | 72 | 7.96 | 3.77 | 74 | 8.62 |
| 阿里 | 4.12 | 45 | 11.77 | 13.11 | 35 | 29.01 |
| 无问芯穹 | 4.54 | 50 | 11.01 | 6.88 | 57 | 12.55 |
| 平台 | TTFT @100 | TPS @100 | 耗时 @100 | TTFT @100K | TPS @100K | 耗时 @100K |
|---|---|---|---|---|---|---|
| 硅基流动 | 2.51 | 9 | 57.77 | 12.35 | 23 | 29.27 |
| 火山 | 2.77 | 32 | 10.78 | 18.30 | 30 | 27.81 |
| 无问芯穹 | 2.96 | 26 | 15.06 | — | — | — |
基于白天实测数据的加权综合评分。TTFT 体验占 40%(对数评分,越低越好),TPS 体验占 60%(平方根评分,越高越好),按 4 档上下文加权(@100 30% + @1K 30% + @10K 25% + @100K 15%)得出基础分。再根据 @100K 昼夜 TTFT 劣化幅度施加惩罚系数(>200% → ×0.70,>100% → ×0.80,>50% → ×0.90,>20% → ×0.95)。无夜间数据的模型不扣分。
| 分档得分(0.4×TTFT + 0.6×TPS) | |||||||||
|---|---|---|---|---|---|---|---|---|---|
| # | 套餐 | 模型 | @100 | @1K | @10K | @100K | 基础分 | 劣化系数 | 最终分 |
| 1 | GLM-Coding | glm-4.5-air | 90.1 | 91.1 | 87.3 | 56.2 | 84.6 | ×1.0 | 84.6 |
| 2 | 腾讯CodingPlan | hunyuan-2.0-thinking | 85.5 | 85.1 | 77.2 | 61.8 | 79.8 | 无夜间数据 | 79.8 |
| 3 | 硅基流动-Pro | minimax-m2.5 | 77.0 | 83.8 | 80.6 | 72.9 | 79.3 | ×1.0 | 79.3 |
| 4 | 腾讯CodingPlan | hunyuan-t1 | 83.7 | 85.5 | 72.4 | 62.3 | 78.2 | 无夜间数据 | 78.2 |
| 5 | 火山-Coding | doubao-seed-2.0-pro | 81.1 | 81.0 | 74.8 | 61.7 | 76.6 | ×0.95 | 72.8 |
| 6 | 阿里CodingPlan | qwen3.5-plus | 68.2 | 67.5 | 71.9 | 72.9 | 69.6 | ×1.0 | 69.6 |
| 7 | 阿里CodingPlan | qwen3-coder-next | 80.7 | 81.9 | 58.7 | 64.1 | 73.1 | ×0.95 | 69.4 |
| 8 | 腾讯CodingPlan | hunyuan-2.0-instruct | 68.6 | 71.6 | 72.6 | 57.6 | 68.9 | 无夜间数据 | 68.9 |
| 9 | GLM-Coding | glm-5-turbo | 73.4 | 73.3 | 73.0 | 62.6 | 71.7 | ×0.95 | 68.1 |
| 10 | MiniMax-Coding | m2.5 | 62.3 | 72.2 | 59.0 | 73.2 | 66.1 | ×1.0 | 66.1 |
| 11 | 腾讯CodingPlan | minimax-m2.5 | 61.4 | 68.3 | 65.1 | 62.0 | 64.5 | 无夜间数据 | 64.5 |
| 12 | MiniMax-Coding | m2.7 | 63.1 | 66.2 | 66.0 | 56.8 | 63.8 | ×1.0 | 63.8 |
| 13 | 无问芯穹-Coding | minimax-m2.7 | 62.6 | 66.5 | 64.7 | 55.9 | 63.3 | ×1.0 | 63.3 |
| 14 | GLM-Coding | glm-4.5 | 75.8 | 72.7 | 76.4 | 43.9 | 70.2 | ×0.9 | 63.2 |
| 15 | 无问芯穹-Coding | minimax-m2.5 | 61.9 | 63.3 | 60.8 | 60.5 | 61.8 | ×1.0 | 61.8 |
| 16 | 阿里CodingPlan | glm-4.7 | 74.3 | 73.8 | 62.5 | 56.1 | 68.5 | ×0.9 | 61.6 |
| 17 | MiniMax-Coding | m2.1 | 59.3 | 70.2 | 65.4 | 58.6 | 64.0 | ×0.95 | 60.8 |
| 18 | GLM-Coding | glm-4.6 | 68.6 | 76.0 | 73.2 | 33.5 | 66.7 | ×0.9 | 60.0 |
| 19 | 阿里CodingPlan | qwen3-coder-plus | 63.9 | 63.9 | 63.4 | 50.7 | 61.8 | ×0.95 | 58.7 |
| 20 | 阿里CodingPlan | minimax-m2.5 | 60.7 | 65.9 | 68.2 | 43.7 | 61.6 | ×0.95 | 58.5 |
| 21 | 火山-Coding | doubao-seed-code | 65.2 | 66.8 | 61.1 | 42.5 | 61.2 | ×0.95 | 58.2 |
| 22 | 腾讯CodingPlan | hunyuan-turbos | 62.6 | 59.8 | 57.1 | 47.6 | 58.1 | 无夜间数据 | 58.1 |
| 23 | 腾讯CodingPlan | kimi-k2.5 | 57.4 | 68.4 | 48.7 | 49.1 | 57.3 | 无夜间数据 | 57.3 |
| 24 | 腾讯CodingPlan | glm-5 | 52.5 | 60.7 | 57.4 | 55.6 | 56.6 | 无夜间数据 | 56.6 |
| 25 | GLM-Coding | glm-4.7 | 45.5 | 74.7 | 70.9 | 57.9 | 62.4 | ×0.9 | 56.2 |
| 26 | 腾讯CodingPlan | auto | 49.5 | 62.3 | 55.8 | 51.8 | 55.3 | 无夜间数据 | 55.3 |
| 27 | 硅基流动-Pro | glm-5 | 62.5 | 68.8 | 59.2 | 45.4 | 61.0 | ×0.9 | 54.9 |
| 28 | 硅基流动-Pro | kimi-k2.5 | 64.1 | 62.0 | 62.3 | 50.1 | 60.9 | ×0.9 | 54.8 |
| 29 | 无问芯穹-Coding | deepseek-v3.2-thinking | 54.1 | 52.0 | 52.0 | — | 52.7 | 无夜间数据 | 52.7 |
| 30 | 阿里CodingPlan | glm-5 | 61.7 | 50.6 | 49.4 | 43.2 | 52.5 | ×1.0 | 52.5 |
| 31 | 硅基流动-Pro | glm-4.7 | 70.5 | 83.3 | 79.9 | 58.5 | 74.9 | ×0.7 | 52.4 |
| 32 | 硅基流动-Pro | deepseek-v3.1-terminus | 59.1 | 56.5 | 55.1 | 44.6 | 55.1 | ×0.95 | 52.4 |
| 33 | 阿里CodingPlan | qwen3-max-2026-01-23 | 58.4 | 59.4 | 51.6 | 44.6 | 54.9 | ×0.95 | 52.2 |
| 34 | 无问芯穹-Coding | glm-5 | 52.8 | 53.7 | 53.7 | 44.9 | 52.1 | ×1.0 | 52.1 |
| 35 | KIMI-Coding | kimi-for-coding | 54.5 | 52.7 | 52.7 | 51.6 | 53.1 | ×0.95 | 50.4 |
| 36 | GLM-Coding | glm-5 | 52.7 | 53.9 | 42.7 | 47.6 | 49.8 | ×1.0 | 49.8 |
| 37 | 火山-Coding | deepseek-v3.2 | 58.0 | 59.4 | 50.7 | 37.3 | 53.5 | ×0.9 | 48.1 |
| 38 | 火山-Coding | doubao-seed-2.0-code | 52.8 | 53.0 | 52.1 | 45.7 | 51.6 | ×0.9 | 46.4 |
| 39 | 硅基流动-Pro | deepseek-v3.2 | 42.9 | 44.3 | 44.9 | 37.7 | 43.1 | ×0.9 | 38.7 |
| 40 | 无问芯穹-Coding | kimi-k2.5 | 32.0 | 37.6 | 44.0 | 34.1 | 37.0 | ×0.9 | 33.3 |
| 41 | 阿里CodingPlan | kimi-k2.5 | 39.0 | 45.2 | 52.9 | 34.3 | 43.6 | ×0.7 | 30.5 |
| 42 | 火山-Coding | glm-4.7 | 35.9 | 38.0 | 33.8 | 40.9 | 36.8 | ×0.8 | 29.4 |
| 43 | 火山-Coding | kimi-k2.5 | 35.0 | 34.6 | 30.8 | 30.1 | 33.1 | ×0.8 | 26.5 |
同一评分方法,使用夜间实测数据。夜间无劣化惩罚(本身就是基准时段)。腾讯因 API Key 过期无夜间数据,不参与此表。
| 分档得分(0.4×TTFT + 0.6×TPS) | |||||||
|---|---|---|---|---|---|---|---|
| # | 套餐 | 模型 | @100 | @1K | @10K | @100K | 最终分 |
| 1 | GLM-Coding | glm-4.5 | 88.0 | 87.7 | 86.2 | 74.6 | 85.5 |
| 2 | 硅基流动-Pro | glm-4.7 | 85.6 | 85.9 | 84.9 | 77.8 | 84.3 |
| 3 | 阿里CodingPlan | qwen3-coder-next | 79.9 | 86.8 | 84.5 | 69.4 | 81.6 |
| 4 | GLM-Coding | glm-4.5-air | 82.3 | 87.3 | 76.5 | 55.4 | 78.3 |
| 5 | 阿里CodingPlan | glm-4.7 | 78.7 | 79.6 | 78.2 | 68.5 | 77.3 |
| 6 | 火山-Coding | doubao-seed-2.0-pro | 80.5 | 85.5 | 73.0 | 56.8 | 76.6 |
| 7 | 硅基流动-Pro | glm-5 | 78.4 | 79.9 | 76.3 | 62.8 | 76.0 |
| 8 | 硅基流动-Pro | minimax-m2.5 | 66.6 | 81.4 | 77.3 | 72.8 | 74.6 |
| 9 | GLM-Coding | glm-5-turbo | 76.2 | 74.5 | 78.0 | 65.1 | 74.5 |
| 10 | GLM-Coding | glm-4.7 | 78.3 | 72.9 | 67.1 | 77.9 | 73.8 |
| 11 | GLM-Coding | glm-4.6 | 68.9 | 76.6 | 77.3 | 69.6 | 73.4 |
| 12 | 阿里CodingPlan | qwen3.5-plus | 69.4 | 71.3 | 76.1 | 74.5 | 72.4 |
| 13 | 硅基流动-Pro | kimi-k2.5 | 67.8 | 74.0 | 72.1 | 65.2 | 70.4 |
| 14 | MiniMax-Coding | m2.7 | 67.3 | 69.5 | 72.9 | 59.0 | 68.1 |
| 15 | MiniMax-Coding | m2.5 | 70.2 | 67.1 | 69.0 | 51.3 | 66.1 |
| 16 | MiniMax-Coding | m2.1 | 63.7 | 67.3 | 72.4 | 56.4 | 65.8 |
| 17 | 阿里CodingPlan | minimax-m2.5 | 69.2 | 66.9 | 65.1 | 55.9 | 65.5 |
| 18 | 无问芯穹-Coding | minimax-m2.5 | 67.6 | 70.5 | 59.3 | 61.0 | 65.4 |
| 19 | 阿里CodingPlan | qwen3-coder-plus | 69.0 | 67.0 | 66.2 | 53.7 | 65.4 |
| 20 | 火山-Coding | doubao-seed-code | 71.2 | 68.7 | 63.6 | 46.1 | 64.8 |
| 21 | 火山-Coding | doubao-seed-2.0-code | 64.3 | 64.7 | 66.0 | 48.1 | 62.4 |
| 22 | 无问芯穹-Coding | minimax-m2.7 | 61.5 | 65.1 | 62.7 | 57.9 | 62.3 |
| 23 | 阿里CodingPlan | glm-5 | 61.9 | 65.8 | 60.6 | 45.5 | 60.3 |
| 24 | 无问芯穹-Coding | glm-5 | 59.4 | 62.5 | 56.5 | 46.3 | 57.6 |
| 25 | GLM-Coding | glm-5 | 58.7 | 63.5 | 52.2 | 47.8 | 56.9 |
| 26 | 无问芯穹-Coding | deepseek-v3.2-thinking | 56.0 | 56.6 | 52.7 | — | 55.3 |
| 27 | 硅基流动-Pro | deepseek-v3.2 | 59.6 | 58.4 | 55.0 | 40.6 | 55.2 |
| 28 | 火山-Coding | glm-4.7 | 62.2 | 57.7 | 53.4 | 38.5 | 55.1 |
| 29 | KIMI-Coding | kimi-for-coding | 54.3 | 53.1 | 55.1 | 49.5 | 53.4 |
| 30 | 阿里CodingPlan | qwen3-max-2026-01-23 | 54.2 | 60.8 | 50.0 | 38.2 | 52.7 |
| 31 | 无问芯穹-Coding | kimi-k2.5 | 57.1 | 51.9 | 52.5 | 42.3 | 52.2 |
| 32 | 硅基流动-Pro | deepseek-v3.1-terminus | 55.2 | 51.3 | 51.8 | 39.1 | 50.8 |
| 33 | 火山-Coding | deepseek-v3.2 | 56.7 | 55.8 | 43.8 | 34.9 | 49.9 |
| 34 | 火山-Coding | kimi-k2.5 | 52.0 | 52.6 | 43.6 | 26.0 | 46.2 |
| 35 | 阿里CodingPlan | kimi-k2.5 | 44.8 | 42.6 | 43.1 | 50.6 | 44.6 |
聚焦四大主力新模型(Kimi-K2.5、GLM-5、MiniMax-M2.7、Qwen3.5-Plus)在各平台的白天/夜间表现。小模型(GLM-4.5-air 等)更适合工作流和系统集成,单独点评见上方评分表。
基于实测数据,按三大实际使用场景给出选型建议。每个场景对模型代际、速度、稳定性的优先级不同。
核心要求:最新大模型 + 白天稳定。开发场景直接影响编码效率,模型能力是第一优先——必须用最新代际大模型(GLM-5、Kimi-K2.5、M2.7、Qwen3.5-Plus 等),同时白天高峰期不能出现 10 倍级波动。长上下文(10K–100K)的支撑能力决定了能否处理大文件重构。早期模型(GLM-4.5-air、M2.1 等)能力不够,不适合此场景。
| 推荐 | 套餐 · 模型 | 为什么选它 | 白天实测 | 月费 |
|---|---|---|---|---|
| 能力首选 | GLM-Coding · GLM-5 | 最新旗舰(754B),社区评价对标 Opus 4.6。昼夜稳定(@100K 白天 6.47s / 夜间 7.85s,波动 -18%)。仅 Pro/Max 可用,GLM-5 消耗 3 倍配额。 | TTFT 3.88s · TPS 28 · @100K 总耗时 16.5s | ¥149/月 |
| 前端首选 | KIMI-Coding · kimi-for-coding | K2.5 代码专项训练,前端/视觉编码极强(截图还原 80-90%)。自有平台白天 @100K TTFT 11.20s,昼夜波动仅 +45%,本次最稳定的新大模型之一。 | TTFT 3.85s · TPS 31 · @100K 总耗时 17.3s | ¥49/月 |
| 高吞吐 | 阿里 · Qwen3.5-Plus | 唯一 TPS 随上下文逆增的大模型(61→125)。@100K 总耗时仅 11.19s,阿里平台最快。适合大文件重构。 | TTFT 3.73s · TPS 61→125 · @100K 11.2s | ¥200/月 |
| 速度均衡 | MiniMax · M2.7-highspeed | M2.7 被称「国产 SOTA」(SWE-Pro 56%),极速版 TPS 57–64,@100K 总耗时 10.9s。3/23 起新增周配额需注意。 | TPS 57–64 · @100K 10.9s | ¥98/月 |
核心要求:速度优先 + 昼夜稳定,模型代际可用中上代。OpenClaw 通过微信/飞书/Telegram 等消息平台下发指令,执行文件操作、Shell 命令等任务。用户发完消息后等待首字是主要体感摩擦点(TTFT < 3s 为佳)。中代际模型(GLM-4.7、M2.7、GLM-4.5-air 等)在 tool calling 可靠性上已足够。避免 thinking/推理模型(会导致智能体长时间无响应)。
| 推荐 | 套餐 · 模型 | 为什么选它 | 实测数据 | 月费 |
|---|---|---|---|---|
| 首选 | 硅基流动 · GLM-4.7 | 夜间 TTFT 0.60s 全场最快,白天 3.59s 可接受。TPS 64–77 全档稳定,上下文保持率 96%。按量无月费。 | TTFT 0.60–3.59s · TPS 64–77 | 按量付费 |
| 月套餐 | GLM-Coding · GLM-4.5-air | TTFT 1.11s,TPS 97 出字流畅。昼夜稳定,消息端体验丝滑。Lite 即可覆盖。 | TTFT 1.11s · TPS 97 | ¥49/月 |
| 新大模型 | MiniMax · M2.7 标准 | ¥29 起步,M2.7 SWE-Pro 56%,速度 TPS 37–43。tool calling 可靠,适合自动化。如果需要更强能力可选新大模型。 | TTFT 2.06s · TPS 37–43 | ¥29/月 |
| 极速 | MiniMax · M2.7-highspeed | 极速版延迟更低,TPS 57–64。对速度敏感的自动化任务首选。 | TPS 57–64 | ¥98/月 |
核心要求:速度为最大优先。模型作为系统组件处理短平快任务(代码补全、格式转换、摘要生成),不负责长程 Agent 链。早期/小模型完全够用——GLM-4.5-air、M2.5、doubao-seed-code 等速度快、成本低。关键指标是 TPS 和 TTFT 稳定性。按量付费优于月套餐(成本可预测),需要高 RPM 限额。
| 推荐 | 套餐 · 模型 | 为什么选它 | 实测数据 | 计费 |
|---|---|---|---|---|
| 首选 | 硅基流动 · MiniMax-M2.5 | @100K 总耗时 8.62s 全场最快。TPS 72–85 全档稳定,按量付费无配额上限,RPM 按充值等级可达 10,000。早期模型但速度极致。 | TPS 72–85 · 耗时 8.0–8.6s | 按量/M tok |
| 低延迟 | 硅基流动 · GLM-4.7 | 夜间 TTFT 0.60s,TPS 64–77,四档无衰减(保持率 96%)。中代模型,性能稳定可承诺 SLA。 | TPS 64–77 · TTFT 0.60s | 按量/M tok |
| 超高吞吐 | GLM-Coding · GLM-4.5-air | TPS 97–121 出字极快,TTFT 1.11s。最适合高频短任务。早期模型但速度碾压新大模型。 | TPS 97–121 · TTFT 1.11s | ¥49/月 |
| 短上下文 | 阿里 · qwen3-coder-next | @100 TPS 147 全场最高。适合补全/格式转换等短任务。@10K+ 衰减严重,不适合长上下文。 | TPS 147(@100) · 67(@10K) | ¥200/月 |