CodingPlan 速度横评

参测阵容

套餐	平台	模型数	覆盖模型	白天	夜间	备注
火山-Coding	字节·火山引擎	6	doubao-seed-2.0-pro, doubao-seed-2.0-code, doubao-seed-code, deepseek-v3.2, glm-4.7, kimi-k2.5	✓	✓	—
GLM-Coding	智谱 BigModel	6	glm-4.5-air, glm-4.5, glm-4.6, glm-4.7, glm-5, glm-5-turbo	✓	✓	—
KIMI-Coding	月之暗面	1	kimi-for-coding	✓	✓	—
MiniMax-Coding	MiniMax	4	m2.1, m2.5, m2.7, m2.7-highspeed	✓	✓	—
阿里CodingPlan	阿里云百炼	8	qwen3-coder-next/plus, qwen3.5-plus, qwen3-max, glm-4.7, glm-5, kimi-k2.5, minimax-m2.5	✓	✓	—
硅基流动（参照组）	SiliconFlow	6	kimi-k2.5, deepseek-v3.1-terminus/v3.2, glm-4.7, glm-5, minimax-m2.5	✓	✓	无 Coding Plan，按量付费 API
腾讯CodingPlan	腾讯云 LKEAP	8	hunyuan-t1, hunyuan-2.0-thinking/instruct, hunyuan-turbos, tc-auto, kimi-k2.5, minimax-m2.5, glm-5	✓	缺失	夜测当晚 API Key 未续期失效
无问芯穹-Coding	Infini-AI	5	kimi-k2.5, minimax-m2.5, minimax-m2.7, glm-5, deepseek-v3.2-thinking	✓	✓	—
优云智算-Coding	ModelVerse	2	kimi-k2.5, minimax-m2.1	全部失败	全部失败	账号异常，不纳入比较

测试方法

指标定义: TTFT = 首 Token 延迟（越低越好）；TPS = 解码吞吐 tokens/sec（越高越好）；总耗时 = 完整响应时长（越低越好）。
合成上下文: 用 5 类代码/文档/配置模板拼接成精确 token 数的仓库快照，tiktoken cl100k_base 编码，确保不同平台收到完全相同的输入。
客户端输出截断: max_output_tokens = 320。超出后客户端主动停止消费 SSE 流，避免不同平台输出长度差异导致总耗时失真。
采样规格: 每格 5 次有效样本，网络/SSL/429/5xx 自动重试。4 档上下文：100 / 1K / 10K / 100K tokens。
昼夜双轮: 夜间批次 2026-03-21 21:55，白天批次 2026-03-24 15:35。腾讯夜间 API Key 过期导致数据缺失。
排除项: 优云智算账号状态异常，全部失败不纳入比较。无问芯穹 deepseek-v3.2-thinking @100K 两批均失败（上下文限制）。

套餐定价 & 配额

各平台月费档位、配额限制、当前促销及社区口碑。数据以官网为准，交叉验证 V2EX / 知乎 / 即刻等社区讨论，更新于 2026-03-29。

配额陷阱提醒：一次用户 prompt 在 Claude Code / Cline 中会触发 5–30 次 API 请求。标称 18,000 次/月的配额，实际可用对话轮次约 600–3,600 轮。各平台计量单位不统一（次请求 / prompt / token），直接比价需谨慎。

提供商	档位	月费	首月促销	配额（5h / 周 / 月）	模型数	社区口碑
火山-Coding 方舟 Coding Plan · 字节跳动	Lite	¥40/月	¥9.9	1,200次 / — / —	6	V2EX 差评较多：高峰 20s+ 等待、配额消耗快（按 API 请求计数非 prompt）。doubao-seed-2.0-pro 速度尚可，但其他模型体验不稳定。首购限量每日 10:30 抢购。
	Pro	¥200/月	¥49.9	6,000次 / — / —	6
	Max	¥400/月	—	— / — / —	6
GLM-Coding 智谱 BigModel · 2026.02.12 涨价 30%	Lite	¥49/月	已取消	80 prompt / 400 / —	6	模型质量公认最强（GLM-5 对标 Opus 4.6），但涨价后争议大。Lite 用户投诉 2 个 prompt 消耗 97% 额度。GLM-5 仅 Pro/Max 可用且消耗 3 倍配额。年付 Lite 仅 ¥34/月。
	Pro	¥149/月	已取消	400 prompt / 2,000 / —	7+
	Max	¥469/月	已取消	1,600 prompt / 8,000 / —	7+
KIMI-Coding 月之暗面 · kimi-k2.5 专属	Andante	¥49/月	年付 ¥39/月	— / ~26 prompt / —	1	前端/视觉编码强（截图还原 80-90%），K2.5 代码专项训练。但周配额极紧（Andante 仅 ~26 轮/周），后端能力平庸。Allegretto 起支持 Agent Swarm 多智能体并行。
	Moderato	¥99/月	年付 ¥79/月	— / ~104 prompt / —	1
	Allegretto	¥199/月	—	— / ~520 prompt / —	1
	Allegro	¥699/月	—	— / ~1,560 prompt / —	1
MiniMax Token Plan · 2026.03.23 起新增周配额	标准 Starter	¥29/月	年付 ¥24/月	600次 / ~6,000 / —	1	M2.7 被称「国产 SOTA」（SWE-Pro 56%），速度 ~100 TPS。¥29 起步性价比高。3/23 起新增周配额 + 高峰限速（工作日 15:00-17:30），部分用户不满。极速版延迟更低。
	标准 Plus	¥49/月	年付 ¥41/月	1,500次 / ~15,000 / —	1
	标准 Max	¥119/月	年付 ¥99/月	4,500次 / ~45,000 / —	1
	极速 Plus	¥98/月	年付 ¥82/月	1,500次 / ~15,000 / —	1
	极速 Max	¥199/月	年付 ¥166/月	4,500次 / ~45,000 / —	1
	极速 Ultra	¥899/月	年付 ¥749/月	30,000次 / ~300,000 / —	1
阿里CodingPlan 阿里云百炼 · Lite 已停售新用户	Lite（停售）	¥40/月	¥7.9	~2,000次 / ~9,000 / 18,000	8	模型最多（8 款跨 4 厂商），¥7.9 首月最低。但按自然月计费（月末买亏）、非阿里模型无缓存（配额消耗更快）、输出低至 2.4 TPS、内容审查严格（403 封禁）。Lite 已对新用户停售。
阿里CodingPlan 阿里云百炼 · Lite 已停售新用户	Pro	¥200/月	¥39.9	6,000次 / 45,000 / 90,000	8
腾讯CodingPlan 腾讯云 LKEAP · 优惠至 4/19	Lite	¥40/月	¥7.9（次月 ¥20）	~1,200次 / ~9,000 / 18,000	4+	3/5 新上线，双协议支持（OpenAI + Anthropic），含混元自研模型。新推 Token Plan 被社区猛批「比 Coding Plan 贵数倍」。混元模型在独立测评中推理任务交白卷。企业生态集成是优势。
腾讯CodingPlan 腾讯云 LKEAP · 优惠至 4/19	Pro	¥200/月	¥39.9（次月 ¥100）	~6,000次 / ~45,000 / 90,000	4+
无问芯穹-Coding Infini-AI · 多模型聚合	Lite	¥40/月	前 2 月 ¥19.9	1,000次 / 6,000 / 12,000	8	促销价 ¥19.9 性价比高，正价 ¥40 与阿里持平。无 RPM/TPM 限制，适合轻度使用。品牌知名度低，售后响应慢，模型更新不及大厂。
无问芯穹-Coding Infini-AI · 多模型聚合	Pro	¥200/月	前 2 月 ¥99.9	5,000次 / 30,000 / 60,000	8
硅基流动（参照组） SiliconFlow · 按量付费 · 非订阅制	GLM-5 Pro	¥4+22/M tok	—	RPM 500–10,000（按充值等级）	30+	纯按量付费，无月费。社区评价「体验丝滑」「把价格打下来了」。新注册送 ¥7 额度。R1 高峰可能等待数分钟。适合按需调用、多模型实验。
	Kimi-K2.5 Pro	¥4+21/M tok	—	同上	—
	DeepSeek-V3.2	¥2+3/M tok	—	同上	—

完整数据热力图

所有模型 × 4 档上下文。热力图色阶基于绝对阈值，与实际使用体验对应。

色阶：优秀良好一般较差很差 TTFT：≤1.5s 优秀 | 1.5-3s 良好 | 3-8s 一般 | 8-20s 较差 | >20s 很差

TPS：≥80 优秀 | 50-80 良好 | 30-50 一般 | 15-30 较差 | <15 很差。总耗时阈值随上下文档位宽松。

		@100 tokens			@1K tokens			@10K tokens			@100K tokens
套餐	模型	TTFT	TPS	耗时	TTFT	TPS	耗时	TTFT	TPS	耗时	TTFT	TPS	耗时
GLM-Coding	glm-4.5	1.13	56	6.97	1.86	57	11.57	2.78	76	6.68	11.72	33	22.04
GLM-Coding	glm-4.5-air	1.11	97	3.48	1.10	121	3.33	1.89	103	4.74	18.77	75	23.64
GLM-Coding	glm-4.6	2.64	54	9.45	1.80	65	9.95	2.44	64	7.36	14.26	19	34.87
GLM-Coding	glm-4.7	6.73	25	22.52	1.12	53	9.10	3.16	64	7.62	8.83	57	18.66
GLM-Coding	glm-5	3.88	28	12.57	3.87	30	12.76	7.82	23	18.73	6.47	28	16.50
GLM-Coding	glm-5-turbo	1.19	51	7.72	1.07	49	7.69	1.43	53	7.36	5.39	56	11.20
火山-Coding	deepseek-v3.2	2.77	32	10.78	2.21	31	10.50	5.66	31	16.04	18.30	30	27.81
火山-Coding	doubao-seed-2.0-code	10.04	48	16.84	9.45	47	16.47	12.00	51	18.31	45.12	53	51.20
火山-Coding	doubao-seed-2.0-pro	2.18	84	6.04	2.39	86	6.20	3.29	76	7.55	12.18	77	16.36
火山-Coding	doubao-seed-code	1.56	37	10.36	1.34	38	9.77	2.62	37	11.22	18.17	40	26.20
火山-Coding	glm-4.7	28.86	32	39.36	27.06	36	37.13	21.52	27	33.66	80.07	42	87.95
火山-Coding	kimi-k2.5	17.50	25	30.56	17.09	24	30.80	22.82	23	36.70	89.98	22	104.35
阿里CodingPlan	glm-4.7	3.24	74	7.60	3.95	78	8.09	2.76	41	12.17	14.15	66	20.21
阿里CodingPlan	glm-5	1.53	30	12.38	7.33	36	16.54	8.20	36	17.26	12.01	32	22.06
阿里CodingPlan	kimi-k2.5	23.35	38	30.19	10.94	34	21.55	6.75	39	14.51	28.75	29	51.19
阿里CodingPlan	minimax-m2.5	4.12	45	11.77	4.74	61	10.14	4.52	66	9.43	13.11	35	29.01
阿里CodingPlan	qwen3-coder-next	3.98	147	6.24	3.51	104	6.79	11.58	67	24.88	15.28	92	18.88
阿里CodingPlan	qwen3-coder-plus	3.04	46	8.20	3.22	47	9.61	4.41	53	10.15	28.09	66	32.74
阿里CodingPlan	qwen3-max-2026-01-23	2.49	31	11.59	2.37	32	12.07	4.88	30	15.20	11.02	33	20.41
阿里CodingPlan	qwen3.5-plus	3.73	61	8.97	4.54	64	9.53	4.48	76	8.93	8.58	125	11.19
MiniMax-Coding	m2.1	4.12	42	11.76	1.57	48	8.23	2.44	45	9.58	4.64	43	12.08
MiniMax-Coding	m2.5	2.12	36	11.06	1.42	51	7.59	5.54	48	13.32	8.34	102	12.80
MiniMax-Coding	m2.7	2.06	37	10.63	1.98	43	9.47	2.03	43	9.47	5.28	42	12.90
KIMI-Coding	kimi-for-coding	3.85	31	12.21	5.39	34	13.37	5.71	35	14.23	11.20	48	17.28
无问芯穹-Coding	deepseek-v3.2-thinking	2.96	26	15.06	3.70	26	16.26	3.26	24	16.82	—	—	—
无问芯穹-Coding	glm-5	3.42	26	15.63	4.66	33	14.44	3.70	29	14.66	9.26	30	20.09
无问芯穹-Coding	kimi-k2.5	38.17	25	51.10	14.61	26	27.02	7.76	25	20.78	18.87	25	31.97
无问芯穹-Coding	minimax-m2.5	4.54	50	11.01	4.28	52	10.61	5.30	51	11.74	6.88	57	12.55
无问芯穹-Coding	minimax-m2.7	3.67	47	10.50	3.19	53	9.43	3.87	53	9.95	7.49	48	14.26
腾讯CodingPlan	auto	5.39	28	16.58	2.27	37	11.13	3.94	34	13.27	5.63	33	15.58
腾讯CodingPlan	hunyuan-2.0-instruct	1.35	42	8.57	1.65	52	7.56	3.08	68	8.50	10.82	62	16.13
腾讯CodingPlan	hunyuan-2.0-thinking	1.15	83	4.98	1.34	85	5.15	2.51	76	6.73	16.24	87	19.87
腾讯CodingPlan	minimax-m2.5	1.72	31	11.97	1.33	41	9.16	1.92	40	9.85	3.24	43	10.66
腾讯CodingPlan	kimi-k2.5	2.46	29	13.76	0.96	37	9.73	12.38	44	19.60	13.43	47	20.39
腾讯CodingPlan	glm-5	3.96	28	33.88	2.02	32	12.66	2.64	30	13.76	5.18	39	13.54
腾讯CodingPlan	hunyuan-t1	1.05	76	5.30	1.20	84	4.99	2.35	61	7.69	6.01	58	11.47
腾讯CodingPlan	hunyuan-turbos	1.24	29	10.69	1.84	29	12.71	2.56	29	13.52	6.82	29	18.04
硅基流动-Pro	minimax-m2.5	2.19	72	7.96	1.61	85	6.23	1.89	79	6.41	3.77	74	8.62
硅基流动-Pro	glm-5	2.20	37	11.32	1.50	44	8.73	3.04	36	12.17	6.36	24	21.31
硅基流动-Pro	kimi-k2.5	0.99	29	12.26	1.37	29	12.39	1.75	33	11.59	5.65	30	16.31
硅基流动-Pro	glm-4.7	3.59	66	8.42	0.78	70	5.33	1.43	71	5.98	10.71	64	15.77
硅基流动-Pro	deepseek-v3.2	2.51	9	57.77	9.28	29	22.11	7.95	27	21.22	12.35	23	29.27
硅基流动-Pro	deepseek-v3.1-terminus	1.02	21	12.24	1.36	20	14.51	1.66	20	14.50	5.38	20	17.55
优云智算-Coding	kimi-k2.5	—	—	—	—	—	—	—	—	—	—	—	—
优云智算-Coding	minimax-m2.1	—	—	—	—	—	—	—	—	—	—	—	—

		@100 tokens			@1K tokens			@10K tokens			@100K tokens
套餐	模型	TTFT	TPS	耗时	TTFT	TPS	耗时	TTFT	TPS	耗时	TTFT	TPS	耗时
GLM-Coding	glm-4.5	1.71	130	4.11	1.78	157	3.71	2.15	142	4.04	7.32	129	9.83
GLM-Coding	glm-4.5-air	1.89	84	4.97	1.87	110	4.38	2.73	76	6.51	18.22	72	22.88
GLM-Coding	glm-4.6	1.78	47	9.43	1.75	66	7.08	5.14	97	9.51	9.29	92	12.92
GLM-Coding	glm-4.7	1.94	73	6.17	2.11	60	6.99	7.65	78	12.97	5.31	117	7.93
GLM-Coding	glm-5	3.58	38	10.26	2.21	39	8.63	5.42	33	13.04	7.85	32	16.90
GLM-Coding	glm-5-turbo	1.75	65	6.81	1.90	62	7.75	2.39	77	6.36	7.09	70	11.74
火山-Coding	deepseek-v3.2	2.67	29	11.15	2.96	29	12.26	9.78	29	20.21	44.60	30	54.57
火山-Coding	doubao-seed-2.0-code	3.38	49	9.92	5.98	64	11.11	6.29	69	11.06	29.30	59	34.74
火山-Coding	doubao-seed-2.0-pro	3.02	91	6.59	2.35	101	5.57	6.91	93	10.38	20.65	80	24.68
火山-Coding	doubao-seed-code	1.93	54	7.84	2.02	49	8.70	3.97	51	10.34	23.38	54	29.31
火山-Coding	glm-4.7	2.71	40	10.89	3.41	35	13.86	6.46	39	14.63	39.86	37	48.65
火山-Coding	kimi-k2.5	2.08	18	20.11	2.10	19	18.88	4.46	16	25.27	30.87	16	51.72
阿里CodingPlan	glm-4.7	1.85	73	6.29	2.23	80	6.27	2.83	82	6.79	8.83	87	12.55
阿里CodingPlan	glm-5	2.37	37	11.11	2.09	43	9.74	2.92	38	11.40	11.22	35	20.52
阿里CodingPlan	kimi-k2.5	5.65	21	22.78	5.31	17	28.02	6.24	20	24.26	9.20	41	16.73
阿里CodingPlan	minimax-m2.5	5.27	73	9.85	4.44	62	9.66	5.35	62	10.57	9.16	53	15.21
阿里CodingPlan	qwen3-coder-next	2.51	84	13.39	2.00	139	4.44	2.64	131	5.06	11.76	128	14.24
阿里CodingPlan	qwen3-coder-plus	1.96	49	6.86	2.49	49	8.88	2.86	50	8.94	19.36	69	23.89
阿里CodingPlan	qwen3-max-2026-01-23	3.94	31	13.28	1.99	32	11.05	6.04	31	15.95	20.38	34	29.63
阿里CodingPlan	qwen3.5-plus	2.30	53	8.42	2.32	58	7.91	5.63	96	8.98	7.37	118	11.38
MiniMax-Coding	m2.1	2.98	45	10.94	2.41	49	9.97	2.80	65	7.78	8.74	53	17.31
MiniMax-Coding	m2.5	3.13	62	8.35	2.86	52	9.84	3.87	64	8.89	7.85	39	22.50
MiniMax-Coding	m2.7	2.90	53	9.05	2.04	51	8.36	2.76	66	7.72	6.31	51	12.60
KIMI-Coding	kimi-for-coding	3.08	27	12.14	3.73	28	13.53	3.41	30	13.27	7.70	35	16.64
无问芯穹-Coding	deepseek-v3.2-thinking	2.70	28	14.18	2.71	29	13.70	3.66	27	15.88	—	—	—
无问芯穹-Coding	glm-5	2.36	32	12.45	2.35	38	10.96	3.27	32	13.23	8.97	32	19.05
无问芯穹-Coding	kimi-k2.5	2.38	28	13.92	3.97	27	16.04	3.29	25	15.96	9.60	26	21.81
无问芯穹-Coding	minimax-m2.5	4.14	62	9.42	4.16	70	8.92	9.95	64	15.04	8.19	63	13.85
无问芯穹-Coding	minimax-m2.7	4.12	47	11.12	3.25	50	9.76	3.99	49	10.62	6.69	50	13.21
腾讯CodingPlan	auto	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	hunyuan-2.0-instruct	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	hunyuan-2.0-thinking	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	minimax-m2.5	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	kimi-k2.5	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	glm-5	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	hunyuan-t1	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
腾讯CodingPlan	hunyuan-turbos	缺失	—	—	缺失	—	—	缺失	—	—	缺失	—	—
硅基流动-Pro	minimax-m2.5	2.23	46	50.84	2.47	88	6.17	5.16	97	8.50	4.10	76	8.36
硅基流动-Pro	glm-5	0.78	57	6.40	0.78	61	6.04	0.98	55	6.82	3.77	48	10.52
硅基流动-Pro	kimi-k2.5	1.72	44	9.60	1.16	52	8.08	1.20	48	9.74	3.66	53	10.34
硅基流动-Pro	glm-4.7	0.60	73	4.96	0.76	77	4.91	0.75	74	5.08	2.45	77	6.61
硅基流动-Pro	deepseek-v3.2	2.60	34	12.10	2.49	31	13.04	4.29	34	13.85	6.93	18	30.10
硅基流动-Pro	deepseek-v3.1-terminus	1.64	20	13.25	2.46	19	16.94	2.11	18	16.68	7.45	17	23.03
优云智算-Coding	kimi-k2.5	—	—	—	—	—	—	—	—	—	—	—	—
优云智算-Coding	minimax-m2.1	—	—	—	—	—	—	—	—	—	—	—	—

上下文缩放分析

随上下文从 100 增长到 100K tokens，各模型 TPS 的保持情况（白天数据）。TPS 保持率 = TPS@100K ÷ TPS@100（越高越好，100% = 无衰减）。耗时倍增 = 总耗时@100K ÷ 总耗时@100。按保持率升序排列，衰减最严重的在上方。

套餐	模型	TPS @100	TPS @1K	TPS @10K	TPS @100K	TPS 保持率	耗时 @100	耗时 @100K	耗时倍增
GLM-Coding	glm-4.6	54	65	64	19	35%	9.4s	34.9s	3.7×
GLM-Coding	glm-4.5	56	57	76	33	59%	7.0s	22.0s	3.2×
阿里CodingPlan	qwen3-coder-next	147	104	67	92	62%	6.2s	18.9s	3.0×
硅基流动-Pro	glm-5	37	44	36	24	64%	11.3s	21.3s	1.9×
阿里CodingPlan	kimi-k2.5	38	34	39	29	77%	30.2s	51.2s	1.7×
腾讯CodingPlan	hunyuan-t1	76	84	61	58	77%	5.3s	11.5s	2.2×
阿里CodingPlan	minimax-m2.5	45	61	66	35	77%	11.8s	29.0s	2.5×
GLM-Coding	glm-4.5-air	97	121	103	75	77%	3.5s	23.6s	6.8×
阿里CodingPlan	glm-4.7	74	78	41	66	89%	7.6s	20.2s	2.7×
火山-Coding	kimi-k2.5	25	24	23	22	91%	30.6s	104.3s	3.4×
火山-Coding	doubao-seed-2.0-pro	84	86	76	77	92%	6.0s	16.4s	2.7×
硅基流动-Pro	deepseek-v3.1-terminus	21	20	20	20	94%	12.2s	17.6s	1.4×
硅基流动-Pro	glm-4.7	66	70	71	64	96%	8.4s	15.8s	1.9×
火山-Coding	deepseek-v3.2	32	31	31	30	96%	10.8s	27.8s	2.6×
无问芯穹-Coding	kimi-k2.5	25	26	25	25	99%	51.1s	32.0s	0.6×
腾讯CodingPlan	hunyuan-turbos	29	29	29	29	99%	10.7s	18.0s	1.7×
GLM-Coding	glm-5	28	30	23	28	100%	12.6s	16.5s	1.3×
无问芯穹-Coding	minimax-m2.7	47	53	53	48	102%	10.5s	14.3s	1.4×
硅基流动-Pro	minimax-m2.5	72	85	79	74	102%	8.0s	8.6s	1.1×
MiniMax-Coding	m2.1	42	48	45	43	103%	11.8s	12.1s	1.0×
硅基流动-Pro	kimi-k2.5	29	29	33	30	104%	12.3s	16.3s	1.3×
腾讯CodingPlan	hunyuan-2.0-thinking	83	85	76	87	104%	5.0s	19.9s	4.0×
阿里CodingPlan	qwen3-max-2026-01-23	31	32	30	33	104%	11.6s	20.4s	1.8×
阿里CodingPlan	glm-5	30	36	36	32	108%	12.4s	22.1s	1.8×
火山-Coding	doubao-seed-code	37	38	37	40	110%	10.4s	26.2s	2.5×
GLM-Coding	glm-5-turbo	51	49	53	56	110%	7.7s	11.2s	1.5×
火山-Coding	doubao-seed-2.0-code	48	47	51	53	111%	16.8s	51.2s	3.0×
无问芯穹-Coding	minimax-m2.5	50	52	51	57	112%	11.0s	12.6s	1.1×
MiniMax-Coding	m2.7	37	43	43	42	113%	10.6s	12.9s	1.2×
无问芯穹-Coding	glm-5	26	33	29	30	114%	15.6s	20.1s	1.3×
腾讯CodingPlan	auto	28	37	34	33	114%	16.6s	15.6s	0.9×
火山-Coding	glm-4.7	32	36	27	42	129%	39.4s	88.0s	2.2×
腾讯CodingPlan	minimax-m2.5	31	41	40	43	138%	12.0s	10.7s	0.9×
腾讯CodingPlan	glm-5	28	32	30	39	142%	33.9s	13.5s	0.4×
阿里CodingPlan	qwen3-coder-plus	46	47	53	66	143%	8.2s	32.7s	4.0×
腾讯CodingPlan	hunyuan-2.0-instruct	42	52	68	62	149%	8.6s	16.1s	1.9×
KIMI-Coding	kimi-for-coding	31	34	35	48	158%	12.2s	17.3s	1.4×
腾讯CodingPlan	kimi-k2.5	29	37	44	47	164%	13.8s	20.4s	1.5×
阿里CodingPlan	qwen3.5-plus	61	64	76	125	204%	9.0s	11.2s	1.2×
GLM-Coding	glm-4.7	25	53	64	57	228%	22.5s	18.7s	0.8×
硅基流动-Pro	deepseek-v3.2	9	29	27	23	248%	57.8s	29.3s	0.5×
MiniMax-Coding	m2.5	36	51	48	102	285%	11.1s	12.8s	1.2×
无问芯穹-Coding	deepseek-v3.2-thinking	26	26	24	—	—	15.1s	—	—

同模型跨厂商比较

相同基础模型在不同平台上的表现差异（白天数据），揭示平台基础设施和调度能力的差距。@100 和 @100K 两档对比。

Kimi K2.5

平台	TTFT @100	TPS @100	耗时 @100	TTFT @100K	TPS @100K	耗时 @100K
硅基流动	0.99	29	12.26	5.65	30	16.31
腾讯	2.46	29	13.76	13.43	47	20.39
KIMI	3.85	31	12.21	11.20	48	17.28
火山	17.50	25	30.56	89.98	22	104.35
阿里	23.35	38	30.19	28.75	29	51.19
无问芯穹	38.17	25	51.10	18.87	25	31.97

GLM-5

平台	TTFT @100	TPS @100	耗时 @100	TTFT @100K	TPS @100K	耗时 @100K
GLM	1.19	51	7.72	5.39	56	11.20
阿里	1.53	30	12.38	12.01	32	22.06
硅基流动	2.20	37	11.32	6.36	24	21.31
无问芯穹	3.42	26	15.63	9.26	30	20.09
GLM	3.88	28	12.57	6.47	28	16.50
腾讯	3.96	28	33.88	5.18	39	13.54

MiniMax M2.5

平台	TTFT @100	TPS @100	耗时 @100	TTFT @100K	TPS @100K	耗时 @100K
腾讯	1.72	31	11.97	3.24	43	10.66
MiniMax	2.12	36	11.06	8.34	102	12.80
硅基流动	2.19	72	7.96	3.77	74	8.62
阿里	4.12	45	11.77	13.11	35	29.01
无问芯穹	4.54	50	11.01	6.88	57	12.55

DeepSeek V3.2

平台	TTFT @100	TPS @100	耗时 @100	TTFT @100K	TPS @100K	耗时 @100K
硅基流动	2.51	9	57.77	12.35	23	29.27
火山	2.77	32	10.78	18.30	30	27.81
无问芯穹	2.96	26	15.06	—	—	—

综合体验评分

白天综合评分（含劣化惩罚）

基于白天实测数据的加权综合评分。TTFT 体验占 40%（对数评分，越低越好），TPS 体验占 60%（平方根评分，越高越好），按 4 档上下文加权（@100 30% + @1K 30% + @10K 25% + @100K 15%）得出基础分。再根据 @100K 昼夜 TTFT 劣化幅度施加惩罚系数（>200% → ×0.70，>100% → ×0.80，>50% → ×0.90，>20% → ×0.95）。无夜间数据的模型不扣分。

分数色阶： ≥75 优秀 60-75 良好 45-60 一般 30-45 较差 <30 很差

			分档得分（0.4×TTFT + 0.6×TPS）
#	套餐	模型	@100	@1K	@10K	@100K	基础分	劣化系数	最终分
1	GLM-Coding	glm-4.5-air	90.1	91.1	87.3	56.2	84.6	×1.0	84.6
2	腾讯CodingPlan	hunyuan-2.0-thinking	85.5	85.1	77.2	61.8	79.8	无夜间数据	79.8
3	硅基流动-Pro	minimax-m2.5	77.0	83.8	80.6	72.9	79.3	×1.0	79.3
4	腾讯CodingPlan	hunyuan-t1	83.7	85.5	72.4	62.3	78.2	无夜间数据	78.2
5	火山-Coding	doubao-seed-2.0-pro	81.1	81.0	74.8	61.7	76.6	×0.95	72.8
6	阿里CodingPlan	qwen3.5-plus	68.2	67.5	71.9	72.9	69.6	×1.0	69.6
7	阿里CodingPlan	qwen3-coder-next	80.7	81.9	58.7	64.1	73.1	×0.95	69.4
8	腾讯CodingPlan	hunyuan-2.0-instruct	68.6	71.6	72.6	57.6	68.9	无夜间数据	68.9
9	GLM-Coding	glm-5-turbo	73.4	73.3	73.0	62.6	71.7	×0.95	68.1
10	MiniMax-Coding	m2.5	62.3	72.2	59.0	73.2	66.1	×1.0	66.1
11	腾讯CodingPlan	minimax-m2.5	61.4	68.3	65.1	62.0	64.5	无夜间数据	64.5
12	MiniMax-Coding	m2.7	63.1	66.2	66.0	56.8	63.8	×1.0	63.8
13	无问芯穹-Coding	minimax-m2.7	62.6	66.5	64.7	55.9	63.3	×1.0	63.3
14	GLM-Coding	glm-4.5	75.8	72.7	76.4	43.9	70.2	×0.9	63.2
15	无问芯穹-Coding	minimax-m2.5	61.9	63.3	60.8	60.5	61.8	×1.0	61.8
16	阿里CodingPlan	glm-4.7	74.3	73.8	62.5	56.1	68.5	×0.9	61.6
17	MiniMax-Coding	m2.1	59.3	70.2	65.4	58.6	64.0	×0.95	60.8
18	GLM-Coding	glm-4.6	68.6	76.0	73.2	33.5	66.7	×0.9	60.0
19	阿里CodingPlan	qwen3-coder-plus	63.9	63.9	63.4	50.7	61.8	×0.95	58.7
20	阿里CodingPlan	minimax-m2.5	60.7	65.9	68.2	43.7	61.6	×0.95	58.5
21	火山-Coding	doubao-seed-code	65.2	66.8	61.1	42.5	61.2	×0.95	58.2
22	腾讯CodingPlan	hunyuan-turbos	62.6	59.8	57.1	47.6	58.1	无夜间数据	58.1
23	腾讯CodingPlan	kimi-k2.5	57.4	68.4	48.7	49.1	57.3	无夜间数据	57.3
24	腾讯CodingPlan	glm-5	52.5	60.7	57.4	55.6	56.6	无夜间数据	56.6
25	GLM-Coding	glm-4.7	45.5	74.7	70.9	57.9	62.4	×0.9	56.2
26	腾讯CodingPlan	auto	49.5	62.3	55.8	51.8	55.3	无夜间数据	55.3
27	硅基流动-Pro	glm-5	62.5	68.8	59.2	45.4	61.0	×0.9	54.9
28	硅基流动-Pro	kimi-k2.5	64.1	62.0	62.3	50.1	60.9	×0.9	54.8
29	无问芯穹-Coding	deepseek-v3.2-thinking	54.1	52.0	52.0	—	52.7	无夜间数据	52.7
30	阿里CodingPlan	glm-5	61.7	50.6	49.4	43.2	52.5	×1.0	52.5
31	硅基流动-Pro	glm-4.7	70.5	83.3	79.9	58.5	74.9	×0.7	52.4
32	硅基流动-Pro	deepseek-v3.1-terminus	59.1	56.5	55.1	44.6	55.1	×0.95	52.4
33	阿里CodingPlan	qwen3-max-2026-01-23	58.4	59.4	51.6	44.6	54.9	×0.95	52.2
34	无问芯穹-Coding	glm-5	52.8	53.7	53.7	44.9	52.1	×1.0	52.1
35	KIMI-Coding	kimi-for-coding	54.5	52.7	52.7	51.6	53.1	×0.95	50.4
36	GLM-Coding	glm-5	52.7	53.9	42.7	47.6	49.8	×1.0	49.8
37	火山-Coding	deepseek-v3.2	58.0	59.4	50.7	37.3	53.5	×0.9	48.1
38	火山-Coding	doubao-seed-2.0-code	52.8	53.0	52.1	45.7	51.6	×0.9	46.4
39	硅基流动-Pro	deepseek-v3.2	42.9	44.3	44.9	37.7	43.1	×0.9	38.7
40	无问芯穹-Coding	kimi-k2.5	32.0	37.6	44.0	34.1	37.0	×0.9	33.3
41	阿里CodingPlan	kimi-k2.5	39.0	45.2	52.9	34.3	43.6	×0.7	30.5
42	火山-Coding	glm-4.7	35.9	38.0	33.8	40.9	36.8	×0.8	29.4
43	火山-Coding	kimi-k2.5	35.0	34.6	30.8	30.1	33.1	×0.8	26.5

夜间综合评分

同一评分方法，使用夜间实测数据。夜间无劣化惩罚（本身就是基准时段）。腾讯因 API Key 过期无夜间数据，不参与此表。

			分档得分（0.4×TTFT + 0.6×TPS）
#	套餐	模型	@100	@1K	@10K	@100K	最终分
1	GLM-Coding	glm-4.5	88.0	87.7	86.2	74.6	85.5
2	硅基流动-Pro	glm-4.7	85.6	85.9	84.9	77.8	84.3
3	阿里CodingPlan	qwen3-coder-next	79.9	86.8	84.5	69.4	81.6
4	GLM-Coding	glm-4.5-air	82.3	87.3	76.5	55.4	78.3
5	阿里CodingPlan	glm-4.7	78.7	79.6	78.2	68.5	77.3
6	火山-Coding	doubao-seed-2.0-pro	80.5	85.5	73.0	56.8	76.6
7	硅基流动-Pro	glm-5	78.4	79.9	76.3	62.8	76.0
8	硅基流动-Pro	minimax-m2.5	66.6	81.4	77.3	72.8	74.6
9	GLM-Coding	glm-5-turbo	76.2	74.5	78.0	65.1	74.5
10	GLM-Coding	glm-4.7	78.3	72.9	67.1	77.9	73.8
11	GLM-Coding	glm-4.6	68.9	76.6	77.3	69.6	73.4
12	阿里CodingPlan	qwen3.5-plus	69.4	71.3	76.1	74.5	72.4
13	硅基流动-Pro	kimi-k2.5	67.8	74.0	72.1	65.2	70.4
14	MiniMax-Coding	m2.7	67.3	69.5	72.9	59.0	68.1
15	MiniMax-Coding	m2.5	70.2	67.1	69.0	51.3	66.1
16	MiniMax-Coding	m2.1	63.7	67.3	72.4	56.4	65.8
17	阿里CodingPlan	minimax-m2.5	69.2	66.9	65.1	55.9	65.5
18	无问芯穹-Coding	minimax-m2.5	67.6	70.5	59.3	61.0	65.4
19	阿里CodingPlan	qwen3-coder-plus	69.0	67.0	66.2	53.7	65.4
20	火山-Coding	doubao-seed-code	71.2	68.7	63.6	46.1	64.8
21	火山-Coding	doubao-seed-2.0-code	64.3	64.7	66.0	48.1	62.4
22	无问芯穹-Coding	minimax-m2.7	61.5	65.1	62.7	57.9	62.3
23	阿里CodingPlan	glm-5	61.9	65.8	60.6	45.5	60.3
24	无问芯穹-Coding	glm-5	59.4	62.5	56.5	46.3	57.6
25	GLM-Coding	glm-5	58.7	63.5	52.2	47.8	56.9
26	无问芯穹-Coding	deepseek-v3.2-thinking	56.0	56.6	52.7	—	55.3
27	硅基流动-Pro	deepseek-v3.2	59.6	58.4	55.0	40.6	55.2
28	火山-Coding	glm-4.7	62.2	57.7	53.4	38.5	55.1
29	KIMI-Coding	kimi-for-coding	54.3	53.1	55.1	49.5	53.4
30	阿里CodingPlan	qwen3-max-2026-01-23	54.2	60.8	50.0	38.2	52.7
31	无问芯穹-Coding	kimi-k2.5	57.1	51.9	52.5	42.3	52.2
32	硅基流动-Pro	deepseek-v3.1-terminus	55.2	51.3	51.8	39.1	50.8
33	火山-Coding	deepseek-v3.2	56.7	55.8	43.8	34.9	49.9
34	火山-Coding	kimi-k2.5	52.0	52.6	43.6	26.0	46.2
35	阿里CodingPlan	kimi-k2.5	44.8	42.6	43.1	50.6	44.6

核心发现

聚焦四大主力新模型（Kimi-K2.5、GLM-5、MiniMax-M2.7、Qwen3.5-Plus）在各平台的白天/夜间表现。小模型（GLM-4.5-air 等）更适合工作流和系统集成，单独点评见上方评分表。

Kimi-K2.5：平台差距远大于模型差距同一个 K2.5，白天 @100 TTFT 在硅基流动 0.99s，在腾讯 2.46s，但在无问芯穹 38.17s（差 38 倍）、阿里 23.35s、火山 17.50s。@100K 更夸张：硅基 5.65s vs 火山 89.98s。夜间差距收窄但仍显著：硅基 3.66s vs 火山 30.87s。结论：K2.5 模型本身没问题，白天高峰在火山、阿里、无问芯穹三个平台严重劣化。

GLM-5：旗舰模型但速度偏慢，自家平台最优GLM-5（754B）在自家 GLM-Coding 白天 TTFT 3.88s、TPS 28、@100K 总耗时 16.50s。阿里 TTFT 1.53s 更快但 TPS 仅 30。硅基流动白天 2.20s 但 TPS 37。腾讯 TTFT 3.96s 且 @100K 总耗时异常高达 33.88s。夜间各平台表现接近，差距不大。TPS 全场 24–39，不算快但能力被社区评为「对标 Opus 4.6」。选 GLM-5 看重的是能力而非速度。

MiniMax-M2.7：国产速度标杆，highspeed 版质变标准版白天 @100 TPS 37、@100K TPS 42，四档稳定无衰减。highspeed 版 TPS 飙升到 57–64（+50%），@100K 总耗时 10.9s。夜间标准版 TPS 提升到 51，差距缩小。值得注意的是 M2.7 在无问芯穹白天 TPS 47、TTFT 3.67s，比 MiniMax 自家标准版更快——说明无问芯穹对 MiniMax 模型的调度比对 Kimi 好得多。

Qwen3.5-Plus：唯一 TPS 随上下文逆增的模型阿里 qwen3.5-plus 白天 @100 TPS 61 → @1K 53 → @10K 66 → @100K 反升至 125，本次唯一不降反升的模型。@100K 总耗时仅 11.19s，在阿里平台所有模型中最快。夜间 @100K TPS 118 同样亮眼。这个模型特别适合需要投喂大量上下文的场景。但 @100 短上下文 TPS 61 属于中等水平。

Qwen3-Coder-Next：短上下文最快，长上下文衰减严重白天 @100 TPS 147 全场最高，@1K 104 仍然领先。但 @10K 跌至 67（↓54%），@100K TPS 92 虽然回升但总耗时 18.88s。夜间 @100K TPS 128 表现更好。适合短平快任务（补全、格式转换），不适合大仓库分析。

白天 vs 夜间：新模型劣化幅度普遍 50%–200%@100K 上下文下，Kimi-K2.5 在火山白天 89.98s / 夜间 30.87s（+191%），在阿里白天 28.75s / 夜间 9.20s（+213%）。GLM-5 在 GLM 平台白天 6.47s / 夜间 7.85s（反而夜间更慢，-18%，异常稳定）。M2.7 白天 5.28s / 夜间 6.31s（-16%，稳定）。结论：自研模型在自家平台昼夜稳定，第三方模型在聚合平台白天显著劣化。

KIMI-Coding 自有平台：稳但不快kimi-for-coding（K2.5）在 KIMI 自有平台白天 @100 TTFT 3.85s、TPS 31，@100K TTFT 11.20s、TPS 48。昼夜波动极小（@100 仅 +45%）。但 TPS 在所有 K2.5 部署中只排中游——硅基流动夜间 TPS 53 更高。KIMI 平台的优势在稳定性而非极速。

平台基础设施才是胜负手同一个 Kimi-K2.5 在 7 个平台测试，白天 @100K 总耗时从 10.34s（硅基夜间）到 104.35s（火山白天）。同一个 GLM-5 从 10.52s（硅基夜间）到 33.88s（腾讯白天）。选对平台比选对模型更重要——这是本次横评最核心的结论。

场景推荐

基于实测数据，按三大实际使用场景给出选型建议。每个场景对模型代际、速度、稳定性的优先级不同。

场景一：开发场景（Claude Code / Cursor / Cline）

核心要求：最新大模型 + 白天稳定。开发场景直接影响编码效率，模型能力是第一优先——必须用最新代际大模型（GLM-5、Kimi-K2.5、M2.7、Qwen3.5-Plus 等），同时白天高峰期不能出现 10 倍级波动。长上下文（10K–100K）的支撑能力决定了能否处理大文件重构。早期模型（GLM-4.5-air、M2.1 等）能力不够，不适合此场景。

推荐	套餐 · 模型	为什么选它	白天实测	月费
能力首选	GLM-Coding · GLM-5	最新旗舰（754B），社区评价对标 Opus 4.6。昼夜稳定（@100K 白天 6.47s / 夜间 7.85s，波动 -18%）。仅 Pro/Max 可用，GLM-5 消耗 3 倍配额。	TTFT 3.88s · TPS 28 · @100K 总耗时 16.5s	¥149/月
前端首选	KIMI-Coding · kimi-for-coding	K2.5 代码专项训练，前端/视觉编码极强（截图还原 80-90%）。自有平台白天 @100K TTFT 11.20s，昼夜波动仅 +45%，本次最稳定的新大模型之一。	TTFT 3.85s · TPS 31 · @100K 总耗时 17.3s	¥49/月
高吞吐	阿里 · Qwen3.5-Plus	唯一 TPS 随上下文逆增的大模型（61→125）。@100K 总耗时仅 11.19s，阿里平台最快。适合大文件重构。	TTFT 3.73s · TPS 61→125 · @100K 11.2s	¥200/月
速度均衡	MiniMax · M2.7-highspeed	M2.7 被称「国产 SOTA」（SWE-Pro 56%），极速版 TPS 57–64，@100K 总耗时 10.9s。3/23 起新增周配额需注意。	TPS 57–64 · @100K 10.9s	¥98/月

规避：K2.5 在火山白天 @100K 达 89.98s（夜间 30.87s）、阿里白天 28.75s（夜间 9.20s）——同模型在硅基流动仅 5.65s，问题在聚合平台对第三方模型的调度。建议 K2.5 优先走 KIMI 自有平台或硅基流动。

场景二：OpenClaw / 龙虾（消息端 AI 智能体）

核心要求：速度优先 + 昼夜稳定，模型代际可用中上代。OpenClaw 通过微信/飞书/Telegram 等消息平台下发指令，执行文件操作、Shell 命令等任务。用户发完消息后等待首字是主要体感摩擦点（TTFT < 3s 为佳）。中代际模型（GLM-4.7、M2.7、GLM-4.5-air 等）在 tool calling 可靠性上已足够。避免 thinking/推理模型（会导致智能体长时间无响应）。

推荐	套餐 · 模型	为什么选它	实测数据	月费
首选	硅基流动 · GLM-4.7	夜间 TTFT 0.60s 全场最快，白天 3.59s 可接受。TPS 64–77 全档稳定，上下文保持率 96%。按量无月费。	TTFT 0.60–3.59s · TPS 64–77	按量付费
月套餐	GLM-Coding · GLM-4.5-air	TTFT 1.11s，TPS 97 出字流畅。昼夜稳定，消息端体验丝滑。Lite 即可覆盖。	TTFT 1.11s · TPS 97	¥49/月
新大模型	MiniMax · M2.7 标准	¥29 起步，M2.7 SWE-Pro 56%，速度 TPS 37–43。tool calling 可靠，适合自动化。如果需要更强能力可选新大模型。	TTFT 2.06s · TPS 37–43	¥29/月
极速	MiniMax · M2.7-highspeed	极速版延迟更低，TPS 57–64。对速度敏感的自动化任务首选。	TPS 57–64	¥98/月

OpenClaw 社区推荐：不要用 thinking/推理模型（如 hunyuan-t1、deepseek-thinking），丰富上下文会导致模型「思考」数分钟无响应。优先选非推理的标准模型。

场景三：生产接入 / 系统集成

核心要求：速度为最大优先。模型作为系统组件处理短平快任务（代码补全、格式转换、摘要生成），不负责长程 Agent 链。早期/小模型完全够用——GLM-4.5-air、M2.5、doubao-seed-code 等速度快、成本低。关键指标是 TPS 和 TTFT 稳定性。按量付费优于月套餐（成本可预测），需要高 RPM 限额。

推荐	套餐 · 模型	为什么选它	实测数据	计费
首选	硅基流动 · MiniMax-M2.5	@100K 总耗时 8.62s 全场最快。TPS 72–85 全档稳定，按量付费无配额上限，RPM 按充值等级可达 10,000。早期模型但速度极致。	TPS 72–85 · 耗时 8.0–8.6s	按量/M tok
低延迟	硅基流动 · GLM-4.7	夜间 TTFT 0.60s，TPS 64–77，四档无衰减（保持率 96%）。中代模型，性能稳定可承诺 SLA。	TPS 64–77 · TTFT 0.60s	按量/M tok
超高吞吐	GLM-Coding · GLM-4.5-air	TPS 97–121 出字极快，TTFT 1.11s。最适合高频短任务。早期模型但速度碾压新大模型。	TPS 97–121 · TTFT 1.11s	¥49/月
短上下文	阿里 · qwen3-coder-next	@100 TPS 147 全场最高。适合补全/格式转换等短任务。@10K+ 衰减严重，不适合长上下文。	TPS 147(@100) · 67(@10K)	¥200/月

生产选型要点：硅基流动社区口碑「体验丝滑」「把价格打下来了」，API 稳定性在国内平台中评价最高。按量付费避免配额陷阱，更适合生产环境成本核算。

当前需规避的组合

优云智算 — 测试期间全部模型不可用，整套产品当前不可用。

无问芯穹 · kimi-k2.5 — 白天 TTFT 38.2s（夜间 2.4s，+1504%），任何场景均不可用。同平台 minimax-m2.7 波动 <10%，问题在模型调度而非平台。

火山 · glm-4.7 — 白天 TTFT 28.9s（夜间 2.7s，+965%），白天高峰完全不可用。同模型在硅基流动夜间仅 0.60s。

火山 · kimi-k2.5 — 白天 TTFT 17.5s（夜间 2.1s，+739%），同模型在硅基 0.99s、腾讯 2.46s，问题在火山侧。

阿里 · kimi-k2.5 — 白天 TTFT 23.3s，建议同平台转用 qwen3-coder-next（TTFT 3.73s，TPS 147）。

CodingPlan 速度横评报告 · 2026 年 3 月