1
Qwen
🔥 烫手
Qwen3-72B 实测:中文写作能力已经超过 Claude 3.5 Sonnet?
附完整 benchmark 数据与对比图,5 项任务逐一拆解……
1,204
赞
开源模型测评 · 本地部署经验 · 真实使用痛点——和全球开发者一起,构建本地开源部署时代,打破 API 资本霸权。
4×RTX 4090 实测 128K 上下文、MoE 架构与 GPT-4 Turbo 对比。中文写作、代码、数学三项核心指标全面公开……
附完整 benchmark 数据与对比图,5 项任务逐一拆解……
三种复现方式,两种临时 workaround,等官方 patch……
从 Load Balancing Loss 到 Expert Capacity,逐一讲清楚……
tok/s 数据汇总,与 llama.cpp Metal 后端对比……
分词效率统计,中文 token 利用率与 Qwen 的对比……
10 篇文章总结对比,胜率出乎意料……