Qwen
Qwen(通义千问)是阿里巴巴开发的大语言模型系列,包括 Qwen 1(2023.08)、Qwen 2(2024.06)、Qwen 2.5(2024.12)和 Qwen 3(2025.04)。
核心特点
- 多语言能力:尤其中英双语能力突出
- 长上下文:Qwen 2.5 支持 128K,Qwen 3 支持 256K
- MoE 架构:Qwen 3 采用混合专家架构,提升效率
- 深度优化推理:自有推理引擎,低延迟部署
Qwen 3 亮点
| 指标 | 数值 |
|---|---|
| 架构 | MoE(混合专家) |
| 总参数 | 700B+ |
| 激活参数 | 约 40B |
| 上下文 | 256K tokens |
| 训练数据 | 20T+ tokens |