← 名词百科

Qwen

分类:模型架构

Qwen(通义千问)是阿里巴巴开发的大语言模型系列,包括 Qwen 1(2023.08)、Qwen 2(2024.06)、Qwen 2.5(2024.12)和 Qwen 3(2025.04)。

核心特点

  • 多语言能力:尤其中英双语能力突出
  • 长上下文:Qwen 2.5 支持 128K,Qwen 3 支持 256K
  • MoE 架构:Qwen 3 采用混合专家架构,提升效率
  • 深度优化推理:自有推理引擎,低延迟部署

Qwen 3 亮点

指标 数值
架构 MoE(混合专家)
总参数 700B+
激活参数 约 40B
上下文 256K tokens
训练数据 20T+ tokens