通义千问2¶
Qwen 是阿里开源出来的大语言模型和大多模态模型系列,目前大语言模型已经升级到 Qwen 2。语言模型和多模态模型都是在大规模多语言和多模态数据上进行预训练,并在高质量数据上进行后训练 ,以更符合人类偏好。Qwen 能够进行 自然语言理解、 文本生成 、 视觉理解 、 音频理解 、 工具使用 、 角色扮演 以及充当 AI代理 等。
目前 Qwen 2 版本具备以下特性:
- 提供 6 种不同大小的模型: 0.5B、1.5B、4B、7B、14B、72B;
- 每种类型都具备 base 模型和指令微调模型,其中指令微调模型与人类偏好进行了对齐;
- 基础模型和指令微调模型支持多语言;
- 所有模型都稳定支持 32K 上下文长度,对于 Qwen2 的 7B 以及 72B 模型能扩展至 128K 上下文
- 作为 AI Agent,Qwen 支持工具使用、RAG、角色扮演、扮演;