网站首页 > 简讯 > 正文

阿里通义千问开源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

2024-09-19 简讯 38 0

通义千问团队宣布，继Qwen2发布三个月后，Qwen家族的最新成员——Qwen2.5系列语言模型正式开源。这标志着可能是历史上最大规模的开源发布之一，包括了通用语言模型Qwen2.5，以及专门针对编程和数学领域的Qwen2.5-Coder和Qwen2.5-Math模型。

Qwen2.5系列模型在最新的大规模数据集上进行了预训练，数据集包含高达18T tokens，相较于Qwen2，新模型在知识获取、编程能力和数学能力方面均有显著提升。模型支持长文本处理，能够生成最多8K tokens的内容，并保持了对29种以上语言的支持。

Qwen2.5系列模型的开源，不仅采用了Apache2.0许可证，还提供了多种不同规模的版本，以适应不同的应用需求。此外，通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

新模型在指令执行、长文本生成、结构化数据理解以及生成结构化输出方面取得了显著改进。特别是在编程和数学领域，Qwen2.5-Coder和Qwen2.5-Math模型在专业数据集上进行了训练，展现了更强的专业领域能力。

Qwen2.5系列模型体验:

Qwen2.5合集:https://modelscope.cn/studios/qwen/Qwen2.5

AI AGI 人工智能 AI产品 AI网站 AI资讯 AI站点 AI模型提示词 Prompts Prompt AIbase产品库 AI日报 AI应用 AI新闻

上一篇

腾讯出品！AI音频模型 EzAudio AI，让文本秒变逼真声音

下一篇

LinkedIn 悄然使用用户数据训练 AI，需双重选择退出

扫码支持

微信支付

支付宝

返回顶部 暗黑模式