阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

机器之心报道

编辑:大盘鸡

人工智能领域再度迎来重磅消息!

2023 年 8 月,通义首次开源后迅速引起全球开发者的关注和热议,短短一年时间内,阿里云大模型又迎来了重要升级。

在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

发布现场,图源:泽南

通义千问凭借不断迭代的技术和丰富的应用场景,迅速崛起为开发者的热门选择,尤其是在中文社区中引发了广泛关注。这次发布,模型不仅展现出更强大的代码、数学和语言处理能力,还拥有领先的多模态处理和视觉智能,使其成为当前 AI 技术领域的佼佼者。

百宝箱:Qwen2.5

这次,Qwen2.5 系列是一个超级 AI 模型「百宝箱」,涵盖了多个尺寸的大语言模型、多模态模型、数学模型和代码模型。每个尺寸都有基础版本、指令跟随版本和量化版本,总计上架了 100 多个模型,刷新了业界纪录。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

集合链接:https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e

在语言模型方面,Qwen2.5 开源了 7 个尺寸:0.5B、1.5B、3B、7B、14B、32B、72B,每个都在同等参数赛道创造了业界最佳成绩。这些型号的设定充分考虑了下游场景的不同需求:3B 是适配手机等端侧设备的黄金尺寸;32B 是最受开发者期待的「性价比之王」,可在性能和功耗之间获得最佳平衡。令人惊喜的是,Qwen2.5-32B 的整体表现甚至超越了 Qwen2-72B。

所有 Qwen2.5 系列模型都在 18 万亿(18T)tokens 的数据上进行了预训练。相比 Qwen2,整体性能提升了 18% 以上,拥有更多的知识、更强的编程和数学能力。旗舰模型 Qwen2.5-72B 在 MMLU-redux(通用知识)、MBPP(代码能力)和 MATH(数学能力)等基准测试中,分别取得了 86.8、88.2、83.1 的高分。72B 作为 Qwen2.5 系列的旗舰模型,在多个核心任务上,以不到 1/5 的参数超越了拥有 4050 亿巨量参数的 Llama3.1-405B。

在专项模型方面,用于编程的 Qwen2.5-Coder 和用于数学的 Qwen2.5-Math 都有了实质性飞跃。Qwen2.5-Coder 在多达 5.5 万亿(5.5T)token 的编程相关数据上进行了训练,当天开源了 1.5B 和 7B 版本,未来还将开源 32B 版本。Qwen2.5-Math 支持使用思维链和工具集成推理(TIR)解决中英双语的数学题,是迄今为止最先进的开源数学模型系列。本次开源了 1.5B、7B、72B 三个尺寸和一款数学奖励模型 Qwen2.5-Math-RM。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

Qwen2.5 模型支持高达 128K 的上下文长度,最多可生成 8K 的内容。它们还拥有强大的多语言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。

在多模态模型领域,备受期待的视觉语言模型 Qwen2-VL-72B 正式开源!Qwen2-VL 具备强大的视觉理解能力,能够识别不同分辨率和长宽比的图片,还可以理解长达 20 分钟以上的视频内容。同时,它还支持自主操作手机和机器人的视觉智能功能,展现了高度灵活的应用场景。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

Qwen2-VL-72B 在权威测评 LMSYS Chatbot Arena Leaderboard 成为全球得分最高的开源视觉理解模型

Qwen-Max 全方位升级

现在,通义官网和通义 APP 的后台模型都已切换为 Qwen-Max,继续为所有用户免费服务。你还可以通过阿里云百炼平台调用 Qwen-Max 的 API,亲自体验它的强大实力。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

那么,Qwen-Max 到底有多厉害呢?

相比上一代模型,它在训练中使用了更多的训练数据、更大的模型规模,并进行了更深入的人类对齐,最终实现了智能水平的飞跃。在 MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench 等十多个权威基准测试中,Qwen-Max 的表现已经接近 GPT-4o,尤其是在数学能力和代码能力上,甚至超越了 GPT-4o!要知道,数学和代码所代表的推理能力可是大模型智能的核心体现。

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi
阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi

更令人兴奋的是,与 2023 年 4 月的初代通义千问大模型相比,Qwen-Max 的理解能力提升了 46%、数学能力提升了 75%、代码能力提升了 102%、抗幻觉能力提升了 35%、指令遵循能力提升了 105%。还有一个更加惊喜的数据,模型与人类偏好的对齐水平实现了质的飞跃,提升了 700% 以上。这意味着 Qwen-Max 不仅更聪明,还更懂你!

免责声明:文章内容来自互联网,版权归原作者所有,本站仅提供信息存储空间服务,真实性请自行鉴别,本站不承担任何责任,如有侵权等情况,请与本站联系删除。
转载请注明出处:阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o-阿里云 quickbi https://www.liekang.com/50018.html

本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至907991599@qq.com 举报,一经查实,本站立即删除。本文作者:小稿,如若转载,请注明出处:https://www.diehen.com/450098.html
Like (0)
小稿的头像小稿
Previous 2024年9月21日 上午1:43
Next 2024年9月21日

相关推荐

  • 今天语音搜索了吗?如何为系统做备份

    为了防止系统崩溃、中毒或修复漏洞,做好系统备份至关重要。在这里分享一种简便的方法,希望对大家有所帮助。 下载并安装一键ghost硬盘版软件 首先,在百度下载“一键ghost硬盘版”…

    投稿 2024年3月25日
  • EV录屏语言修改教程【띲띪띺띧⣼】

    在使用EV录屏软件时,有时候我们可能需要将语言设置为我们更熟悉的语言。下面将详细介绍在电脑上如何修改EV录屏的语言设置。 打开EV录屏软件首页 首先,确保你已经打开了EV录屏软件。…

    投稿 2024年3月31日
  • 柿饼的功效与作用及食用禁忌(柿饼的功效与作用及食用禁忌是哪些)

    柿饼的功效与作用及食用禁忌(柿饼的功效与作用及食用禁忌是哪些) 柿饼是一种以柿子为主要原料制作的食品,具有一些特定的功效和作用。以下是柿饼的一些常见功效与作用: 1. 调理肠胃: …

    投稿 2024年3月19日
  • 活见鬼是什么意思 真的有鬼吗?

    之所以叫“活见鬼”,乃是强调“活”字。按古人理解,人死了便要到阴间去生活,那里全是鬼,而且自己也是鬼,见鬼,自然不稀奇。而活着见到鬼,这就稀奇了。因此人们一般是以此来比喻自己遇到了…

    2024年8月12日
  • 茶叶茶的功效与作用

    摘要这篇文章帮你解决茶叶茶的功效与作用的问题,想要了解更多茶叶茶的功效与作用相关的内容,就上shhxbk.com,你想知道的这里都有。茶叶茶的功效与作用削脂减肥、延缓衰老、预防疾病适宜人群一般人群均适宜禁忌人群肝肾阴虚者辅助答案茶中茶富含大量的茶多酚成…

    2023年12月1日
  • 亚运会吉祥物(杭州亚运会吉祥物名字的由来介绍)

    杭州亚运会将于9月23日正式开幕,相信大家也都十分期待。那今天准备带各位认识下本届亚运会的三个吉祥物分别是谁,以及设计者赋予了他们哪些寓意。如果感兴趣,就一定别错过啦。 杭州亚运会…

    2023年12月14日
  • 工业啤酒是什么意思 工业啤酒与精酿啤酒有什么区别

    啤酒是我们常见的一种饮料,而啤酒也有很多分类,有的朋友不清楚什么是工业啤酒,那么工业啤酒是什么意思?工业啤酒与精酿啤酒有什么区别?工业啤酒是什么意思工业啤酒,本质上就是传统啤酒的简化版,调整了原料和酿造工艺,降低了品质,但更适合啤酒的商品化。工业啤酒与精酿啤酒有什么区别工业啤酒与…

    2023年11月24日
  • 珍珠怎样形成,珍珠是怎么产生的

    有消费者买到了各种材料制成的假珍珠。买到的却是一串串的玻璃和塑料zhū子,□ 本报记者 张丽娜塑料、玻璃、贝壳制成的假珠浙江义乌某仿真饰品工厂经理徐女士告诉记者”很多服装商都会订购…

    2023年9月19日
  • Windows 8.1优化技巧:去除桌面快捷方式小箭头【띲띪띺띧⣼】

    在使用Windows 8.1系统的过程中,或许你也会留意到桌面快捷方式上那个微小但有些碍眼的小箭头。想要让桌面更加清爽,去掉这个小箭头是一个不错的选择。接下来,我将分享如何去除Wi…

    投稿 2024年4月2日
  • 赤铁舒俱莱:能量宝石的坚固性和柔软性结合

    赤铁舒俱莱,能量宝石中的佼佼者。它将赤铁矿的坚固和舒俱徕石的柔软完美结合。老矿的舒俱来可以在身体状态好的情况下越戴越润,赤铁矿会慢慢的玉化,逐渐变成单紫色;然而当身体状况不好时,佩…

    2024年7月9日