奥多码,点击查看详情 97CDN云盾,点击查看详情

陶哲轩:通义千问QwQ奥数真厉害,开源大模型顶流

       
广告2021-06-03到期2021-07-03广告2021-06-03到期2021-07-03
       
广告2021-06-03到期2021-07-03广告2021-06-03到期2021-07-03

阿里云通义千问团队最新发布的开源ai推理模型qwq-32b,在ai数学奥林匹克竞赛aimo中表现惊艳,展现出强大的数学和编程能力,甚至在部分测试中超越了openai的o1模型。

QwQ,全称Qwen with Questions,是一个实验性研究模型,其核心在于赋予模型更充分的思考、质疑和反思时间,从而提升其对复杂问题的理解和解决能力。 在不到一天前,就有参赛团队使用QwQ-32B在AIMO竞赛中取得了18/20的高分,有望率先获得“Early Sharing Prize”奖金。

菲尔茨奖得主陶哲轩教授在本周五介绍了AIMO竞赛的最新进展,并指出QwQ在解决数学竞赛问题方面表现优异。 第二届AIMO竞赛奖金池已达21E Y 3 C @1.7万美元,参赛团队需公开代码、方法、数据和模型参数。本届竞赛中,QwQ系列模型占据主导地位。

QwQ的强大推理能力也体现在其他方面,社交媒体上许多用户对其推理过程赞赏有加。 HuggingFacC P ; B z b $e团队也对其测试结果表示惊叹。 有趣的是,QwQx W 2 \ 7 9 {的思考过程似乎以中文为基础,这或许是其逻辑能力强大的原因, Z [ ? j o d &之一。

在多个权威评测集上,QwQ均取得了优异成绩:GPQA评测集(科学推理)准确率达65.2%(研究生水平);AIME评测集(综合数学)胜率50%;MATH-500评测集(数学解题)得分90.6%,超越o1-preview和o1-mini;LiveCodeBench评测集(代码生成)答对一半题目。 QwQ甚至能4 F k s o T够在“猜牌”等经典智力题中,通过自我对话和反思,最终得出正确答案。

尽管QwQ展现出强大的潜力,但阿里云团队也强调其仍处于实验阶段,存在一些局限性z / Q U,例如语言混合使用、潜在偏见等,未来将通过持续研究和迭代改进。

  • HuggingFace开源地址) i [ . c R: https4 y ` y :://wS Y – i M , (ww.php.cn/link/f775ec264c01ay C # @ k 6 h j }df8189da19ec86676fe
  • HuggingFace Space体验: htt{ x : b yps://www.php.cn/link/07Z G ^ + , t S Z 96d75c0dd9ca27b2f674c8f5433f50bG n 1 [ ^

QwQ的出现,标志着开源大模型领域新一轮的竞争格局正在形成。

以上就是陶哲轩:通_ e M 1 R I Z j义千问QwQ奥数真厉害,开源大模型顶流的详细内容!

本文由【好易之】整理自网络!
原创文章,作者:【好易之】如转载请注明出处:https://www.zhengjiaxi.com/zxwd/itzx/119790.html
如有侵权,请邮件联系 aoduoye@qq.com 删除。
本站发布的文章及附件仅限用于学习和研究目的;不得将上述内容用于商业或非法用途,否则后果请用户自负。
本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。
如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
好易之的头像好易之站长
上一篇 2025-01-01 13:12
下一篇 2025-01-01 13:12

相关推荐

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询:点击这里给我发消息

 

工作时间:周一至周五,9:30-18:30,节假日休息

关注公众号
请查看头部文章来源地址!本站所有内容均为互联网收集整理和网友上传。仅限于学习研究,切勿用于商业用途。否则由此引发的法律纠纷及连带责任本站概不承担。