阿里云AI模型通义千问在日经4月评分榜中位居第6且存在感提升

AI世纪 2025-05-07
大模型 2025-05-07

阿里云的AI模型“通义千问(Qwen)”()

在日经4月公开的“AI模型评分”榜中,阿里云的“通义千问(Qwen)”模型超过了中国的模型,在113个模型中位居第6。作为开源模型,通义千问正在得到很多日本新兴企业的使用。在评分榜位居日本企业首位的模型正是基于通义千问开发……

中国阿里巴巴集团旗下的阿里云( Cloud)的人工智能(AI)模型“通义千问(Qwen)”在日本的存在感在提高。作为向外部开放技术的开源模型,通义千问正在得到包括AI开发企业ABEJA等日本国内新兴企业的使用。在日本经济新闻(中文版:日经中文网)4月公开的“AI模型评分”榜中,通义千问的模型超过了中国的模型,位居第6。

ABEJA于4月17日发布了新模型“QwQ-32B Model”。该模型为能够进行连贯性思考并输出答案的逻辑推理型,展现出了很高的性能。该模型的开发基础正是阿里巴巴的通义千问模型。

日本经济新闻旗下的专业媒体“ ”用日语对中日美等国家的主要AI模型进行性能测评后的综合排名显示,今年1月发布的“Qwen2.5-Max”在113个模型中位居第6位。除了语法等基础语言能力之外,该模型还在逻辑推理和数学方面取得了好成绩。

通义千问的另一大特点是作为开源模型展现出了高性能。开源型“Qwen2.5-32B” 在模型评分榜中位列第26位。超过了美国谷歌的开源型AI“Gemma-3-27B”(排名第32位)以及美国Meta的“Llama-3-70B-”(第57位)。

开源模型可供外部企业进行学习并开发自己的AI。在模型评分榜中,位居日本企业首位(在总体排名中位居第21位)的模型“ABEJA-Qwen2.5-32B”也基于通义千问开发。

在日本的新兴企业中,源自东京大学的ELYZA(东京都文京区)于5月1日公开了基于通义千问开发的模型。同样源自东京大学的(东京都千代田区)以及(札幌市)也在利用通义千问。

日本野村综合研究所的李智慧就通义千问指出:“由于能以较少的数据集实现较高的精度,因此在多个指标上的高度的日语能力得到了评价”。

通义千问在日本以外也受到高度关注。据阿里云介绍,在程序共享网站“ Face”上,已开发出的通义千问的派生模型达到10万多个。李智慧表示,与其他中国开放模型相比“(通义千问的)实力在全球范围内受到好评”。

阿里云也在考虑面向日本企业提供模型的调试和定制服务。据该公司表示,在日本国内服务器上部署AI模型的服务“可以在不将数据转移到海外的情况下利用通义千问”。

阿里云日本公司的与谢野表示:“希望不断引进中国的成功案例”

目前,阿里云已经在与日本国内的多家企业进行洽谈,日本负责人与谢野正宇表示,使用通义千问模型的项目将在“3年内增加到1000个以上”。

阿里云4月29日还公开了最新模型群Qwen3。用于提前学习的数据的Token(令牌,模型处理文本的最小单位)数量约为36万亿,是Qwen2.5的约两倍。支持119种语言和方言等,显示出迅速的发展。

在开放模型领域,同样来自中国的新兴企业深度求索()也在崛起,其模型在行政、汽车、金融等广泛行业中得到应用。开放模型的特点是由于被大量开发者使用,容易进行验证和改进。采取开放战略的中国AI在性能方面紧追等美国企业的局面可能会持续一段时间。

日本经济新闻(中文版:日经中文网)杉山翔吾、岩泽明信、贵岛逸斗、江口良辅

AI模型评分的调查概要:

与提供机器学习工具的美国 & 公司实施联合调查,不定时对日本国内外主要AI模型的性能进行评测。5月22日公开的评分共针对113个模型的语言能力和伦理观等进行了综合评测。采用的是可以用日语评测性能的方式,输入问题并对回答的文本进行评分和评价。每个模型回答的问题数量超过6000个,分别针对“会话和创作能力”、“道德性”等15种项目,取正确率等的平均值,并作为偏差值计算出每个模型的评分。