阿里巴巴推出通义千问2.5 号称性能超越GPT-4 Turbo

导读：

内容激励收益最高达万元美团视频公布了最新的创作激励计划春鸣计划砸下重金死磕短视频在一些内容从业者的角度看来美团视频对于创作者尤其是中小创作者来月日消...

内容激励收益最高达3万元。美团视频公布了最新的创作激励计划“春鸣计划”，砸下重金，死磕短视频。在一些内容从业者的角度看来，“美团视频，对于创作者尤其是中小创作者来

5月9日消息:在人工智能领域，阿里巴巴再次取得重大进展，于5月9日正式发布了版本。该版本在模型性能上全面超越了GPT-4Turbo，标志着阿里巴巴在AI技术发展上的又一重要里程碑。

通义千问2.5的主要提升包括:

理解能力提升9%:在文本理解方面，相较2.1版本有了显著增强。

逻辑推理能力提升16%:在处理复杂逻辑问题时表现更加出色。

指令遵循能力提升19%:更好地理解和执行用户的指令。

代码能力提升10%:在编程相关任务中展现出更强的能力。

在权威基准测试OpenCompass上，通义千问2.5的得分与GPT-4Turbo持平，显示出其卓越的性能。

开源模型Qwen1.5-110B的亮点:

阿里巴巴还发布了1100亿参数的开源模型Qwen1.5-110B，在多个基准测评中超越了Meta的Llama-3-70B模型，成为开源领域的新星。

在HuggingFace推出的Open LLM Leaderboard上，Qwen1.5-110B模型荣登榜首，证明了通义系列在业界的竞争力。

通义千问的其他专长:

通义千问的视觉理解模型Qwen-VL-Max在多模态标准测试中超越了Gemini Ultra和GPT-4V，已在多家企业中得到应用。

通义千问的代码大模型CodeQwen1.5-7B在HuggingFace的Big Code模型榜单中排名第一，拥有国内最大的用户规模。

通义大模型的广泛应用:

自问世一年多以来，通义大模型已经发展出包括文生图、智能编码、文档解析、音视频理解等在内的多项能力。企业客户和开发者可以通过API调用、模型下载等方式接入通义，而个人用户则可以通过通义APP、和小程序免费使用通义家族的全栈服务。

阿里巴巴的这一新发布再次证明了其在AI领域的领导地位，并且通过不断的技术创新，为各行各业的智能化转型提供了强有力的支持。