9月29日消息,基准测试平台chatbot arena日前公布最新大模型盲测榜单,近日发布的阿里通义千问开源模型qwen2.5再次闯入全球十强,其大语言模型qwen2.5-72b-instruct排名llm榜单第十,是前十中唯一的中国大模型;qwen系列视觉语言模型qwen2-vl-72b-instruct排名vision榜单第九,是得分最高的开源大模型。
同一时间,全球开源社区基于qwen系列二次开发的衍生模型数量突破7.43万,超越llama系列衍生模型的7.28万。通义千问qwen成长为世界最大的生成式语言模型族群,在hugging face社区的开源模型权威榜单open llm leaderboard上,qwen系列及其衍生模型包揽了前十全部座次。
不论是模型性能还是生态影响力,qwen都创造了中国开源大模型的历史。
qwen2.5-72b-instruct排名chatbot arena大语言模型榜单第十
chatbot arena是由开放研究机构lmsys org推出的大模型性能测试平台,自2023年5月推出以来,一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。
9月19日发布的qwen2.5迅速进榜,旗舰模型qwen2.5-72b-instruct得分位列llm榜单第十,居于openai的o1、gpt-4o等模型之后,是得分最高的中国大模型;同天,开源的视觉语言模型qwen2-vl-72b-instruct闯入vision榜单第九,略逊于gpt-4o、gemini-1.5-pro等闭源模型,是成绩最好的开源模型。此前,qwen系列已有多款开源模型闯入chatbot arena榜单。
chatbot arena官方发文,qwen2-vl-72b-instruct是排名最高的开源视觉语言模型
qwen2.5的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放ai”,有用户测评发现qwen2.5从0.5b到72b都是sota水平,于是发起话题:“大家都用qwen2.5替换了哪些常用模型?”
海外开源社区盛赞qwen2.5
今年一季度,韩国最大电商平台 coupang 收入 71 亿美元,同比增长 23%,但净亏损 2400 万美元。