您现在的位置是:主页 > 模板分享 > 作品 >
阿里巴巴云开源QWEN3系列模型
发布时间:2025-05-02 09:35编辑:bet356亚洲版本体育浏览(185)
-
阿里巴巴云最近正式开设了Qwen3系列模型,参数仅占DeepSeek-R1的三分之一,这大大降低了使用成本。在同一天的前夕,国家计算电力服务平台超级计算互联网宣布将迅速启动所有QWEN3系列模型。此时推出的QWEN3系列包括该型号的六个密集版本,尤其是Qwen3-32b,Qwen3-14b,Qwen3-8b,Qwen3-4b,qwen3-4b,qwen3-1.7b和qwen3-0.6b。同时启动了两个MOE模型:QWEN3-235B-A22B(总参数超过2350亿个,激活参数超过220亿),QWEN3-30B-A3B(总参数为30亿,激活参数为30亿)。一系列模型是基于Apache 2.0协议的开放资源。开发人员和业务用户可以通过超级计算Internet平台下载模型文件,以实现快速开发和部署。平台aLSO表示,正准备启动QWEN3系列模型镜像和应用程序体验服务。当时,用户可能会在不配置环境并在云框外享受方便的操作而使用零代码的QWEN3对话系统。在性能方面,QWEN3-235B-A22B在基准测试(例如编码,数学和整体功能)中显示出强大的强度,与许多当前的基本模型相当。小型MOE QWEN3-30B-A3B模型也显示出明显的好处,并且超过了激活参数的QWQ-32B。即使是轻巧的QWEN3-4B型号也可以匹配QWEN2.5-72B-INSTRUKTURA。