【財新網】開源大模型競賽持續。4月29日,阿里巴巴發布了新一代開源大模型系列Qwen3,阿里巴巴稱新模型總參數量僅為DeepSeek-R1的三分之一,部署門檻大幅降低,同時其性能優于DeepSeek-R1。用戶可以通過阿里云的企業平臺或通義App直接體驗該模型,夸克也將接入Qwen3。
Qwen3的旗艦模型采用混合專家(MoE)架構,從36T的數據量上訓練而來,總參數量為235B,激活參數量為22B。作為對照,同樣采用MoE架構的DeepSeek-V3在14.8T的數量上訓練而來,總參數量為671B,激活參數量為37B。