【財新網】阿里開源大模型再迭代。6月7日,阿里云在開源社區上線了Qwen2系列模型,包含5億、15億、70億、570億、720億,五個參數版本的模型,其中Qwen2-72B模型在多個測評榜單的成績超過了Meta 4月發布的Llama3-70B模型,Qwen2-57B則為阿里云第二款混合專家模型(MoE),MoE架構在相同算力資源下性能更強,被認為是大模型技術趨勢。
阿里云提供的數據顯示,在考察常識能力、邏輯推理、數學能力的多個測評榜單中,Llama3-70B、法國大模型公司Mistral AI旗下的Mixtral-8x22B、阿里云2月發布的Qwen1.5-110B此前位于第一梯隊,榜單得分各有勝負,此次發布的Qwen2-72B得分則全面領先上述三款模型。



















京公網安備 11010502034662號 