【財新網】
小米首個推理大模型開源
4月30日,小米開源首個推理大模型“Xiaomi MiMo”,由預訓練和后訓練階段中數據和算法等多層面的創新聯合驅動提升推理能力,小米方面介紹,在數學推理(AIME 24-25)和 代碼競賽(LiveCodeBench v5)公開測評集上,MiMo 用 7B 的參數規模,超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview。
4月29日,騰訊宣布成立大語言模型部和多模態模型部,分別負責大語言模型和多模態模型的前沿技術研發,同時騰訊大模型團隊原有的數據平臺部將專注于大模型數據的建設,原有的機器學習平臺部聚焦機器學習和大數據融合平臺建設,這兩個部門為AI模型的訓練、推理提供底座。騰訊向財新稱,此次調整有利于整合資源,優化研發流程,提升騰訊在AI領域的長期技術作戰能力。



















京公網安備 11010502034662號 