【財新網】
5月29日上午,DeepSeek上線DeepSeek-R1-0528,標志著DeepSeek R1模型迎來首次重要升級。該模型仍使用DeepSeek V3 模型作為基座,但整體表現已接近o3和Gemini-2.5-Pro等頂尖模型。DeepSeek同時還推出了基于新版R1模型訓練的小模型Qwen3-8B ,DeepSeek稱以此得到的模型能力比肩2350億參數的Qwen3-235B。

【財新網】
5月29日上午,DeepSeek上線DeepSeek-R1-0528,標志著DeepSeek R1模型迎來首次重要升級。該模型仍使用DeepSeek V3 模型作為基座,但整體表現已接近o3和Gemini-2.5-Pro等頂尖模型。DeepSeek同時還推出了基于新版R1模型訓練的小模型Qwen3-8B ,DeepSeek稱以此得到的模型能力比肩2350億參數的Qwen3-235B。
京公網安備 11010502034662號 
