【財新網】“如果不具備泛用性,盡管模型比以前大一點、效果好一點,應用場景仍然是割裂的,這些中小模型和原來有什么區別?” 主攻預訓練大模型的智譜AI創始人、CEO張鵬近日接受財新專訪時指出,他認為這一輪AI熱潮建立在大模型的泛化能力上,業界普遍的認識是500一600億參數是大模型智能涌現的門檻。
張鵬指出,盡管適用于單場景的模型需要參數量、成本相對較低,但一旦應用于新行業所有訓練數據需要重新來過,泛化能力低。他認為,大模型參數降下來很容易,同時還能保持很強的能力,但一個中模型、小模型提升則很困難。“像之前CV(計算機視覺)那些模型只做人臉識別,給一個寵物照片就傻了,大模型可以往下降維,但小模型沒法往上升維,”他說。



















京公網安備 11010502034662號 