【財新網】
字節跳動正加速視覺、語音等多模態模型的商業化。12月18日上午,字節跳動旗下火山引擎在上海發布豆包視覺理解模型,通過火山引擎開放給企業客戶,并再次打出了低于行業的定價。在現場演示中,豆包視覺理解模型識別出了雜志插圖中的外太空星云、一段“貪吃蛇”游戲代碼并給出修正意見、桌面上的物件和使用方法、體檢報告中的單項指標解讀、聯想圖畫想表達的諺語、推薦穿搭以及根據實物發送抖音商城里的商品鏈接等。目前豆包視覺理解模型已經接入豆包App和PC端產品。

【財新網】
字節跳動正加速視覺、語音等多模態模型的商業化。12月18日上午,字節跳動旗下火山引擎在上海發布豆包視覺理解模型,通過火山引擎開放給企業客戶,并再次打出了低于行業的定價。在現場演示中,豆包視覺理解模型識別出了雜志插圖中的外太空星云、一段“貪吃蛇”游戲代碼并給出修正意見、桌面上的物件和使用方法、體檢報告中的單項指標解讀、聯想圖畫想表達的諺語、推薦穿搭以及根據實物發送抖音商城里的商品鏈接等。目前豆包視覺理解模型已經接入豆包App和PC端產品。
京公網安備 11010502034662號 
