<匯港通訊> 阿里巴巴(09988)旗下千問發布新一代全模態大模型Qwen3.5-Omni,可支持文本、圖片、音訊、音視頻理解、推理和交互任務共取得215項任務中獲得SOTA(性能最佳)成績,更超越Google的Gemini-3.1 Pro。
據介紹,模型在海量文本、視覺及超過1億小時音視頻數據上進行原生多模態預訓練,相比Qwen3-Omni,Qwen3.5-Omni多語言能力大大增強,能支持113種語種和方言語音辨識和36種語種和方言的語音生成。目前可通過Offline API和Realtime API進行體驗。其中,通用音訊理解、推理、識別、翻譯及對話全面超越Gemini-3.1 Pro,音視頻理解能力總體達到Gemini-3.1 Pro水平,視覺及文本能力達到同尺寸Qwen3.5模型效果。
一般用戶可於Qwen Chat免費體驗,開發者和企業可通過阿里雲百煉平台使用,每百萬Tokens少於0.8元人民幣,比Gemini-3.1 Pro的十分一還低。
#Qwen3.5-Omni (ST)
新聞來源 (不包括新聞圖片): 滙港資訊