阿里通義千問開源負責人林俊旸在X上發文暗示,Qwen3模型有望于4月28日發布。目前,Qwen3系列模型合集曾在阿里巴巴旗下AI模型開源社區ModelScope短暫亮相后下線,包括Qwen3-4B-base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-base四款模型,均采取Apache License 2.0開源協議。盡管官方尚未正式公告,但從命名規則與前代技術邏輯來看,可以推測其技術路徑和定位方向。
此次發布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B分別對應40億、17億和6億參數,這類無后綴的命名方式可能表明它們為單架構稠密模型,未采取混合專家(MoE)設計,適合輕量化應用場景。而Qwen3-30B-A3B-base則是MoE架構的基礎模型,總參數300億(30B),動態調用30億(3B)參數處理任務。此外,Qwen3支持高達256K的上下文長度,涵蓋推理與非推理任務。
自2023年8月以來,阿里云已相繼開源了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵蓋了從0.5B到110B的不同參數規模,涉及大語言、多模態、數學和代碼等多種模態。
? 版權聲明