每日經(jīng)濟新聞 2025-04-29 06:12:15
每經(jīng)AI快訊,4月29日,阿里巴巴發(fā)布Qwen3系列模型,這是Qwen系列大型語言模型的最新成員。旗艦?zāi)P蚎wen3-235B-A22B在代碼、數(shù)學(xué)、通用能力等基準測試中,與DeepSeek-R1、OpenAI的(o1、o3-mini)、馬斯克的Grok-3和谷歌公司Gemini-2.5-Pro等頂級模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌,甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP