微軟發布三款全新基礎大模型 打響多模態AI賽道卡位戰

2026-04-19
微軟於2026年4月推出三款全新基礎模型,由成立僅6個月的MAI團隊研發。三款模型分別覆蓋不同核心場景:語音轉寫模型支持全球102種語言及方言識別,嘈雜環境下識別準確率較行業主流產品高出17%;音頻生成模型僅需10秒人聲樣本即可完成音色複刻,支援8種常見情緒表達,語音擬真度達92%;圖像生成模型主打低算力消耗,在消費級GPU上即可實現1024x1024分辨率圖像的秒級生成。微軟此前憑藉Azure雲服務 OpenAI產品的組合,已拿下全球企業級AI服務市場近40%份額。