36 氪獲悉,小米發(fā)布和全量開(kāi)源了 MiDashengLM-7B 模型。MiDashengLM-7B 聲音理解性能在 22 個(gè)公開(kāi)評(píng)測(cè)集上刷新多模態(tài)大模型最好成績(jī)(SOTA),單樣本推理的首 Token 延遲(TTFT)僅為業(yè)界先進(jìn)模型的 1/4,同等顯存下的數(shù)據(jù)吞吐效率是業(yè)界先進(jìn)模型的 20 倍以上。在當(dāng)前版本的基礎(chǔ)上,小米已著手對(duì)該模型做計(jì)算效率的進(jìn)一步升級(jí),尋求終端設(shè)備上可離線(xiàn)部署,并完善基于用戶(hù)自然語(yǔ)言提示的聲音編輯等更全面的功能。
36氪
12小時(shí)前