亚洲色图综合网_欧美一级高清在线_人人妻人人澡人人爽精品日_天天av天天av天天透_萍萍的性荡生活第六季_国产91艳遇在线观看

07/06
2025

有價值的財經大數據平臺

投稿

精品專欄

直指端側痛點 豆包向推理算力又“砍了一刀”:新模型架構最高降本83%

《科創板日報》2月12日訊(編輯 宋子喬)?豆包概念股午后大幅走強,漢得信息一度拉升封板,廣和通、移遠通信、潤欣科技、博通集成等紛紛大幅沖高。

image

消息面上,據豆包大模型團隊消息,字節跳動豆包大模型Foundation團隊近期提出一種全新的稀疏模型架構——UltraMem,該架構在保證模型效果的前提下,推理速度較傳統的MoE架構提升2-6倍,推理成本最高可降低83%。

這項創新成果已被機器學習和AI領域的頂級會議ICLR 2025接收,為解決大模型推理效率和擴展能力問題提供了全新思路。

image

直指大模型推理場景中的痛點

大模型的推理能力對應的是端側AI應用/工具的響應能力和速度。隨著模型規模的擴大,推理成本和訪存效率已成為限制大模型規模應用的關鍵瓶頸。

在Transformer架構下,模型的性能與其參數數量和計算復雜度呈對數關系。隨著LLM規模不斷增大,推理成本會急劇增加,速度變慢。

為了解決計算問題,先前的研究者提出了MoE和PKM(Product Key Memory)方案,但它們都有各自的局限性:

MoE架構犧牲了效率:MoE架構成功將計算和參數解耦,通過稀疏激活專家的方式,在訓練階段有效減少了計算量,但在推理時,由于模型在推理時只能一個字一個字的生成,batch size(批量大小)和sequence length(序列長度)通常較小,少量的token即可激活幾乎所有的專家,進而導致訪存急劇上升,進而使推理延遲大幅增加。

PKM架構犧牲了效果:PKM架構通過引入“行路由”和“列路由”機制,這種方法讓每個token在推理時僅僅只激活極少數的value(與提示模板中的內容相關聯的數據或信息),所以推理時不會遇到訪存瓶頸,但其效果很差,且擴展能力有限,難以應對更大規模的模型需求。

這些局限性使得MoE和PKM在推理效率、模型效果和擴展能力等方面的優化空間仍需進一步探索。UltraMem正是為了解決上述痛點。

據介紹,UltraMem參考了PKM的設計,但針對PKM的缺陷予以補充,以實現更高效的訪存、更優質的檢索,同時,降低了顯存和部署成本,其優勢主要在于:

降低推理成本:與傳統的MoE架構相比,UltraMem在推理成本上實現了最高83%的降低,這對于大規模模型的部署和運行具有重要意義。

提升推理速度:UltraMem的推理速度相比MoE架構提升了2-6倍,這使得模型在處理大規模數據時更加高效。

保持模型效果:在降低推理成本和提升推理速度的同時,UltraMem還保持了模型的效果,確保了模型的準確性和可靠性。

豆包研究團隊在151M、680M、1.6B三個不同規模的模型上進行了廣泛的實驗。實驗結果表明,UltraMem在模型效果和推理速度方面均優于MoE和PKM架構,且在680M、1.6B上具有顯著的效果優勢。

image

image

無論是訓練端還是推理端,當大模型廠商卷起成本,意味著AI應用將在未來更加高效、易用。

推理成本大幅降低,將助推AI技術在更多領域的應用成為可能,尤其是對于資源受限的場景,如邊緣計算和移動設備等,能讓更多企業和開發者有能力使用和部署AI模型。

對于用戶而言,UltraMem架構的突破、推理速度的提升可使AI應用如智能助手、自然語言處理等在實時應用中響應更迅速,交互更流暢,優化用戶的使用體驗,提高內容創作、日常辦公等場景下的效率。


AI財評
字節跳動豆包大模型團隊提出的UltraMem架構,通過創新的稀疏模型設計,顯著提升了AI大模型的推理效率和成本效益。這一技術突破不僅降低了高達83%的推理成本,還提升了2-6倍的推理速度,為大模型的廣泛應用鋪平了道路。從財經角度看,這種成本效益的提升將加速AI技術在邊緣計算和移動設備等資源受限場景的部署,推動AI應用的普及和商業化進程。同時,推理速度的提升也將增強用戶體驗,促進AI助手和自然語言處理等實時應用的發展,為相關企業帶來新的增長點。總體而言,UltraMem架構的推出,預示著AI技術成本的進一步降低和效率的提升,將對整個AI產業鏈產生深遠影響,值得投資者密切關注。
注:本文轉載自科創板日報,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如有侵權行為,請聯系我們,我們會及時刪除。
主站蜘蛛池模板: 台湾久久| 粉色视频在线观看免费 | 日本潮喷videos | 成人在线国产 | 性一交一乱一伦一色一情丿按摩 | 亚洲色网址大全 | 精品人妻无码一区二区三区三十路 | 国内精品久久久久精免费 | 婷婷色婷婷开心五月四房播播 | 亚洲高清人人爽夜夜爽AV毛片 | 国产三级性爱视频 | 日本高清一道本 | 99视频精品全部国产 | YYY6080韩国三级理论久久 | 亚洲午夜久久久精品一区二区三区 | 五月花激情网 | 久久人做人爽一区二区三区小说 | 三级理论日韩欧美 | AV天堂久久天堂色综合 | 加山夏子av | 日韩人妻无码精品-专区 | 欧美精品一二三四 | 亚洲97| 亚洲hd| 东方欧美亚洲色图 | a一级免费视频 | 国产成人综合色视频精品 | 中文字幕成人网 | 国产精品无码a片福利院网站 | 免费看成人 | 久久久久久久美国产毛片 | 国产精品久久久福利 | 天堂亚洲AV在线观看 | 亚洲AV无限在线观看 | 亚洲大码熟女在线观看 | 波多野结衣中文字幕免费视频 | 国产免费av一区二区三区 | 不卡视频一区二区 | 在线天堂中文在线资源网 | 97人人超碰国产精品最新O | 男女野外做爰全过程69影院 |