DeepSeek之后，又一個中國大模型企業重磅宣布

02-06 行業動態

近日，百度智能云成功點亮昆侖芯三代萬卡集群，這也是國內首個正式點亮的自研萬卡集群。據悉，百度智能云將進一步點亮3萬卡集群。這一重大突破標志著百度在人工智能算力領域邁出了堅實的一步，不僅為百度自身的技術發展提供了強大動力，也為整個中國科技界、互聯網行業和AI行業帶來了新的發展機遇。

萬卡集群優勢凸顯，助力算力突破與成本優化

萬卡集群的建成不僅為百度帶來了強大的算力支持，還推動了模型降本的趨勢。在過去一年中，整個行業都在努力降低大模型的使用成本，而算力緊張是導致成本居高不下的重要因素之一。百度通過自研芯片和大規模集群的建設，不僅解決了自身算力供應的問題，還為整個行業提供了新的思路和方向。

從算力上看，超大規模并行計算能力可實現訓練效率躍升，萬卡集群可將千億參數模型的訓練周期大幅降低，滿足AI原生應用快速迭代的需求。同時也能支持萬億參數模型、復雜任務和多模態數據，支撐Sora類應用的開發。此外，萬卡集群能夠支持多任務并發能力，通過動態資源切分，單集群可同時訓練多個輕量化模型，通過通信優化與容錯機制減少算力浪費，實現訓練成本指數級下降。

隨著國產大模型的興起，萬卡集群逐漸從“單任務算力消耗”到“集群效能最大化”過渡，通過模型優化、并行策略、有效訓練率提升、動態資源分配等手段，智能調度任務，將訓練、微調、推理任務混合部署，從而提升集群綜合利用率，降低單位算力成本。

百舸賦能，全方位提升集群性能與穩定性

過去，多芯混訓和激增的故障率等難題，成為萬卡集群部署過程中的巨大挑戰。而24年9月升級的百度百舸AI異構計算平臺4.0，在萬卡集群的建設中發揮了至關重要的作用。

首先，突破硬件擴展性瓶頸，如卡間互聯的拓撲限制，避免通信帶寬成為瓶頸；同時，圍繞芯片及集群功耗，基于萬卡規模常規方案功耗可達十兆瓦或更高，采用創新性散熱方案，從而解決萬卡集群的能效與散熱問題；完善模型的分布式訓練優化，采用高效并行化任務切分策略，訓練主流開源模型的集群MFU提升至58%；在提升穩定性方面，提供容錯與穩定性機制，避免由于單卡故障率隨規模指數上升而造成的萬卡集群有效性大幅下降，保障有效訓練率達到98%；最后，針對機間通信帶寬需求，建設超大規模HPN高性能網絡，優化拓撲結構，從而降低通信瓶頸，帶寬有效性達到90%以上。

日前，花旗銀行發布研報表示，DeepSeek、百度等中國模型展現出高效和低成本優勢，將有助于加速全球AI應用開發，并在全球引發更多技術創新，推動2025年人工智能應用的拐點。中國工程院院士、清華大學計算機系

網絡編輯：kuangyx

DeepSeek之后，又一個中國大模型企業重磅宣布

萬卡集群優勢凸顯，助力算力突破與成本優化

百舸賦能，全方位提升集群性能與穩定性

DeepSeek之后，又一個中國大模型企業重磅宣布

萬卡集群優勢凸顯，助力算力突破與成本優化

百舸賦能，全方位提升集群性能與穩定性