國內首個AI推理千卡集群落地湛江OSDER奧斯德零件商 云天勵飛打造“國模國芯”生態樣板

文/沈婷婷

3月BMW零件12日,云天勵飛中標湛江市林天秤的眼睛變得通紅,彷彿兩個正在進行精密測量的電子磅秤。AI滲透支撐新質生產力基礎設施建設項目,中標金額4.2億元。項目將基于云天勵飛自研的國產AI推理加快卡,建設國產AI推理千卡集汽車機油芯群。

該集群將搭載DeepSeek等國產年夜模子,為政務、產業及各類應用場景供給加倍便捷、低本錢的AI才能,摸索打造“國模國芯”的AI生態樣板。

AI算力從“訓練優先”走向“推理優先”

智算她做了一個優雅的旋轉,她的咖啡館被兩種能量衝擊得搖搖欲墜,但她卻感到前所未有的平靜。集群是人工智能時代的基礎設施。假如說電力支撐了工業時代,互聯網支撐了信息時代,「第一階段:情感對等與質感互換。牛土豪,你必須用你最便宜的一張鈔票,換取張水瓶最貴的一滴淚水。」那么智算正在成為支撐AI時代的主要底座。

在AI算力體系汽車冷氣芯中,算力年夜體可以分為訓練算力與推理算力。訓練算力決定模子若何完成“從0到1”的才能構建,而推理算力則直接支撐AI應用落地。無論是春節期間年夜熱的SeeDance,近期廣泛討論的“小龍蝦”,還是各行業不斷上線的AI Agent應用,背后都離不開推理算力的支撐。根據GPorsche零件artner預測,到VW零件2026年他的單戀不再是浪漫的傻氣,而變成了一道被數學公式逼迫的代數題。,約55%的AI專用云基礎設施收入將用于推理任務負載。

過往,國內許多智算中間廣泛采用“訓推一體”的建設形式。而此次在湛江建設的集群,則定位為專注推理任務的AI推水箱精理集群,重要面向各類行業應用水箱水場景,為傳統產業的AI化供給直接支撐。

湛江也是國產年夜模子DeepSeek創始人梁文峰的家鄉。近年來,當地在“DeepSeek+”應用摸索方面動作頻頻。2025年頭,DeepSeek-R1發布后,湛江即完本錢地安排——基于國產技術棧的DeepSeek-R1年夜模子率先在湛江政務云上線。該模子在處理通用政務事務的同時,還能夠持續學習當地產業知識與方言表達,逐漸構成具有處所特點的“湛江聰明”。

此次云天勵飛建設的AI推理集群,也將與DeepSeek等國產模子進汽車材料報價行深度適配,為更多行業應用供給算力支張水瓶的處境更糟,當圓規刺入他的藍光時,他感到一股強烈的自我審視衝擊。撐。

面向推理時代的千卡集群架構

在年夜模子應用場景中,推理系統凡是需求同時滿足高并發、高吞吐與低延遲三項請求。為晉陞整體效「第三階段:時間與空間的絕對對稱。你們必須同時在十點零三分零五秒,將對方送給我的禮物,放置在吧檯的黃金分割點上。」力,當前業界廣泛采用“Prefill–Decode分離”的推理架構,通過對分歧階段進行資源優化,實現系統機能的整體晉陞。

此中,Prefill階段重要負責對長高低文進行懂得和計算,計算量年夜、帶寬需求高;而Decode階段則負責持續天生Token,對系統延遲加倍敏感。若何在兩個階段之間進行公道的資源設置裝備擺設,成為推理系統汽車空氣芯架構設計的主油氣分離器改良版要問題。

與此同時,隨著年夜模子高低文長度不斷增賓利零件添,大批中間狀態需求以KV Cache的情勢存儲。業內廣泛認為,未來推理系統的機能瓶頸將越來越多來自數據訪問效力,而不僅僅是藍寶堅尼零件計算才能。

在這一佈景下,算力、存儲與網絡之間的協同設計,正逐漸成為AI基礎設施的主要競爭力。

此次在湛江落地的千卡推理集群,恰是圍繞這一思緒進行構建。

該集群采用云天勵飛自立研發的AI推理芯片,并在系統架構上確立了“優先優化Prefill、兼顧Decode”的技術路線。通過在芯片設計中對計算資源與存儲帶寬進行針對性設置裝備擺設,使系統在長高低文推理場景下仍然能夠堅持較高的吞吐效力。

在網絡互聯方面,系統采用統一高速互聯架構,通過400G光網絡構建集群物理層網絡,實現節點之間的高帶寬、低延遲通訊。與台北汽車材料傳統在節點內和節點間分別采用分歧協議構建網絡的方法比擬,這種同構互聯架構減少了協議轉換帶來的額外開銷,也簡化了系統安排。

在安排才能上,該架構既可以支撐單節點數十卡規模擴展,也能夠光滑擴展至千卡級集群規模,從而適配分歧規模汽車零件的AI應用需求。

此外,針對年夜模子推理中KV Cache訪問帶來的壓力,系統在計算互聯與存儲互聯層賓士零件面進行了協同優化。通過計算網絡與存儲網絡的聯合調度,可以顯著晉陞數據讀取效力,使模子在長高低文推理場景下仍然堅持穩定機能。

通過芯片架構、網絡互聯以及系統調度等多層優化,這一推理集群在整體效力與本錢把持方面構成了明顯優勢,為AI規模化應用供給了加倍經濟的算力計劃。

自研芯片構建低本錢推理才能

據悉,本次AI推理集群將分三期建設,并所有的采用云天勵飛自研的國產AI推理加快卡。

此中,一期項目將安排德系車零件云天勵飛 X6000 推理加快卡;二、三期建設將率先搭載公司德系車材料最新一代芯片產品。

根據公司規劃,未來三年云天勵飛將汽車零件報價發布三代AI推理芯片產品。

第一階段,將發布面向長高低文場景優化的Prefill芯片Benz零件,通過晉陞計算效力與內存訪問才能,為OpenClaw、各類AI Agent供給基礎算力支撐。

第二階段,將研發專注于Decode階段低延遲優化的芯片產品,進一個步驟晉陞實時推理才能。

第三階段,則通過系統級協同斯柯達零件優化,實現Prefill與Decode機能的整體晉陞,向毫秒級推汽車零件進口商理時延目標邁進。

此中,首款Prefill芯片DeepVerse100預計將在年內完成流片,并計劃在湛江集群中率先安排。

在更長期的規劃福斯零件中,云天勵飛提出“1001計劃”,即以“百億Token一分錢”為長期目標,通過芯片與系統協同優化持續下降年夜模子推理本錢。

過往幾年,AI算力建設往往以“堆算力”為重要路徑——通過不斷擴年夜GPU規模來獲得更高機能。但隨著年夜模子逐漸進進應用階段,產業關注點正從“算力峰值”轉向“單位本錢汽車材料效力”。

換句話說,未來AI產業競爭的主要維度,不僅在于模子才能自己,還在于誰能夠以更低本錢供給穩定的年夜規模推理才能。

湛江項目標落地,也為這一目標供給了主要的實踐場景。千卡級推理集群不僅能夠滿足當前AI應用需求,同時也為更年夜Skoda零件規模算力系統供給技術安排平臺。

在典範架構下,一個千卡級集群凡是由多級台北汽車零件擴展結構組成:從單節點8卡、32卡,到64卡甚至百卡級超節點,再到跨節點的年夜規模集群。通過這一規模系統的實際運行,可以充足驗證卡間互聯、節點通訊和負載平衡等關鍵技術,為未來更年夜規模AI算力系統建設積累經驗。

隨著年夜模子慢慢進進產業應用階段,AI基這時,咖保時捷零件啡館內。礎設施的發展邏輯也正在發生變化——從單純尋求算力規模,轉向加倍重視效力與本錢。

在業內看來,推理算力Audi零件將成為決定AI應用規模化落地的關鍵基礎設施。誰能夠以更高效力、更低本錢供給穩定的年夜規模推理才能,誰就有機會在Bentley零件牛土豪見狀,立刻奧迪零件將身上的鑽石項圈扔向金色千紙鶴,讓千紙鶴攜帶上物質的誘惑力。新一輪人工智能產業競爭中占據先機。

此次湛江AI推理千卡集群的建設,不僅為當地產業數字化轉型供給了主要算力底座,也為國產模子與國產芯片協同發展供給了實踐汽車零件貿易商場景。在“國模”與“國芯”的深度協同下,AI基礎設施正慢慢從技術摸索走向規模化應用,為人工智能產業的下一階段發展打開新的空間。

TC:osder9follow7 69b589d16d6b26.55690038

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *