110萬美元懸賞!AMD發起全球戰書:誰能打破DeepSeek與Kimi的推理速度極限?
在DeepSeek-R1和Kimi K2.5等頂級開源模型確立了萬億參數的工業基準后,真正的極限性能壓榨才剛剛開始。誰能在極高并發下打破內存墻?誰能用最優雅的代碼實現最高效的算子重構?在當下的AI戰場,速度即是正義,吞吐量決定生死。由AMD與GPU MODE聯合發起的極客巔峰對決,正式向全球發榜:2026線上黑客松:AMD E2E Model Speedrun正式吹響集結號!
·在這里,你將直接操控AMD專為大模型打造的頂配云端GPU陣列
·在這里,沒有紙上談兵的PPT,只有硬核的絕對速度與吞吐量。
·在這里,你的極限優化不僅能贏取巨額美金,更將直接合入主流開源框架,定義下一代AI推理的工業標準!
作為本次活動的戰略社區合作伙伴,CSDN將全程見證這場智力與算力的巔峰對決。
你,敢來迎戰嗎?

立即報名:AMD×GPU MODE - E2E Model Speedrun • Luma
(https://luma.com/cqq4mojz?utm_campaign=adp-aig&utm_medium=social&utm_source=csdn&utm_term=hackathon)
百萬美金獎池,憑實力“拿錢”
本次挑戰賽設立了高達110萬美元的總獎金池!只要你的技術夠硬,名與利雙豐收。
決賽入圍獎:只要從預選賽殺出重圍,躋身Top 10.每支隊伍保底斬獲10.000美金!
Track 1賽道桂冠(DeepSeek-R1-0528):$350.000獨攬!
Track 2賽道桂冠(Kimi K2.5 1T FP4):$650.000獨攬!
注:兩大賽道完全獨立,有實力的團隊完全可以雙線作戰,包攬百萬美金!
賽制硬核,分秒必爭的“大逃殺”
·比賽絕非易事,本次大賽將采用“底層算子突圍+端到端決賽大考”的雙階段賽制。能留到最后的,注定是地表最強的性能架構師。
·預選賽——底層內核的絕對廝殺
所有參賽者需對三大核心GPU算子進行極限打磨:
1、MXFP4 MoE(最高1500分)
2、MLA Decode(最高1250分)
3、MXFP4 GEMM(最高1000分)每個內核問題的得分=最大分值×[1-(排名分值/20)]。排名按順序所對應分值=0.1.2.…18.19.總分為三項內核問題得分之和,采用上述方法。只有排名前20的算子才能獲得積分,總分排名前10的戰隊/個人,方可拿到通往決賽的門票。
總決賽——真實世界的端到端狂飆
Top 10 選手將獲得 AMD 提供的單節點8卡云端Instinct™ GPU集群。你們需要在極致并發下,挑戰兩大明星模型:
·賽道 1:DeepSeek-R1-0528 FP4 + MTP
·賽道1評判標準

在4、32、128三種并發度下,你不僅要保證極高的吞吐量(Token Throughput),還要死守低延遲的交互性(Interactivity),更要確保模型精度不能掉(本賽道要求GSM8K≥0.93)。性能門檻(三個并發級別必須同時達標):
·賽道2:Kimi K2.5 1T FP4
·賽道2評判標準
在4、32、128三種并發度下,你不僅要保證極高的吞吐量(Token Throughput),還要死守低延遲的交互性(Interactivity),更要確保模型精度不能掉(如Track 1要求GSM8K≥0.93)性能門檻(三個并發級別必須同時達標):

評分:Token Throughput per GPU(最高600分)+Interactivity(最高400分),三個并發級別滿分3000分。
跑分不是終點
我們尋找的不是為了跑分的“特供版代碼”,而是能真正造福全人類AI社區的工業級優化。終極必殺規則:代碼必須可Merge!所有具備獲獎資格的團隊,其提交的代碼必須在賽后2-4周內,在AMD工程師的指導下,成功向AMD官方倉庫(AMD ATOM / vLLM / SGLang)發起Pull Request并完成合并。讓你的名字,永遠鐫刻在推動大模型時代前行的開源主分支上!
決戰時刻表(北京標準時間)
·報名&預選賽截止時間:4月7日2:59 PM(TOP 10誕生)
·決賽排位戰:4月8日0:00 AM——5月16日2:59 PM
·全球頒獎典禮:5月19日
如何加入這場算力狂歡?
無論你是AI底層優化老兵、CUDA/Triton極客,還是系統架構師、開源社區貢獻者,只要你對AI系統性能工程充滿狂熱,這里就是你的主場!(支持個人或至多3人組隊參賽)
第一步:加入AMD AI Developer Program,獲取官方彈藥庫。
AI開發者計劃注冊表:https://www.amd.com/zh-cn/registration/ai-dev-program-sign-up-form.html
第二步:查閱預選賽參考kernels,使用Popcorn CLI準備你的提交。預選賽入口及工具庫:https://github.com/gpu-mode/reference-kernels,別一個人戰斗!立刻加入GPU MODE Discord社區及微信比賽專屬群,與全球頂尖開發者同頻共振,獲取實時賽事更新與官方技術支持!
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
2026十大科技趨勢
2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!
[詳細]
劉烈宏:以高質量數據賦能AI創新,加快培育智能經濟新形態
當前,人工智能發展正經歷著一場前所未有的加速演進,一個又一個熱點事件接連涌現。在技術創新與商業應用的雙輪驅動下,人工智能產業規模持續增長,從去年春節DeepSeek開源模型出圈,到機器..[詳細]
AI賦能中小企業仍處于初期探索階段
新一代人工智能正在全球范圍蓬勃興起,成為新一輪科技革命和產業變革的戰略性技術和重要驅動力量。開展人工智能賦能中小企業高質量發展研究,既是人工智能技術推進規模化商業化應用、加速向..[詳細]
華為啟動“乾坤 · 眾智同行”計劃:與伙伴共同創造、共同受益,把中國方案帶向世界
AI大潮洶涌而來,千行百業都在向云端、向智能化遷移,期待新的ICT技術方案能夠帶來更高的工作效率、更好的服務品質、更理想的用戶體驗。不過每個行業的應用場景不同,每個企業的服務對象和市..[詳細]
5G-A大上行成產業共識,差異化體驗賦能行業升級
數據顯示,截止2026年1月,全球已有374個運營商部署5G網絡,為各國用戶提供了更好的體驗,也涌現了很多新的需求,比如高清直播需要大上行,人群密集場所需要大容量,工業智能化需要低時延等..[詳細]
6G時代的智能設備:反思自身、協同彼此、共同推理
經歷了MWC26,很多人都對6G有了更加直觀的認識,如同5G時代的高速率、低時延、廣連接,6G給出的答案是連接、廣域感知和高性能計算。不過,正如5G當初所暢想的智能工廠與萬物互聯,6G自然也需..[詳細]
黃仁勛:需要更多Token與工程師,這是AI革命的開工典禮
3月17日,在美國加州圣何塞開幕的GTC 2026大會上,英偉達創始人兼CEO黃仁勛開始了備受矚目的主題演講。來看他演講的觀眾需要排隊,現場人山人海。這場演講不僅有黃仁勛對過去二十年技術積累..[詳細]
我國算力規模與質量協同躍升,行業賦能效益加速釋放
當前,以大模型為代表的人工智能應用驅動全球計算技術進入新一輪創新爆發期,先進計算硬件、軟件、算法之間深度融合、協同演進,量子計算、類腦計算等前沿計算架構加快突破,算力需求呈現指..[詳細]
如何推進算電協同,筑牢綠色高效硬底座?
隨著AI浪潮的快速發展推進,全社會對算力的需求持續擴大,今年的《政府工作報告》也重點提出,要深化拓展“人工智能+”,實施超大規模智算集群、算電協同等新基建工程。在AI算力需求井噴的..[詳細]
平時不戴眼鏡的高通卡圖贊,談可穿戴設備殺手級AI應用
“我本人不戴眼鏡,只在戶外戴太陽鏡。所以對我來說,可能掛墜或項鏈這類形態會更舒服,我可以戴在胸前,隨時都能完成視覺交互。”卡圖贊隨后又以個人視角表..[詳細]













