![]()
NVIDIA 歷代架構以科學家名字命名
NVIDIA 專注于每一代產品的架構設計,構思軟硬件協同解決方案,分析前沿 AI 模型性能,探索下一代產品的無限可能。
想象一下,您正站在科技的前沿,參與構建改變世界的架構。從計算架構到 TPC 架構,我們的團隊像一支技術先鋒隊,致力于將復雜的計算變得簡單而高效。每一次的架構創新,都是一次探索未知的冒險。現在,我們邀請你加入這個充滿激情與創造力的團隊,一起探索未來的無限可能!
NVIDIA 中國計算架構團隊眾多校招職位正在熱招中,我們誠邀優秀的應屆畢業生加入我們,成為構建未來計算架構的新生代力量,與 NVIDIA 一起共同推動科技的邊界!
團隊介紹
Deep Learning And Compute Arch(計算架構團隊)歷經 CUDA 并行編程模型從起步至今的所有階段,參與了幾乎所有的通用 GPU 計算架構的研發工作,集成了無數計算架構團隊伙伴們的智慧。
我們不同的分支團隊專注于各自領域,攜手創造出令人驚嘆的技術成果。每個團隊都在推動前沿技術的發展,致力于解決復雜的計算挑戰。
想知道他們在具體從事哪些工作,以及你的背景和技能是否與之匹配嗎?我們將為你揭秘,幫助你更好地了解每個團隊的獨特使命和機遇。
TensorRT
TensorRT 團隊主要負責設計和開發可擴展到多個平臺的強大推理軟件,并對重要模型進行性能分析和優化。
團隊緊跟 AI 領域的學術進展和業界 AI 推理服務與應用部署中的實際需求,設計,開發和更新 TensorRT 的功能。
成功密碼:C++ 編程、深度學習框架、LLM、生成模型、推薦模型
TensoRT LLM
TensoRT LLM 團隊是基于軟硬協同以及模型聯合優化的設計理念,推進 LLM 推理性能的技術邊界。
團隊工作支撐公司內外重點核心場景,包括但不限于 MLPerf, SemiAnalysis InferenceMax, ArtificialAnalysis, CSP 以及 AI start-up 客戶;同時推進當代主流硬件上的大模型推理性能全棧優化,以及深度參與未來架構的演進探索。
成功密碼:大模型場景的推理優化、模型系統聯合優化
DL Complier
DL Complier 團隊基于 MLIR 技術棧,開發 NVIDIA GPU 上面向不同層級應用場景的深度學習編譯系統,包括代碼生成系統、運行時、領域編程語言、算子調優等。
團隊的工作作為基礎編譯系統支撐公司內外重點核心 AI 場景的算子開發任務;推進從上層編程模型到底層編譯系統的全鏈路優化設計,深度參與未來軟硬系統架構的演進探索。
成功密碼:深度學習編譯器、AI 工作負載
LLM Post-Train
LLM Post-Train 團隊負責持續迭代 NeMo RL 的特性,性能優化以及 bug 修復;跟進 LLM RLHF 的算法,在 NeMo RL 中實現;支持新的 GPU 硬件架構以及在 RLHF 框架中優化相關性能;支持新的應用場景,例如 Agentic RL, VLM 等。
LLM Post-Train 團隊基于 NVIDIA 自研高性能與 scalable 的 RLHF 框架、跟隨前沿 RL 算法、實現算法與系統高度結合。
成功密碼: LLM 推理框架與優化技巧與原理,FSDP 或 Megatron LM 強化學習算法,分布式計算
cuDNN
cuDNN 團隊的工作核心在于開發和優化 NVIDIA 的 cuDNN 深度學習加速庫,重點是 GPU 架構下的高性能計算與深度神經網絡支持。團隊中的工程師們將參與大模型推理性能優化、API 與架構設計、GPU 內核開發,并在跨團隊協作中支持多種 AI 應用場景。
團隊位于 NVIDIA AI 軟件棧核心,是支撐 LLM、自動駕駛、計算機視覺等關鍵應用的基礎設施團隊。加入該團隊能直接影響全球最前沿的 AI 技術落地,并有機會與頂尖 GPU 架構師和深度學習專家密切合作。
成功密碼:GPU 編程與優化,性能分析與調優,機器學習或深度學習,編譯器開發
DL Compute
DL Compute 團隊(Performance Modelling, Analysis, Projection Optimization)主要負責構建并開發推理算子原型,建立算子硬件架構性能模型,預測 NVIDIA 下一代產品的性能分析,優化算子在現有產品和最終大模型上應用的性能并且探索下一代架構特性。
在 DL Compute 團隊工作能深度參與所有 NVIDIA 的 GPU 和 SOC 芯片架構設計,從 Volta, Ampere, Hopper, Blackwell, Rubin 等 GPU 架構,到 Orin, Thor 等 SOC 芯片,并延伸至推理引擎庫(TRT、TRT-LLM、cuDNN 等)的全鏈路追蹤,最終探索下一代架構的未來特性。
成功密碼:軟硬件性能分析、編程模型、CUDA、AI 編譯技術、主流 LLM 框架
無論你對以上哪個領域感興趣,我們的團隊都能為你提供廣闊的發展空間與挑戰。
期待你的加入,與我們一起開創計算架構的未來!
面向人群
電子工程、計算機工程等相關專業
2026 屆本科、碩士、博士應屆畢業生(校招崗位)
2027 屆本科、碩士、博士全日制在讀學生(實習崗位)
工作地點
上海、北京
計算架構組申請方式
2026 屆校園招聘崗位 | 點擊「鏈接」立即投遞
2026 春季實習生崗位 | 點擊「鏈接」立即投遞
學長分享:
從計算架構到世界第八高峰馬納斯魯
2025 年 9 月 23 日,NVIDIA 上海計算架構團隊的 Xiaolei Shi 將印有“Speed of Light”的綠色條幅帶上馬納斯魯峰(8163米)頂峰。這位從清華 GPU 編程愛好者成長為架構工程師的攀登者,用 12 個月“目標分解法”訓練計劃征服 8000 米級雪山。Xiaolei 指出,攀登高峰與 NVIDIA 文化高度契合 —— 目標的升級迭代、第一性原理聚焦瓶頸、團隊協作信任貫穿始終。
![]()
更多校招、實習生崗位持續熱招中,點擊「鏈接」投遞吧!
加入 NVIDIA,你將收獲
- 與行業領袖并肩工作的機會
- 參與改變世界的項目
- 持續的職業發展和海量學習資源
- 有競爭力的薪酬和福利
- 全方位的健康保障項目
- ESPP 員工購股計劃
NVIDIA 致力于創建具有多元化與包容性的工作場所,我們歡迎多元背景的人才加入!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.