上海交通大学论坛|源来于此

标题: [NVIDIA英伟达]热招深度学习性能架构师-北京/上海 [打印本页]

作者: tracyw    时间: 2021-11-22 13:14
标题: [NVIDIA英伟达]热招深度学习性能架构师-北京/上海
团队介绍:
NVIDIA中国计算架构团队历经CUDA并行编程模型从起步至今的所有阶段,参与了几乎所有的通用GPU计算架构的研发工作。除此之外,他们也参与了多款SDK软件的开发集成,比如开发者们熟知的cuDNN、TensorRT,以及关键MLPerf模型的优化。

我们相信,软硬件协同的解决方案,才是加速计算的未来!

岗位投递: tracyw@nvidia.com  微信: 1751315121

招聘岗位:
Deep learning performance architect-深度学习性能架构师

招聘方向:
•        通用Accelerator芯片架构
•        基于架构的算子开发、优化、编译等
•        软件库开发:TensorRT, cuDNN
•        软件开发基础架构

职位要求:
熟悉掌握计算机体系结构(通用Accelerator芯片架构方向)
熟练掌握C/C++编程(算子开发、TensorRT方向)
脚本编程、流程自动化(软件开发基础架构方向)
(加分项)掌握CUDA编程及性能优化

更多团队介绍:
NVIDIA中国计算架构团队旨在推动算法、核心加速软件库及GPU体系结构的协同优化,在高速发展及多变的深度学习算法与GPU硬件体系结构之间建立桥梁,并研发先进的软硬件协同的加速计算解决方案。

团队从高性能计算,深度学习,自动驾驶等计算应用领域出发,跟踪学界、工业界最前沿算法,并掌握其发展方向;通过对前沿算法(比如:神经网络结构)的深入理解,分析并提出芯片架构的需求:指令集、编程模型、计算能力、访存带宽、片上存储、片上网络及网络互联等。

团队同时承担基于架构优化的软件栈的开发及产品化工作:自底层加速核心算子开发及优化;TensorRT、cuDNN等核心加速库;直到上层训练框架,编译优化;混合精度、稀疏矩阵训练及量化方法开发。

基于硬件架构开发软件、算法实现,通过算法、软件开发实践反馈并推动硬件架构提升,形成闭环,最终实现软硬件协同优化,达到极致计算加速的目标:
建立下一代芯片性能模型, 搭建芯片性能分析平台,调研下一代芯片新特性;
研发及设计新的加速指令,开发原型代码,并通过迭代优化下一代芯片架构;
跟踪下一代芯片新特性在应用中的落地实现(编程模型、软件栈等);
开发集成最终软件产品库 - TensorRT,cuDNN;
优化训练框架(MLPerf 各项优化);
开发混合精度、稀疏矩阵及量化方法;

其他成果包括:历年GTC talks、各类学术论文、专利,公司内部技术大会报告等等。







欢迎光临 上海交通大学论坛|源来于此 (http://www.isjtu.cn/) Powered by Discuz! X3.3