上海交通大学论坛|源来于此

 找回密码
 注册[30秒完成]
搜索
查看: 28773|回复: 0
打印 上一主题 下一主题

[招聘信息] [NVIDIA英伟达]热招深度学习性能架构师-北京/上海

[复制链接]
跳转到指定楼层
1#
发表于 2021-11-22 13:14:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
团队介绍:
NVIDIA中国计算架构团队历经CUDA并行编程模型从起步至今的所有阶段,参与了几乎所有的通用GPU计算架构的研发工作。除此之外,他们也参与了多款SDK软件的开发集成,比如开发者们熟知的cuDNN、TensorRT,以及关键MLPerf模型的优化。

我们相信,软硬件协同的解决方案,才是加速计算的未来!

岗位投递: tracyw@nvidia.com  微信: 1751315121

招聘岗位:
Deep learning performance architect-深度学习性能架构师

招聘方向:
•        通用Accelerator芯片架构
•        基于架构的算子开发、优化、编译等
•        软件库开发:TensorRT, cuDNN
•        软件开发基础架构

职位要求:
熟悉掌握计算机体系结构(通用Accelerator芯片架构方向)
熟练掌握C/C++编程(算子开发、TensorRT方向)
脚本编程、流程自动化(软件开发基础架构方向)
(加分项)掌握CUDA编程及性能优化

更多团队介绍:
NVIDIA中国计算架构团队旨在推动算法、核心加速软件库及GPU体系结构的协同优化,在高速发展及多变的深度学习算法与GPU硬件体系结构之间建立桥梁,并研发先进的软硬件协同的加速计算解决方案。

团队从高性能计算,深度学习,自动驾驶等计算应用领域出发,跟踪学界、工业界最前沿算法,并掌握其发展方向;通过对前沿算法(比如:神经网络结构)的深入理解,分析并提出芯片架构的需求:指令集、编程模型、计算能力、访存带宽、片上存储、片上网络及网络互联等。

团队同时承担基于架构优化的软件栈的开发及产品化工作:自底层加速核心算子开发及优化;TensorRT、cuDNN等核心加速库;直到上层训练框架,编译优化;混合精度、稀疏矩阵训练及量化方法开发。

基于硬件架构开发软件、算法实现,通过算法、软件开发实践反馈并推动硬件架构提升,形成闭环,最终实现软硬件协同优化,达到极致计算加速的目标:
建立下一代芯片性能模型, 搭建芯片性能分析平台,调研下一代芯片新特性;
研发及设计新的加速指令,开发原型代码,并通过迭代优化下一代芯片架构;
跟踪下一代芯片新特性在应用中的落地实现(编程模型、软件栈等);
开发集成最终软件产品库 - TensorRT,cuDNN;
优化训练框架(MLPerf 各项优化);
开发混合精度、稀疏矩阵及量化方法;

其他成果包括:历年GTC talks、各类学术论文、专利,公司内部技术大会报告等等。


您需要登录后才可以回帖 登录 | 注册[30秒完成]

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

小黑屋|手机版|Archiver|上海交通大学论坛 ( 渝ICP备17000839号-6 )

GMT+8, 2024-4-20 14:54 , Processed in 0.142734 second(s), 14 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表