算子工程师
一、岗位职责:
1、核心算子开发与优化: 负责大模型(涵盖不同架构与规模)中关键计算算子(如Attention、Linear、LayerNorm等)在昇腾910B、V100等异构计算平台上的高性能实现、定制化优化与持续迭代。
2、模型部署与性能调优:主导将多个国产及开源大模型高效部署到目标硬件平台,进行端到端的性能剖析、瓶颈定位与系统级优化,确保模型在训练与推理场景下的最佳性能表现。
3、应用系统底层支撑:为上层AI应用系统(如RAG、智能体、图像/视频智能处理、智能客服、文档智能分析等)提供稳定、高效的底层算子与计算内核支持,解决其在规模化应用中遇到的计算性能挑战。
4、技术攻关与前瞻探索:针对新兴模型架构与算法,进行前瞻性的算子设计与适配;攻坚在特定硬件平台上的疑难性能问题,探索并实现创新的优化技术。
5、协作与赋能:与算法研究、框架开发及产品团队紧密协作,理解业务需求,将优化成果产品化,并编写高质量的技术文档,赋能团队。
二、任职要求:
1、深厚的技术功底:精通C++/CUDA,熟悉Python,对计算机体系结构、并行计算有深刻理解。
2、丰富的优化经验:具有丰富的深度学习算子开发与优化经验,熟悉常见大模型的计算模式。有在昇腾(CANN)、NVIDIA(CUDA/cuDNN/TensorRT)等平台上实际开发优化经验者优先。
3、模型部署实践:熟悉PyTorch、TensorFlow等至少一种主流深度学习框架的底层机制,有大规模模型训练或推理部署实战经验。
4、问题解决能力:优秀的性能分析、定位和调优能力,能使用Nsight Compute、Profiling等工具进行深度性能分析。
三、申请材料及程序:
1、材料:
完整的个人简历(中英文)。
2、程序
请将以上申请材料发送至recruitment@sribd.cn
邮件主题应为:姓名-最高学历-毕业院校-专业-申请的岗位名称;如“张三-博士-XX大学-软件工程-AI大模型开发工程师”,研究院人力资源处将对申请材料进行初选,初选合格者将受邀参加远程面试。
四、联系方式
联系人:关老师
联系电话: 86-755-23517558