工程岗(大模型领域)
1.7-2.2万元/月
投递简历
北京-海淀区
1-3年
大模型
2025-12-11 14:34:30 更新
被浏览:471 次
北京远浪信息技术有限公司
最近在线时间:2025-12-11 14:34:30
电话:176********
地址:北京市密云区康宝路9号院1号楼等6幢(1号楼1层2号)
职位描述
岗位职责:
1.硕士及以上学历,计算机科学与技术专业优先,计算机、人工智能、大数据知识工程、电子信息、通信等相关专业亦可。
2.具备良好的编程习惯与文档编写能力,有团队协作开发及代码评审经验,对代码质量有较高标准;熟悉常用开发规范,掌握git等开发工具,具备代码库搭建与维护的实际操作经验。
3.掌握深度学习基础理论,至少熟练使用一种深度学习框架,如PyTorch、TensorFlow、Paddle、MindSpore等,具有模型开发、部署与微调的实际项目经历。
4.对Transformer结构和深度学习有较深理解与实践积累,能够基于论文复现算法;具备大规模预训练模型研发与训练经验者优先;在ACL、EMNLP、COLING、NAACL等高水平会议发表过相关论文者优先。
任职要求:
1.从事预训练模型相关研究工作,涵盖数据预处理、算法设计、训练推理优化、模型压缩等方向。
2.能与团队成员协同配合,完成各类模块或功能的设计与实现,并开展性能优化;解决大模型研发过程中的关键技术难题,如模型评估、减少模型幻觉等问题。
3.持续创新:主动探索新技术路径,不断提升个人工作效率,增强团队协作与开发协同能力。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作