大模型部署工程师
2.5-3.5万元/月
投递简历
广东-广州-天河区
3-5年
大模型 · rag · python
2025-12-08 14:41:36 更新
被浏览:115 次
中电金信软件有限公司
最近在线时间:2025-12-08 14:41:36
电话:137********
地址:北京市海淀区西小口路66号东升科技园C区4号楼401室
职位描述
岗位职责:
1.主导大模型项目(如企业私有化部署、行业大模型应用、RAG系统、多模态理解等)的技术方案设计与实施交付;
2.负责大模型推理部署(GPU资源调度、分布式推理、模型加速)、API服务封装及业务系统集成;
3.统筹算法、后端、数据、前端等团队协作,保障项目按时高质量交付;
4.编写并审核技术方案、部署文档、接口说明、POC报告等项目交付资料;
5.深入客户实际应用场景,参与需求调研、方案讲解与技术答疑,提升客户认可度;
任职要求:
1.计算机、人工智能、软件工程等相关专业背景;
2.3年以上后端或AI项目开发经验,熟练掌握Python,具备大模型或分布式系统实践经验者优先;
3.掌握主流大模型架构及部署工具,如LLaMA/DeepSeek/Baichuan、vLLM、TGI、FastChat、Deepspeed、HuggingFaceTransformers等;
4.熟悉RAG检索增强生成、KVCache机制、推理优化、分布式训练/推理等核心技术;
5.具备项目交付经历,了解模型上线、效果评估、性能调优等落地环节者优先;
6.能够接受出差安排。
求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
您可能感兴趣的职位
搜索更多相似职位 >
推荐企业
职位专题
微信求职找工作
手机扫一扫
随时随地找工作