您当前的位置: 首页 > 职位列表 > 职位详情

大模型应用开发工程师(工作地:长春)

1.5-3万元/月
投递简历
重庆-渝北区
经验不限
2025-12-14 14:46:45 更新 被浏览:215 次
中科聚信信息技术(北京)有限公司
最近在线时间:2025-12-14 14:46:45
电话:155********
地址:北京市海淀区学院南路62号中关村资本大厦4层401室
职位描述

岗位职责
1.大模型应用的二次开发与参数优化:基于LangChain/LlamaIndex/Dify/Haystack/RAGFlow/Flowise等开源框架进行定制化开发,深入调整框架参数,实现个性化文档解析模块、向量索引策略设计、Agent工具集成、Prompt工程体系构建、结果重排机制、权限控制扩展等功能。
2.大模型推理引擎部署与性能优化:结合客户实际硬件环境,使用pytorch、vllm、sglang等开源框架开展推理过程调参,提升推理效率与资源利用率,确保系统运行高效稳定。
3.私有化端到端部署与项目交付:依托K8S平台完成大模型应用的定制化部署,实现从开发到生产环境的全流程落地,保障系统在客户现场的顺利运行。
4.系统持续迭代与运维支撑:承担上线后系统的版本更新、问题排查与技术支持工作,输出运维文档、故障处理流程及培训资料,保障系统长期可用性。

任职要求
1.计算机相关专业本科及以上学历,具备2年以上AI工程实施或私有化项目交付经验。
2.至少熟练掌握以下开源框架中的两项,并拥有实际部署和二次开发经历:LangChain/LlamaIndex/Dify/Haystack/RAGFlow/FastGPT/Flowise
3.至少了解一种主流大模型推理方案,如hf原生、vllm或sglang,理解其背后的推理并行技术原理。
4.精通Python与PyTorch,具备扎实的工程实现能力;能够使用C++/CUDA或Golang开发高性能计算组件或Sidecar服务。
5.掌握向量数据库(Milvus、Weaviate、PGVector、OpenSearch-k-NN)的高可用架构部署、性能调优及数据迁移方法。
6.具备强烈的技术热情,良好的表达与协作能力,对前沿技术保持敏感度,能快速融入新场景;拥有较强的逻辑分析、沟通协调、抗压与情绪管理能力。

【base城市:北京or长春】

求职提醒:求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
数据开发实习岗位
140-150元/天
浙江-宁波
2025-12-15 02:51:18
投递简历
数据分析实习生-硕士学历
150-160元/天
浙江-宁波
2025-12-14 14:51:00
投递简历
AIAgent应用开发工程师
2-4万元/月
北京-海淀区
2025-12-14 14:47:45
投递简历
风控高级建模分析工程师
2.5-3.5万元/月
北京-海淀区
2025-12-14 14:46:44
投递简历
高级数据研发技术主管
2-3万元/月
浙江-宁波
2025-12-14 14:46:28
投递简历
资深/高级分析顾问(工作地宁波)
1.5-3万元/月
上海-浦东新区
2025-12-14 14:44:45
投递简历
中级数据分析师(工作地宁波)
1.5-2.5万元/月
浙江-杭州
2025-12-14 14:43:28
投递简历
大模型应用研发工程师
1.5-3万元/月
北京-海淀区
2025-12-14 14:42:44
投递简历
数据建模师(工作地长春)
1.6-3万元/月
河北-石家庄
2025-12-14 14:42:28
投递简历
高级数据研发主管(工作地:宁波)
1.5-2.2万元/月
浙江-杭州
2025-12-14 14:41:54
投递简历
您可能感兴趣的职位 搜索更多相似职位 >
推荐企业 职位专题
中科聚信信息技术(北京)有限公司
公司主页 >
微信求职找工作
手机扫一扫
手机扫一扫
随时随地找工作

海量高薪岗位在线免费直招 招聘者/求职者电话直聊

微信小程序
手机也能找工作