欢迎访问上海招聘网!本站为上海找工作求职者提供上海人才招聘、上海人才市场、上海人才网等岗位信息!


职位月薪: 面议
岗位职责: 1.主导大模型后预训练全流程优化(架构设计/分布式训练/性能调优),制定后预训练与微调实施方案; 2.基于海量工业数据构建预训练基座模型,探索大模型与传统深度学习/强化学习的融合应用; 3.探索RLHF、模型蒸馏等前沿技术,跟踪大模型后预训练与微调领域最新进展并开展团队内部分享; 4.负责大模型RAG体系架构设计与代码开发,优化核心模块并制定航空领域专属适配方案; 5.推动RAG技术产品落地,对接业务部门实现智能适航、排产等场景应用,构建工艺知识图谱与LLM协同系统; 6.负责AI Agent系统设计、开发与优化,搭建维护私有化知识库,实现Agent与AI Flow框架及流程搭建; 7.完成多类大模型(Qwen/DeepSeek等)对接与部署(云端/本地); 8.主导多模态大模型核心算法研发,完成训练微调全流程,构建行业高质量数据集与专属评估体系; 9.调研多模态、RAG等领域前沿技术(GraphRAG/LLaVA等),引入适配航空制造业的技术方案并推动落地; 10.指导团队开展大模型、RAG、AI Agent相关研发工作,完成技术文档/研究报告撰写、专利申报及团队内技术分享; 11.推动大模型与C大脑的技术融合,深入理解并运用SIPOC思维链方法论,赋能相关业务场景的智能化升级与流程优化。 任职条件: 1.硕士及以上学历,计算机、人工智能、自然语言等相关专业,具有3-5年人工智能相关的工作经验; 2.有成功优化模型训练算法、提升模型性能的项目经验,能够独立承担算法设计和开发任务,能独当一面; 3.参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、强化学习、评测、推理部署等; 4.熟悉机器学习原理与算法,对深度学习算法有深度理解与实战经验,精通Python/C++等编程语言,熟悉常用框架如PyTorch,Deepspeed、Megatron等框架,有使用常见的深度学习工具如PyTorch、Tensorflow等开发大型算法系统的经验; 5.熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验,了解强化学习(PPO/DPO/GRPO/RLHF)等技术; 6.熟悉全参数、LoRA 、QLoRA、Adapter等微调方法,有微调场景落地经验; 7.熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法; 8.熟悉多模态领域算法,熟悉Llava、QwenVL等基础VLM模型,熟悉NLP领域算法,熟悉Bert、GPT、Llama等基础LLM模型,熟悉CV领域算法,熟悉ViT、DINO、SAM、GAN、Diffusion等基础CV模型; 9.熟悉数据收集、清洗和预处理的流程,有训练数据构造落地经验; 10.熟悉大模型提示设计,掌握零样本、少样本学习和链式推理(Chain-of-Thought),能根据任务需求优化提示,减少模型幻觉(hallucination)。 11.有LLM或者VLM训练、RLHF全流程开发经验者优先。
微信扫一扫,及时了解投递状态
您目前还没有登录:立即登录岗位职责: 1.主导大模型后预训练全流程优化(架构设计/分布式训练/性能调优),制定后预训练与微调实施方案; 2.基于海量工业数据构建预训练基座模型,探索大模型与传统深度学习/强化学习的融合应用; 3.探索RLHF、模型蒸馏等前沿技术,跟踪大模型后预训练与微调领域最新进展并开展团队内部分享; 4.负责大模型RAG体系架构设计与代码开发,优化核心模块并制定航空领域专属适配方案; 5.推动RAG技术产品落地,对接业务部门实现智能适航、排产等场景应用,构建工艺知识图谱与LLM协同系统; 6.负责AI Agent系统设计、开发与优化,搭建维护私有化知识库,实现Agent与AI Flow框架及流程搭建; 7.完成多类大模型(Qwen/DeepSeek等)对接与部署(云端/本地); 8.主导多模态大模型核心算法研发,完成训练微调全流程,构建行业高质量数据集与专属评估体系; 9.调研多模态、RAG等领域前沿技术(GraphRAG/LLaVA等),引入适配航空制造业的技术方案并推动落地; 10.指导团队开展大模型、RAG、AI Agent相关研发工作,完成技术文档/研究报告撰写、专利申报及团队内技术分享; 11.推动大模型与C大脑的技术融合,深入理解并运用SIPOC思维链方法论,赋能相关业务场景的智能化升级与流程优化。 任职条件: 1.硕士及以上学历,计算机、人工智能、自然语言等相关专业,具有3-5年人工智能相关的工作经验; 2.有成功优化模型训练算法、提升模型性能的项目经验,能够独立承担算法设计和开发任务,能独当一面; 3.参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、强化学习、评测、推理部署等; 4.熟悉机器学习原理与算法,对深度学习算法有深度理解与实战经验,精通Python/C++等编程语言,熟悉常用框架如PyTorch,Deepspeed、Megatron等框架,有使用常见的深度学习工具如PyTorch、Tensorflow等开发大型算法系统的经验; 5.熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验,了解强化学习(PPO/DPO/GRPO/RLHF)等技术; 6.熟悉全参数、LoRA 、QLoRA、Adapter等微调方法,有微调场景落地经验; 7.熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法; 8.熟悉多模态领域算法,熟悉Llava、QwenVL等基础VLM模型,熟悉NLP领域算法,熟悉Bert、GPT、Llama等基础LLM模型,熟悉CV领域算法,熟悉ViT、DINO、SAM、GAN、Diffusion等基础CV模型; 9.熟悉数据收集、清洗和预处理的流程,有训练数据构造落地经验; 10.熟悉大模型提示设计,掌握零样本、少样本学习和链式推理(Chain-of-Thought),能根据任务需求优化提示,减少模型幻觉(hallucination)。 11.有LLM或者VLM训练、RLHF全流程开发经验者优先。
企业尚未更新
上海-浦东新区
扫描二维码及时订阅职位
最新职位信息第一时间知晓
上海兼职招聘
360行任你挑选
分秒必争直达HR
谁看我简历早知道
请使用微信【扫一扫】
关注「上海易职邦招聘」公众号完成登录
客服电话:400-765-0056
竭诚为您服务
服务时间08:00-24:00
微信小程序
面试通知
收藏
简历
足迹
微信求职
关注公众号
掌握最新求职动态
小程序
进入小程序
随时随地找工作