欢迎访问上海招聘网!本站为上海找工作求职者提供上海人才招聘、上海人才市场、上海人才网等岗位信息!

网站地图
上海招聘网

上海站[切换城市]
  • 职位
    • 公司
    • 职位
  • 上海招聘网 www.shrszp.net 提示:

    确认
    上海招聘网 上海招聘网 > 招聘列表 > 招聘详情 >

    云网与安全团队-AI平台运维工程师

    云网与安全团队-AI平台运维工程师

    职位月薪:面议

    云网与安全团队-AI平台运维工程师

    职位月薪: 面议

    • 岗位类别:
    • 招聘类型: 全职
    • 工作经验: 不限经验
    • 工作地点: 上海市
    • 学历要求: 本科
    • 招聘人数: 1人
      福利待遇:
    • 五险一金
    • 优质平台
    • 法定节假日休息
    • 年终奖

    收藏 收藏 小程序 小程序 岗位分享 微信分享

    聊一聊 和TA聊一聊  投递简历 投个简历

    联系方式

    联系人:中国数联物流信息有限公司

    联系电话:152****5633

    点击查看
    打电话联系前先投递一份简历,面试成功率提高60%!

    (联系我时,请说是在上海易职邦上看到的)

    职位描述

    【岗位职责】 1.负责AI平台的日常运维与监控,包括GPU集群、分布式训练平台及推理服务; 2.管理和优化AI算力资源(GPU/CPU/存储/网络),实现高效调度、弹性伸缩与成本优化; 3.支持大模型和小模型的训练、微调、推理任务,保障算力任务稳定运行; 4.建立AI平台的自动化运维体系,包括监控、日志、告警、任务调度、资源隔离与容灾; 5.跟踪AI框架与平台(PyTorch、TensorFlow、vLLM、DeepSpeed、Horovod等)的技术发展并应用到运维体系; 6.制定AI平台运维规范与最佳实践,协同研发团队优化训练/推理效率; 7.处理AI平台故障与性能瓶颈,形成应急响应与持续改进方案。 【任职条件】 1.本科及以上学历,计算机、人工智能、网络工程等相关专业优先; 2.2年及以上AI平台运维或高性能计算(HPC)运维经验; 3.熟悉GPU集群管理(NVIDIA CUDA、NCCL、Slurm、K8s GPU Operator等); 4.熟悉AI框架(PyTorch、TensorFlow等)及分布式训练工具(DeepSpeed、Horovod、Ray等); 5.熟悉容器化与云原生技术(Docker、Kubernetes、Kubeflow),具备AI任务调度与隔离经验; 6.具备性能调优与故障排查能力,能解决算力瓶颈与任务失败问题; 7.具备文档编写与跨部门协作能力,能推动AI平台高效落地。 【优先条件】 -主导或参与过大规模GPU集群、AI平台或大模型训练平台的运维项目; -熟悉多云/混合云环境下的AI资源调度与成本优化; -具备AI推理服务优化经验(vLLM、TensorRT、ONNX Runtime)。

    二维码微信扫一扫,及时了解投递状态
    头像您目前还没有登录:立即登录

    【岗位职责】 1.负责AI平台的日常运维与监控,包括GPU集群、分布式训练平台及推理服务; 2.管理和优化AI算力资源(GPU/CPU/存储/网络),实现高效调度、弹性伸缩与成本优化; 3.支持大模型和小模型的训练、微调、推理任务,保障算力任务稳定运行; 4.建立AI平台的自动化运维体系,包括监控、日志、告警、任务调度、资源隔离与容灾; 5.跟踪AI框架与平台(PyTorch、TensorFlow、vLLM、DeepSpeed、Horovod等)的技术发展并应用到运维体系; 6.制定AI平台运维规范与最佳实践,协同研发团队优化训练/推理效率; 7.处理AI平台故障与性能瓶颈,形成应急响应与持续改进方案。 【任职条件】 1.本科及以上学历,计算机、人工智能、网络工程等相关专业优先; 2.2年及以上AI平台运维或高性能计算(HPC)运维经验; 3.熟悉GPU集群管理(NVIDIA CUDA、NCCL、Slurm、K8s GPU Operator等); 4.熟悉AI框架(PyTorch、TensorFlow等)及分布式训练工具(DeepSpeed、Horovod、Ray等); 5.熟悉容器化与云原生技术(Docker、Kubernetes、Kubeflow),具备AI任务调度与隔离经验; 6.具备性能调优与故障排查能力,能解决算力瓶颈与任务失败问题; 7.具备文档编写与跨部门协作能力,能推动AI平台高效落地。 【优先条件】 -主导或参与过大规模GPU集群、AI平台或大模型训练平台的运维项目; -熟悉多云/混合云环境下的AI资源调度与成本优化; -具备AI推理服务优化经验(vLLM、TensorRT、ONNX Runtime)。

    二维码微信扫一扫,及时了解投递状态
    头像您已有可投递的在线简历:点击投递
    简历完成度50%,完善简历才能找到好工作:完善简历

    公司介绍

    企业尚未更新

    工作地点

    地址上海-浦东新区

    查看地图

    看了此职位的人还会看
    查看更多相似的职位 >>

    公司信息 公司信息

    公司信息 给我留言

    推荐职位 相关公司推荐

    • 头像

      上海若济生物医药科技有限公司

      热招1个职位
      查看
    • 头像

      凯莫(上海)教育科技有限公司

      热招2个职位
      查看
    • 头像

      浚汰集团

      热招1个职位
      查看
    • 头像

      自由鸟健身工作室

      热招1个职位
      查看
    • 头像

      上海朔朔网络科技有限公司

      热招1个职位
      查看
    二维码

    扫描二维码及时订阅职位

    最新职位信息第一时间知晓

    上海兼职招聘

    • 扫码下载APP

      上海招聘网APP
    • 扫码进小程序

      上海招聘网小程序

    服务信息

    联系电话: 13916151478 杨老师

    服务时间:08:00-18:00

    上海人才招聘 | 上海招聘网 | 上海找工作 | 上海招聘 | 上海人才招聘网

    Copyright 2012-2022 上海招聘网 All Rights Reserved

    详细地址:江西省南昌市青山湖区高新大道万象汇9号楼7楼

    版权所有:江西易职邦网络科技有限公司

    ICP证:赣ICP备2021008707号-3 赣公网安备 36010202000584号

    技术支持:南昌传爱网络科技有限公司

    关注公众号

    服务时间08:00-24:00

    微信公众号

    微信公众号

    招聘交流群

    招聘交流群

    微信小程序

    微信小程序

    微信扫一扫

    面试通知

    收藏

    简历

    足迹

    微信求职

    关注公众号

    掌握最新求职动态

    微信公众号

    小程序

    进入小程序

    随时随地找工作

    小程序