大模型训练系统优化高级研究员

7 months ago


Beijing, China Lenovo Full time

Description and Requirements

岗位职责:

1. 负责设计高可用大模型训练容错系统,支持千亿大模型预训练

2. 负责大模型训练容错checkpoint优化,提升大模型checkpoint读写与恢复性能

3. 负责大模型弹性训练框架的研发

岗位要求:

1. 全日制硕士以上学历,计算机科学与技术、人工智能等相关专业;

2. 熟练C++/Python语言、数据结构以及计算机系统结构,有AI模型性能调优经验,以及良好的工程实现能力;

3.熟悉 AI 领域常见的分布式训练技术,包括但不限于:数据并行、流水线并行和张量并行等,具有相应的项目经验;

4. 至少熟悉一种AI框架(PyTorch/TensorFlow/Paddle/DeepSpeed等),能够熟练使用和调试;

5. 熟悉 GPU 硬件结构和 CUDA 计算原理,有 CUDA 相关算子开发、调试经验,对 NCCL/cuDNN等有一定了解;

6. 对大规模预训练模型有较好的了解,熟悉常见的预训练模型(如GPT、BERT等)结构、训练方法和优化技巧。

7. 具备出色的问题解决能力和创新思维,能够分析和解决复杂的训练问题,并提出改进和优化的方案;

8. 具有良好的团队合作精神,能够与跨部门的团队紧密合作,共同推动项目的成功。

加分项:

1. 有大模型研发和分布式训练经验

2. 熟悉Kubernetes架构以及大模型训练容错系统

3. 在AI或者HPC领域发表过高水平论文

Additional Locations : * China - Beijing - 北京(Beijing) * China * China - Beijing * China - Beijing - 北京(Beijing)

  • Beijing, China Lenovo Full time

    Description and Requirements ...

  • AI系统优化专家

    1 month ago


    Beijing, Beijing, China Lenovo Full time

    .Lenovo正在招聘高级研究员加入我们团队 薪酬: 250,000 - 300,000 CNY / 年 岗位职责:设计和开发高可用大模型训练容错系统,支持千亿大模型预训练进行大模型训练容错checkpoint优化,提升大模型checkpoint读写与恢复性能负责大模型弹性训练框架的研发...


  • Beijing, China Tencent Full time

    混元深度学习框架高级研发工程师(大模型预训练) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 五年以上工作经验 更新于年05月07日 岗位职责 ...


  • Beijing, China Tencent Full time

    QQ#多模态内容理解高级算法研究员# 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 PCG 点击了解更多BG信息 技术 不限 更新于年06月02日 岗位职责 ...


  • Beijing, China Tencent Full time

    微信NLP算法研究员(北京/深圳/上海) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 WXG 点击了解更多BG信息 技术 两年以上工作经验 更新于年05月17日 岗位职责 1.参与大规模 AI...


  • Beijing, China Cummins Inc. Full time

    DESCRIPTION This position is not available in GPP database. Talent Acquisition team member will fill in the Posting description after intake meeting. RESPONSIBILITIES This position is not available in GPP database. Talent Acquisition team member will fill in the Posting description after intake meeting. QUALIFICATIONS The Cummins Data Science...


  • Beijing, China Lenovo Full time

    Description and Requirements 岗位职责: 1、负责分布式AI训练和推理系统的大规模互连网络架构设计; 2、负责大规模AI互连网络的仿真场景、性能评价指标设计; 3、负责大规模AI互连网络仿真系统的搭建、测试和验证工作   岗位要求: ...


  • Beijing, China Lenovo Full time

    Description and Requirements 岗位职责: 1. 负责智算平台中编译器和工具链的设计,实现和优化; 2. 设计高层编译优化方案,在计算图级、算子级和指令级等多层次进行优化,提升AI编译器效能 职位要求: 1....


  • Beijing, China Tencent Full time

    机器学习高级后台研发工程师(推理平台方向) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年05月24日 岗位职责 ...


  • Beijing, Beijing, China Lenovo Full time

    Lenovo:是一家全球领先的科技公司,致力于创新和技术进步。我们的团队专注于向量存储及搜索领域的前沿技术开发。职位信息:我们正在寻找一名系统架构设计高级研究员加入我们的团队,负责系统整体设计和架构演进,带领团队进行系统开发、测试、验证并迭代优化。该职位...


  • Beijing, Beijing, China Lenovo Full time

    岗位职责1、负责分布式AI训练和推理系统的大规模互连网络架构设计;2、负责大规模AI互连网络的仿真场景和性能评价指标设计;3、负责大规模AI互连网络仿真系统的搭建、测试和验证工作;岗位要求1、全日制硕士以上学历,计算机科学与技术,通信工程,软件工程等相关专业;2、...


  • Beijing, China Tencent Full time

    混元大模型算法工程师 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年05月29日 岗位职责 ...


  • Beijing, China Tencent Full time

    大模型算法工程师 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 PCG 点击了解更多BG信息 技术 两年以上工作经验 更新于年03月28日 ...


  • Beijing, China Tencent Full time

    QQ-AIGC文生图高级算法研究员 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 PCG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月02日 岗位职责 ...


  • Beijing, China Tencent Full time

    机器学习后台开发工程师(广告模型平台) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年05月29日 岗位职责 ...


  • Beijing, China Tencent Full time

    音频与语音算法研究员 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年05月28日 岗位职责 ...


  • Beijing, China Tencent Full time

    广告大模型算法工程师(深圳/北京) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 CDG 点击了解更多BG信息 技术 两年以上工作经验 更新于年05月24日 ...


  • Beijing, China Lenovo Full time

    Description and Requirements 工作职责: 端侧基于LLM的智能体高级研究员 1. 支持端侧LLM搜索场景下的核心算法研发,持续提升query理解,内容理解,搜索机制和排序策略,实现高效的RAG(Retrieval-Augmented Generation)生成及智能交互,优化整体搜索效果 2....


  • Beijing, China Haier Group Full time

    全部机会 / 智家定制生态圈 / 智家大脑平台 / 算法中心 / 大数据与人工智能工程师 机会编号:JD10184413 大数据与人工智能工程师 薪资面议 北京市 · 本科及以上 · 2年以上 2024-06-06 收藏 我要推荐 职责描述...


  • Beijing, China Tencent Full time

    高级推理研发工程师(北京/深圳)(语音方向) 北京 分享 分享岗位 方式1:复制岗位链接 方式2:分享岗位海报 手机扫描二维码分享 收藏 TEG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月04日 岗位职责 1.负责推理平台的研发与优化,支撑AI...