语音与音频理解方向研究员(语音生成方向), Beijing

发表 2025-07-05
过期 2025-08-05
ID #2973292094
Free
语音与音频理解方向研究员(语音生成方向), Beijing
China, 北京, 北京,
发表 July 5, 2025

描述

语音与音频理解方向研究员(语音生成方向) 北京 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 TEG 点击了解更多BG信息 技术 两年以上工作经验 更新于年06月24日 岗位职责
  • 1.跟踪业界最新的语音生成算法研究,探索下一代语音、音频生成新范式,拓展语音生成边界能力;
    2.探索多模态语音大模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验;
    3.负责语音大模型的技术研发工作,推动模型性能提升与创新应用。
  • 岗位要求
  • 1.计算机科学、人工智能、电子工程、信号处理等相关专业硕士、博士研究生;
    2.掌握语音大模型、语音合成、语音识别、音频生成、语音转换、语音Codec等一项或多项研究和开发经验;
    3.熟悉主流对话大模型(如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等),有相关项目实践经验者优先;
    4.熟练掌握Py Torch等深度学习框架,有大模型训练框架Megatron/Deepspeed实践经验者优先;
    5.熟悉大模型相关结构设计及原理,有大规模预训练、后训练经验者优先。
  • 腾讯AI Lab是腾讯的公司级AI实验室,于年4月在深圳成立。借助腾讯丰富应用场景、大数据、计算力及一流人才方面的长期积累,AI Lab立足未来,开放合作,致力于不断提升AI的认知、决策与创造力,向“Make AI Everywhere”的愿景迈步。 腾讯AI Lab强调研究与应用并重发展,基础研究关注机器学习、计算机视觉、语音技术及自然语言处理等四大方向,多篇研究论文已覆盖国际顶级学术会议;技术应用聚焦在游戏、数字人、内容、社交四大领域,在微信、QQ、广告、教育、金融等多个产品中落地。行业应用不断取得突破,研发出屡获国际大奖的棋牌类AI「绝艺」,攻克MOBA、FPS、RTS、3 D开放世界等多类游戏的决策智能AI「绝悟」,推进多模态虚拟人前沿技术,自研AI药物发现平台「云深」,同时重点推进 AI+Science 深度融合,从生命科学、AI制药到能源领域,多项研究成果发布于Nature子刊、Neur IPS、ICLR等学术顶刊顶会,解码基础科学,拓宽认知边界及前沿技术应用可能性。
  • 职位详情

    工作类型: 全职
    合同类型: 永恒的
    薪酬类型: 每月
    职业: 语音与音频理解方向研究员(语音生成方向)

    ⇐ 之前的工作

    下一份工作 ⇒     

    广告


     

    发送简历

      雇主信息

      Tencent

      快速搜索:

      地点

      输入城市或地区

      关键词


      广告