Resume and JobRESUME AND JOB
Tencent logo

腾讯云CodeBuddy-强化学习算法研究员

Tencent

Software and Technology Jobs

腾讯云CodeBuddy-强化学习算法研究员

full-timePosted: Nov 13, 2025

Job Description

腾讯云CodeBuddy-强化学习算法研究员

📋 Job Overview

腾讯云CodeBuddy-强化学习算法研究员职位聚焦于探索有效的Agentic Workflow和Agentic Memory设计,以解决代码领域的问题。主要关注强化学习方法,以超越SFT的泛化效果,并结合用户需求和数据调整训练策略。作为工程师,需要设计前后端架构,实现高效的Agentic Workflow解决方案,尤其在有限算力条件下。

📍 Location: Shenzhen, China

🏢 Business Unit: CSIG

📄 Full Description

1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题;
2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标;
3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent;
4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案。

🎯 Key Responsibilities

  • 探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 关注比SFT泛化效果更好的强化学习,并结合用户需求、数据和agent细节调整训练语料和目标
  • 与agent开发高效沟通,设计memory存取逻辑,并通过模型训练适配设计的agent
  • 设计合理的前后端交互、前端架构、后端架构,实现有限算力下的完整 Agentic Workflow 解决方案
  • 探索通用可扩展的 Agentic Workflow 解决方案

✅ Required Qualifications

  • 作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 主要关注比SFT泛化效果更好的强化学习
  • 能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标
  • 能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent
  • 作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案

⭐ Preferred Qualifications

  • 最好是探索一套通用可扩展的 Agentic Workflow 解决方案

🛠️ Required Skills

  • 强化学习算法研究
  • Agentic Workflow 和 Agentic Memory 设计
  • LLM 模型训练和适配
  • 前后端架构设计
  • 高效沟通与跨团队协作
  • 用户数据分析和训练语料调整

Locations

  • Shenzhen, China

Salary

Estimated Salary Rangemedium confidence

300,000 - 800,000 CNY / yearly

Source: ai estimated

* This is an estimated range based on market data and may vary based on experience and qualifications.

Skills Required

  • 强化学习算法研究intermediate
  • Agentic Workflow 和 Agentic Memory 设计intermediate
  • LLM 模型训练和适配intermediate
  • 前后端架构设计intermediate
  • 高效沟通与跨团队协作intermediate
  • 用户数据分析和训练语料调整intermediate

Required Qualifications

  • 作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题 (experience)
  • 主要关注比SFT泛化效果更好的强化学习 (experience)
  • 能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标 (experience)
  • 能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent (experience)
  • 作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案 (experience)

Preferred Qualifications

  • 最好是探索一套通用可扩展的 Agentic Workflow 解决方案 (experience)

Responsibilities

  • 探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 关注比SFT泛化效果更好的强化学习,并结合用户需求、数据和agent细节调整训练语料和目标
  • 与agent开发高效沟通,设计memory存取逻辑,并通过模型训练适配设计的agent
  • 设计合理的前后端交互、前端架构、后端架构,实现有限算力下的完整 Agentic Workflow 解决方案
  • 探索通用可扩展的 Agentic Workflow 解决方案

Target Your Resume for "腾讯云CodeBuddy-强化学习算法研究员" , Tencent

Get personalized recommendations to optimize your resume specifically for 腾讯云CodeBuddy-强化学习算法研究员. Takes only 15 seconds!

AI-powered keyword optimization
Skills matching & gap analysis
Experience alignment suggestions

Check Your ATS Score for "腾讯云CodeBuddy-强化学习算法研究员" , Tencent

Find out how well your resume matches this job's requirements. Get comprehensive analysis including ATS compatibility, keyword matching, skill gaps, and personalized recommendations.

ATS compatibility check
Keyword optimization analysis
Skill matching & gap identification
Format & readability score

Tags & Categories

TencentShenzhenChinaCSIGCSIG

Answer 10 quick questions to check your fit for 腾讯云CodeBuddy-强化学习算法研究员 @ Tencent.

Quiz Challenge
10 Questions
~2 Minutes
Instant Score

Related Books and Jobs

No related jobs found at the moment.

Tencent logo

腾讯云CodeBuddy-强化学习算法研究员

Tencent

Software and Technology Jobs

腾讯云CodeBuddy-强化学习算法研究员

full-timePosted: Nov 13, 2025

Job Description

腾讯云CodeBuddy-强化学习算法研究员

📋 Job Overview

腾讯云CodeBuddy-强化学习算法研究员职位聚焦于探索有效的Agentic Workflow和Agentic Memory设计,以解决代码领域的问题。主要关注强化学习方法,以超越SFT的泛化效果,并结合用户需求和数据调整训练策略。作为工程师,需要设计前后端架构,实现高效的Agentic Workflow解决方案,尤其在有限算力条件下。

📍 Location: Shenzhen, China

🏢 Business Unit: CSIG

📄 Full Description

1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题;
2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标;
3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent;
4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案。

🎯 Key Responsibilities

  • 探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 关注比SFT泛化效果更好的强化学习,并结合用户需求、数据和agent细节调整训练语料和目标
  • 与agent开发高效沟通,设计memory存取逻辑,并通过模型训练适配设计的agent
  • 设计合理的前后端交互、前端架构、后端架构,实现有限算力下的完整 Agentic Workflow 解决方案
  • 探索通用可扩展的 Agentic Workflow 解决方案

✅ Required Qualifications

  • 作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 主要关注比SFT泛化效果更好的强化学习
  • 能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标
  • 能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent
  • 作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案

⭐ Preferred Qualifications

  • 最好是探索一套通用可扩展的 Agentic Workflow 解决方案

🛠️ Required Skills

  • 强化学习算法研究
  • Agentic Workflow 和 Agentic Memory 设计
  • LLM 模型训练和适配
  • 前后端架构设计
  • 高效沟通与跨团队协作
  • 用户数据分析和训练语料调整

Locations

  • Shenzhen, China

Salary

Estimated Salary Rangemedium confidence

300,000 - 800,000 CNY / yearly

Source: ai estimated

* This is an estimated range based on market data and may vary based on experience and qualifications.

Skills Required

  • 强化学习算法研究intermediate
  • Agentic Workflow 和 Agentic Memory 设计intermediate
  • LLM 模型训练和适配intermediate
  • 前后端架构设计intermediate
  • 高效沟通与跨团队协作intermediate
  • 用户数据分析和训练语料调整intermediate

Required Qualifications

  • 作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题 (experience)
  • 主要关注比SFT泛化效果更好的强化学习 (experience)
  • 能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标 (experience)
  • 能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent (experience)
  • 作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案 (experience)

Preferred Qualifications

  • 最好是探索一套通用可扩展的 Agentic Workflow 解决方案 (experience)

Responsibilities

  • 探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题
  • 关注比SFT泛化效果更好的强化学习,并结合用户需求、数据和agent细节调整训练语料和目标
  • 与agent开发高效沟通,设计memory存取逻辑,并通过模型训练适配设计的agent
  • 设计合理的前后端交互、前端架构、后端架构,实现有限算力下的完整 Agentic Workflow 解决方案
  • 探索通用可扩展的 Agentic Workflow 解决方案

Target Your Resume for "腾讯云CodeBuddy-强化学习算法研究员" , Tencent

Get personalized recommendations to optimize your resume specifically for 腾讯云CodeBuddy-强化学习算法研究员. Takes only 15 seconds!

AI-powered keyword optimization
Skills matching & gap analysis
Experience alignment suggestions

Check Your ATS Score for "腾讯云CodeBuddy-强化学习算法研究员" , Tencent

Find out how well your resume matches this job's requirements. Get comprehensive analysis including ATS compatibility, keyword matching, skill gaps, and personalized recommendations.

ATS compatibility check
Keyword optimization analysis
Skill matching & gap identification
Format & readability score

Tags & Categories

TencentShenzhenChinaCSIGCSIG

Answer 10 quick questions to check your fit for 腾讯云CodeBuddy-强化学习算法研究员 @ Tencent.

Quiz Challenge
10 Questions
~2 Minutes
Instant Score

Related Books and Jobs

No related jobs found at the moment.