Saltar al contenido principal
InicioPython

Curso

Reinforcement Learning from Human Feedback (RLHF)

Avanzado
Actualizado 5/2025
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.
Comienza el curso gratis

Incluido conPremium or Teams

PythonArtificial Intelligence4 horas13 vídeos38 Ejercicios2,900 XPCertificado de logros

Crea Tu Cuenta Gratuita

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.
Group

¿Entrenar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas

Descripción del curso

Combine the efficiency of Generative AI with the understanding of human expertise in this course on Reinforcement Learning from Human Feedback. You’ll learn how to make GenAI models truly reflect human values and preferences while getting hands-on experience with LLMs. You’ll also navigate the complexities of reward models and learn how to build upon LLMs to produce AI that not only learns but also adapts to real-world scenarios.

Prerrequisitos

Deep Reinforcement Learning in Python
1

Foundational Concepts

Iniciar capítulo
2

Gathering Human Feedback

Iniciar capítulo
3

Tuning Models with Human Feedback

Iniciar capítulo
4

Model Evaluation

Iniciar capítulo
Reinforcement Learning from Human Feedback (RLHF)
Curso
Completo

Obtener certificado de logros

Añade esta credencial a tu perfil, currículum vitae o CV de LinkedIn
Compártelo en las redes sociales y en tu evaluación de desempeño

Incluido conPremium or Teams

Inscríbete ahora

Únete a más 16 millones de estudiantes y empezar Reinforcement Learning from Human Feedback (RLHF) hoy

Crea Tu Cuenta Gratuita

o

Al continuar, acepta nuestros Términos de uso, nuestra Política de privacidad y que sus datos se almacenan en los EE. UU.