Pular para o conteúdo principal
InícioPython

Curso

Reinforcement Learning from Human Feedback (RLHF)

Avançado
Actualizado 05/2025
Learn how to make GenAI models truly reflect human values while gaining hands-on experience with advanced LLMs.
Iniciar curso gratuitamente

Incluído comPremium or Teams

PythonArtificial Intelligence4 horas13 vídeos38 Exercícios2,900 XPCertificado de conclusão

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.
Group

Treinar 2 ou mais pessoas?

Tentar DataCamp for Business

Amado por alunos de milhares de empresas

Descrição do curso

Combine the efficiency of Generative AI with the understanding of human expertise in this course on Reinforcement Learning from Human Feedback. You’ll learn how to make GenAI models truly reflect human values and preferences while getting hands-on experience with LLMs. You’ll also navigate the complexities of reward models and learn how to build upon LLMs to produce AI that not only learns but also adapts to real-world scenarios.

Pré-requisitos

Deep Reinforcement Learning in Python
1

Foundational Concepts

Iniciar capítulo
2

Gathering Human Feedback

Iniciar capítulo
3

Tuning Models with Human Feedback

Iniciar capítulo
4

Model Evaluation

Iniciar capítulo
Reinforcement Learning from Human Feedback (RLHF)
Curso
Completo

Obtenha um certificado de conclusão

Adicione esta credencial ao seu perfil, currículo ou currículo do LinkedIn
Compartilhe nas redes sociais e em sua avaliação de desempenho

Incluído comPremium or Teams

Inscreva-se agora

Junte-se a mais 16 milhões de alunos e comece Reinforcement Learning from Human Feedback (RLHF) hoje!

Crie sua conta gratuita

ou

Ao continuar, você aceita nossos Termos de Uso, nossa Política de Privacidade e que seus dados são armazenados nos EUA.