• 15: InstructGPT

  • Mar 28 2023
  • Duración: 57 m
  • Podcast

  • Resumen

  • In this episode we discuss the paper "Training language models to follow instructions with human feedback" by Ouyang et al (2022). We discuss the RLHF paradigm and how important RL is to tuning GPT.

    Más Menos

Lo que los oyentes dicen sobre 15: InstructGPT

Calificaciones medias de los clientes

Reseñas - Selecciona las pestañas a continuación para cambiar el origen de las reseñas.