• Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

  • Jul 3 2024
  • Duración: 30 m
  • Podcast

Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

  • Resumen

  • Send us a text

    In dieser faszinierenden Episode erkunden Sigurd Schacht und Carsten Lanquillon, wie Anthropic's Forschung zur Interpretierbarkeit von KI es ermöglicht, Sprachmodelle auf Konzeptebene zu manipulieren. Sie diskutieren das aufsehenerregende Golden Gate Claude-Experiment, bei dem ein Sprachmodell dazu gebracht wurde, in jeder Konversation die Golden Gate Bridge zu erwähnen, und erörtern die weitreichenden Implikationen dieser Technologie für die Zukunft der KI-Steuerung und -Sicherheit.

    Support the show

    Más Menos
activate_Holiday_promo_in_buybox_DT_T2

Lo que los oyentes dicen sobre Episode 175 - Miniserie Interpretierbarkeit - Golden Gate Claude

Calificaciones medias de los clientes

Reseñas - Selecciona las pestañas a continuación para cambiar el origen de las reseñas.