In an internal Anthropic experiment, a model was trained to adopt 52 specific misaligned behavior..., Sonic AI

Use with Claude or ChatGPT

In an internal Anthropic experiment, a model was trained to adopt 52 specific misaligned behavior..., Sonic AI