5x Model Organisms of Misalignment - a beyarkay Collection

beyarkay 's Collections

updated Apr 20

Five Qwen3-8B LoRAs exhibiting distinct oversight-gated misalignments, each paired with a matched control.