
Wie wenige vergiftete Beispiele groĂe Sprachmodelle (LLMs) kompromittieren
Dieser Artikel untersucht, wie schon eine kleine Anzahl bösartiger Trainingsdaten groĂe Sprachmodelle (LLMs) wie GPT oder Claude durch Datenvergiftung und Backdoor-Angriffe kompromittieren kann â inklusive technischer Details, Fallstudien und Code-Beispielen.









