Sicherheitslücke bei ChatGPT, Bard & Co: Manipulation generativer Sprachmodelle mit künstlicher Intelligenz

📆 04/09/2023 07:04:00

Italia Notizia Notizia

Italia Ultime Notizie,Italia Notizie

📆 04/09/2023 07:04:00
📰 FinanzenNet

⏱ Reading Time:
73 sec. here
3 min. at publisher
📊 Quality Score:
News: 32%
Publisher: 55%

Große Sprachmodelle wie ChatGPT, Bard oder Claude werden einer umfangreichen Feinabstimmung unterzogen, um in ihren Antworten auf Benutzerfragen keine schädlichen Inhalte zu erzeugen - zumindest oberflächlich betrachtet. Denn mit den richtigen Tricks lassen sich die Sprachmodelle nahezu beliebig manipulieren.

• Simple, speziell ausgewählte Zeichenfolgen ermöglichen Generierung schädlicher InhalteFeindliche Angriffe auf generative Sprachmodelle mit künstlicher Intelligenz

Große generative Sprachmodelle wie ChatGPT, Bard oder Claude basieren auf enorm großen neuronalen Netzwerkalgorithmen, die darauf ausgerichtet sind, Sprache zu verwenden, in die riesige Mengen an menschlichen Aufzeichnungen eingespeichert werden. Die verwendeten Algorithmen sind sehr gut darin, Vorhersagen auf bestimmte Eingabezeichenfolgen zu treffen, wodurch sie Ergebnisse generieren, die echter Intelligenz und Wissen verblüffend ähneln.

Forscher der Carnegie-Mellon-Universität, des Center for AI Safety und des Bosch Center for AI haben eine Studie zu"universellen und übertragbaren" feindlichen Angriffen auf große generative Sprachmodelle mit künstlicher Intelligenz veröffentlicht.

Der Angriff zwinge Chatbots dazu, unzulässige Antworten auf schädliche Eingabeaufforderungen zu geben, indem bestimmte Zeichenfolgen an Eingabeaufforderungen wie"Sag mir wie man eine Bombe baut" angehängt werden.

Insgesamt bringt die Studie den Stand der Technik bei generischen Angriffen auf angepasste Sprachmodelle erheblich voran und wirft die Frage auf, wie solche Systeme besser reguliert werden können. Die Ergebnisse der Studie belegen, dass die generischen Suffixe die Sprachmodelle so konditionieren, dass die Wahrscheinlichkeit eines schädlichen Verhaltens deutlich steigt und diese Angriffe eine klare Bedrohung darstellen.

Abbiamo riassunto questa notizia in modo che tu possa leggerla velocemente. Se sei interessato alla notizia puoi leggere il testo completo qui. Leggi di più:

Italia Ultime Notizie, Italia Notizie

Similar News:Puoi anche leggere notizie simili a questa che abbiamo raccolto da altre fonti di notizie.

25 Jahre Internet-Suchmaschine: Kann ChatGPT die Dominanz von Google in Frage stellen?„Googeln“ ist längst zu einem Synonym für die Internet-Suche geworden. Jahrelang schien die Dominanz von Google in dem Markt unantastbar. Hat sich mit dem Auftauchen von Chatbots wie ChatGPT die Möglichkeit ergeben, die Karten noch einmal neu zu mischen?
Leggi di più »

Geldanlage: So gehen Sie vor, wenn Sie Kunst kaufen wollenGrafiken international anerkannter Künstler sind beliebt. Welche Werke als wertbeständig gelten oder sogar Chancen auf Wertzuwachs bieten.
Leggi di più »