Un nuovo studio di Anthropic spiega come sia semplicissimo "avvelenare" un modello di IA con piccole modifiche a un dataset di addestramento, per indurre il modello a generare risposte errate o dannose.

Silvano Marioni

Un nuovo studio di Anthropic spiega come sia semplicissimo "avvelenare" un modello di IA con piccole modifiche a un dataset di addestramento, per indurre il modello a generare risposte errate o dannose.
https://www.theregister.com/2025/10/09/its_trivially_easy_to_poison/

:fedora: filippodb ⁂ :cc:

@silvanomarioni molto interessante, quindi la nuova frontiera è controllare un network di siti e blog e orientare l'informazione estratta dalle IA.

Piero Bosio Social Web Site Personale