Science, M.Cheng
Il comportamento adulatorio (lusinghiero, compiacente, rassicurante) dei chatbot basati sull’intelligenza artificiale (IA), progettato per aumentare il coinvolgimento degli utenti, comporta dei rischi, dato che le persone cercano sempre più spesso consigli su dilemmi interpersonali. In genere, in un conflitto interpersonale, esiste più di una versione dei fatti. Se l’IA è progettata per dire agli utenti ciò che vogliono sentirsi dire anziché mettere in discussione le loro prospettive, è probabile che tali sistemi motivino le persone ad assumersi la responsabilità del proprio contributo ai conflitti e a riparare le relazioni? Cheng et al . hanno misurato la prevalenza dell’adulazione sociale in 11 modelli linguistici di grandi dimensioni (vedi la prospettiva di Perry). Le risposte del modello erano quasi il 50% più adulatorie di quelle umane, anche quando gli utenti si impegnavano in comportamenti non etici, illegali o dannosi. Gli utenti preferivano e si fidavano delle risposte adulatorie dell’IA, incentivando gli sviluppatori di IA a preservare l’adulazione nonostante i rischi. —Ekeoma UzogaraAbstract strutturatoINTRODUZIONECon il crescente utilizzo dei sistemi di intelligenza artificiale (IA) per consigli e indicazioni quotidiane, sono emerse preoccupazioni riguardo alla sicofania: la tendenza dei modelli linguistici complessi basati sull’IA a concordare eccessivamente con gli utenti, adularli o convalidarli. Sebbene studi precedenti abbiano dimostrato che la sicofania comporta rischi per i gruppi già vulnerabili alla manipolazione o all’illusione, gli effetti della sicofania sui giudizi e sui comportamenti della popolazione generale rimangono sconosciuti. In questo studio, dimostriamo che la sicofania è diffusa nei principali sistemi di IA e ha effetti dannosi sui giudizi sociali degli utenti.MOTIVAZIONEAlcuni casi eclatanti hanno collegato l’adulazione a danni psicologici come deliri, autolesionismo e suicidio. Oltre a questi casi, la ricerca in psicologia sociale e morale suggerisce che un’approvazione ingiustificata può produrre effetti più sottili ma comunque significativi: rafforzare convinzioni disadattive, ridurre l’assunzione di responsabilità e scoraggiare la riparazione comportamentale dopo un errore. Abbiamo ipotizzato che i modelli di IA avallino eccessivamente gli utenti anche quando ciò è socialmente o moralmente inappropriato e che tali risposte influenzino negativamente le convinzioni e le intenzioni degli utenti. Per verificare questa ipotesi, abbiamo condotto due esperimenti complementari. In primo luogo, abbiamo misurato la prevalenza dell’adulazione in 11 modelli di IA leader di mercato utilizzando tre set di dati che coprono una varietà di contesti d’uso, tra cui richieste di consigli quotidiane, trasgressioni morali e scenari esplicitamente dannosi. In secondo luogo, abbiamo condotto tre esperimenti preregistrati con 2405 partecipanti per comprendere come l’adulazione influenzi i giudizi, le intenzioni comportamentali e le percezioni degli utenti nei confronti dell’IA. I partecipanti hanno interagito con sistemi di intelligenza artificiale in contesti basati su scenari ipotetici e in una chat dal vivo in cui hanno discusso di un conflitto reale tratto dalle loro vite passate. Abbiamo anche verificato se gli effetti variassero in base allo stile di risposta o alla fonte di risposta percepita (IA rispetto a persona).
Abbiamo scoperto che l’adulazione è sia diffusa che dannosa. Su 11 modelli di IA, l’IA ha confermato le azioni degli utenti il 49% più spesso rispetto agli esseri umani in media, anche in casi di inganno, illegalità o altri danni. Nei post di r/AmITheAsshole, i sistemi di IA confermano gli utenti nel 51% dei casi in cui il consenso umano non lo fa (0%). Nei nostri esperimenti con esseri umani, anche una singola interazione con un’IA adulazione ha ridotto la disponibilità dei partecipanti ad assumersi la responsabilità e a risolvere i conflitti interpersonali, aumentando al contempo la loro convinzione di avere ragione. Eppure, nonostante distorcessero il giudizio, i modelli adulazione venivano considerati affidabili e preferiti. Tutti questi effetti persistevano anche tenendo conto di caratteristiche individuali come dati demografici e precedente familiarità con l’IA, fonte di risposta percepita e stile di risposta. Questo crea incentivi perversi per la persistenza dell’adulazione: la stessa caratteristica che causa danni è anche quella che favorisce il coinvolgimento.
logoIl contenuto principale inizia quiRiferimento n. 1Torna al volume 391, numero 6792Accesso gratuitoArticolo di ricercaINTELLIGENZA ARTIFICIALECondividi suL’IA adulatoria diminuisce le intenzioni prosociali e promuove la dipendenzaMyra Cheng https://orcid.org/0000-0002-5052-2929, Cinoo Lee https://orcid.org/0009-0002-1305-4705, […] , e Dan Jurafsky https://orcid.org/0000-0002-6459-7745+3 autori Informazioni sugli autori e affiliazioniScienza26 marzo 2026Volume 391 , Numero 6792DOI: 10.1126/science.aec8352Informazioni e autoriMetriche e citazioniVisualizza le opzioniRiferimenticifreCondividereRiassunto dell’editoreIl comportamento adulatorio (lusinghiero, compiacente, rassicurante) dei chatbot basati sull’intelligenza artificiale (IA), progettato per aumentare il coinvolgimento degli utenti, comporta dei rischi, dato che le persone cercano sempre più spesso consigli su dilemmi interpersonali. In genere, in un conflitto interpersonale, esiste più di una versione dei fatti. Se l’IA è progettata per dire agli utenti ciò che vogliono sentirsi dire anziché mettere in discussione le loro prospettive, è probabile che tali sistemi motivino le persone ad assumersi la responsabilità del proprio contributo ai conflitti e a riparare le relazioni? Cheng et al . hanno misurato la prevalenza dell’adulazione sociale in 11 modelli linguistici di grandi dimensioni (vedi la prospettiva di Perry). Le risposte del modello erano quasi il 50% più adulatorie di quelle umane, anche quando gli utenti si impegnavano in comportamenti non etici, illegali o dannosi. Gli utenti preferivano e si fidavano delle risposte adulatorie dell’IA, incentivando gli sviluppatori di IA a preservare l’adulazione nonostante i rischi. —Ekeoma UzogaraAbstract strutturatoINTRODUZIONECon il crescente utilizzo dei sistemi di intelligenza artificiale (IA) per consigli e indicazioni quotidiane, sono emerse preoccupazioni riguardo alla sicofania: la tendenza dei modelli linguistici complessi basati sull’IA a concordare eccessivamente con gli utenti, adularli o convalidarli. Sebbene studi precedenti abbiano dimostrato che la sicofania comporta rischi per i gruppi già vulnerabili alla manipolazione o all’illusione, gli effetti della sicofania sui giudizi e sui comportamenti della popolazione generale rimangono sconosciuti. In questo studio, dimostriamo che la sicofania è diffusa nei principali sistemi di IA e ha effetti dannosi sui giudizi sociali degli utenti.MOTIVAZIONEAlcuni casi eclatanti hanno collegato l’adulazione a danni psicologici come deliri, autolesionismo e suicidio. Oltre a questi casi, la ricerca in psicologia sociale e morale suggerisce che un’approvazione ingiustificata può produrre effetti più sottili ma comunque significativi: rafforzare convinzioni disadattive, ridurre l’assunzione di responsabilità e scoraggiare la riparazione comportamentale dopo un errore. Abbiamo ipotizzato che i modelli di IA avallino eccessivamente gli utenti anche quando ciò è socialmente o moralmente inappropriato e che tali risposte influenzino negativamente le convinzioni e le intenzioni degli utenti. Per verificare questa ipotesi, abbiamo condotto due esperimenti complementari. In primo luogo, abbiamo misurato la prevalenza dell’adulazione in 11 modelli di IA leader di mercato utilizzando tre set di dati che coprono una varietà di contesti d’uso, tra cui richieste di consigli quotidiane, trasgressioni morali e scenari esplicitamente dannosi. In secondo luogo, abbiamo condotto tre esperimenti preregistrati con 2405 partecipanti per comprendere come l’adulazione influenzi i giudizi, le intenzioni comportamentali e le percezioni degli utenti nei confronti dell’IA. I partecipanti hanno interagito con sistemi di intelligenza artificiale in contesti basati su scenari ipotetici e in una chat dal vivo in cui hanno discusso di un conflitto reale tratto dalle loro vite passate. Abbiamo anche verificato se gli effetti variassero in base allo stile di risposta o alla fonte di risposta percepita (IA rispetto a persona).RISULTATIAbbiamo scoperto che l’adulazione è sia diffusa che dannosa. Su 11 modelli di IA, l’IA ha confermato le azioni degli utenti il 49% più spesso rispetto agli esseri umani in media, anche in casi di inganno, illegalità o altri danni. Nei post di r/AmITheAsshole, i sistemi di IA confermano gli utenti nel 51% dei casi in cui il consenso umano non lo fa (0%). Nei nostri esperimenti con esseri umani, anche una singola interazione con un’IA adulazione ha ridotto la disponibilità dei partecipanti ad assumersi la responsabilità e a risolvere i conflitti interpersonali, aumentando al contempo la loro convinzione di avere ragione. Eppure, nonostante distorcessero il giudizio, i modelli adulazione venivano considerati affidabili e preferiti. Tutti questi effetti persistevano anche tenendo conto di caratteristiche individuali come dati demografici e precedente familiarità con l’IA, fonte di risposta percepita e stile di risposta. Questo crea incentivi perversi per la persistenza dell’adulazione: la stessa caratteristica che causa danni è anche quella che favorisce il coinvolgimento.CONCLUSIONEL’adulazione nell’IA non è semplicemente una questione stilistica o un rischio di nicchia, ma un comportamento diffuso con ampie conseguenze a cascata. Sebbene l’approvazione possa sembrare rassicurante, l’adulazione può minare la capacità degli utenti di autocorreggersi e di prendere decisioni responsabili. Tuttavia, poiché è preferita dagli utenti e stimola il coinvolgimento, non ci sono stati incentivi significativi per una sua riduzione. Il nostro lavoro evidenzia l’urgente necessità di affrontare l’adulazione nell’IA come un rischio sociale per l’autopercezione e le relazioni interpersonali delle persone, sviluppando meccanismi mirati di progettazione, valutazione e responsabilizzazione. I nostri risultati dimostrano che scelte di progettazione e ingegneria apparentemente innocue possono comportare danni significativi, pertanto studiare e prevedere attentamente l’impatto dell’IA è fondamentale per proteggere il benessere a lungo termine degli utenti.