Fake Science: l’IA complica la lotta contro le paper mills

Secondo un articolo pubblicato su Nature, l’IA sta ostacolando la lotta contro le paper mills, le cosiddette aziende che producono articoli scientifici falsi su ordinazione. Le organizzazioni producono documenti di ricerca che possono sembrare autentici, ma che non si basano su una ricerca reale. Un serio problema per l‘integrità della ricerca scientifica, con il progredire delle capacità delle Intelligenze Artificiali. Infatti i chatbot come ChatGPT e le IA generative di immagini, offrono nuovi metodi per produrre contenuti per queste aziende.

Durante un summit tenutosi il 24 maggio, esperti di integrità della ricerca hanno discusso questi problemi. “La capacità delle paper mills di generare dati grezzi sempre più plausibili sta per esplodere con l’IA“, ha affermato Jennifer Byrne, biologa molecolare e ricercatrice di integrità delle pubblicazioni presso il New South Wales Health Pathology e l’Università di Sydney in Australia. Le immagini false generate da AI, come quelle osservate da Jana Christopher, analista dell’integrità dei dati delle immagini presso l’editore FEBS Press in Heidelberg, Germania, rappresentano una sfida significativa. È difficile dimostrare senza ombra di dubbio che le immagini sono state generate da AI. Strumenti di generazione linguistica come ChatGPT presentano problemi simili.

Anna Abalkina, scienziata sociale presso la Free University di Berlino e analista indipendente di integrità della ricerca, sospetta che ci potrebbe essere un ritardo nell’apparizione di questi strumenti AI nella letteratura accademica a causa della lunghezza del processo di revisione tra pari. Questi problemi sono stati discussi durante il summit UNITED2ACT, convocato dal Committee on Publication Ethics (COPE), un’organizzazione no-profit focalizzata sull’etica nella pubblicazione accademica con sede a Eastleigh, UK, e l’International Association of Scientific, Technical and Medical Publishers (STM), con sede a Oxford. Il summit ha riunito ricercatori internazionali, inclusi analisti indipendenti di integrità della ricerca, nonché rappresentanti di enti finanziatori e editori.

È stata la prima volta che un gruppo di persone si riuniva e co-creava un insieme di azioni che intendiamo portare avanti per combattere questo problema“, afferma Deborah Kahn, consulente di integrità della ricerca e fiduciaria del COPE, con sede a Londra. “Abbiamo una sfida aggiuntiva posta da immagini sintetiche, testi sintetici, etc.”, afferma Joris van Rossum, direttore del programma per STM Solutions, una filiale di STM.

Sebbene ci saranno senza dubbio usi positivi dell’IA per supportare i ricercatori nella stesura di articoli, sarà ancora necessario distinguere tra articoli legittimi scritti con l’IA e quelli completamente fabbricati. “Dobbiamo davvero guardare a come identifichiamo queste cose, e come ci assicuriamo che le persone abbiano effettivamente svolto la ricerca. E ci sono vari modi in cui possiamo farlo” dice Kahn. Una strategia discussa durante il summit era richiedere agli autori di fornire i dati grezzi degli esperimenti, potenzialmente con watermark digitali che permetterebbero agli editori di confermare l’autenticità di tali dati. Attualmente, i requisiti per la presentazione dei dati grezzi variano notevolmente tra gli editori, dice Christopher. Stabilire un insieme uniforme di requisiti per la presentazione dei dati grezzi tra gli editori, tenendo conto delle differenze tra i campi di ricerca, potrebbe quindi essere utile.

Sabina Alam, direttrice dell’etica editoriale e dell’integrità presso Taylor & Francis, un editore con sede a Abingdon, UK, concorda ma afferma che tali standard richiederanno tempo per essere implementati. “Non riesco a immaginare che ciò avvenga da un giorno all’altro, perché la realtà è che molte istituzioni non hanno effettivamente le risorse per offrire un’infrastruttura di gestione dei dati. Non vogliamo penalizzare la vera ricerca.” Il summit ha anche discusso altre strategie per affrontare il problema delle paper mills in modo più ampio, tra cui l’organizzazione di una giornata o una settimana di sensibilizzazione per i ricercatori, oltre a identificare modi per gli editori di condividere informazioni pertinenti su presunte paper mills. Ad esempio quando gli editori ricevono contemporaneamente presentazioni, senza violare le regole sulla protezione dei dati.

STM sta continuando a sviluppare il suo software di rilevamento delle paper mills, mentre sta anche raccogliendo risorse su strumenti simili disponibili altrove attraverso il suo hub di integrità. L’apparente aumento delle aziende produttrici di ricerche false aumenta la domanda di tali tecniche, sia per rilevare articoli falsi al momento della presentazione sia per identificare quelli che sono già stati pubblicati. Taylor & Francis è tra gli editori che stanno facendo uso di tali strumenti, e Alam afferma che un numero crescente di casi etici, cioè istanze di potenziale cattiva condotta che vengono segnalate per ulteriori indagini vengono portati al suo team. Circa la metà di questi casi sono a causa delle paper mills, secondo Alam. Il suo team ha visto il numero di casi etici aumentare più di dieci volte dal 2019 al 2022. Finora quest’anno, ci sono stati quasi altrettanti casi come durante l’intero 2022.

Con le paper mills che diventano sempre più sofisticate grazie all’intelligenza artificiale, la lotta per l’integrità della ricerca scientifica deve evolvere in modo altrettanto veloce. La comunità scientifica, gli editori e gli enti di finanziamento stanno lavorando insieme per sviluppare strategie per affrontare questa sfida, ma resta molto da fare. La sfida è duplice: garantire che le potenzialità dell’IA vengano sfruttate per supportare la ricerca scientifica, pur combattendo l’uso distorto di queste stesse tecnologie per minare l’integrità della scienza. La strada da percorrere potrebbe essere lunga e tortuosa, ma l’impegno della comunità scientifica a proteggere l’integrità della ricerca è indiscusso.

Aiutaci a crescere: lasciaci un like :)

Il mio colore preferito è il 9. La mia canzone preferita "Il Fu Mattia Pascal". E il mio film preferito è davvero "Catch me, if you can".