Come la SEO, le affiliazioni e powerhayden stanno distruggendo Google Alert

Uno dei tanti strumenti comodi a giornalisti, editor e SEO Specialist è senza dubbio Google Alert. Un servizio gratuito di Big G che permette di ricevere sulla propria casella e-mail articoli e post che riguardano determinati temi o parole chiave, per i quali si richiede una notifica ad ogni nuova (si presuppone rilevante) pubblicazione. Fin qui niente di nuovo, anche il sottoscritto ogni giorno riceve mail da Google Alert, in particolar modo inerenti alla tecnologia. Per rimanere sempre aggiornato su smartphone, telefoni e chiamate, abbiamo utilizzato le medesime keywords per ricevere notifiche sui vari dispositivi e le rispettive news. Quasi sempre sono post e articoli di colleghi che segnalano un’offerta su Amazon di cui sono affiliati. E già questo non è proprio utile giornalisticamente, ma nulla di strano. Al massimo si può segnalare che il link è irrilevante, al fine di migliorare la collezione di link alla prossima e-mail, ma non lo facciamo e passiamo avanti. Da un po’ di tempo abbiamo però notato che vengono inoltrate da Google Alert notifiche riguardo a post che sono palesemente (e grossolanamente) tradotti da traduttori automatici.

A palesarlo quest’oggi un link di un post su “Niente telefono (1)“. Le parentesi sono state fondamentali per comprendere che in realtà fosse riferito a Nothing Phone (1), smartphone Android appena presentato, la cui azienda (Nothing, per l’appunto) è stata fondata tra gli altri anche da Carl Pei, ex OnePlus. Potrebbe essere un grossolano errore di un editor alle prime armi, ma così non è. Il titolo del post “Niente Il telefono (1) soffre di pixel morti e nebbia verde” pubblicato su QwertyMag riferisce di un problema riguardante il nuovo dispositivo, che per altro non è ancora disponibile sul mercato. Nel post del fantomatico Giorgino Ricci, ci si riferisce ad alcuni sample di Nothing Phone (1) che riporterebbero problemi al display. L’articolo è evidentemente tradotto con un software automatizzato utilizzando come fonte AndroidWorld.nl. Inoltre la foto dell’autore dell’articolo, è stata utilizzata da tale Narciso Trentini su Gossip Italia. Facendo una ricerca nei vari “Chi siamo“, Politica Editoriale etc, abbiamo trovato un indirizzo email Gmail. Non vi è riportato alcun nome, ma il denominatore comune di tutti questi siti è il fantomatico Power Hayden.

Cercando questo indirizzo e-mail su Google si trovano centinaia e centinaia di siti che utilizzano più o meno lo stesso schema: temi grafici simili, notizie tradotte grossolanamente, privacy policy lacunose, banner di Google e link di affiliazione ad Amazon. La cosa più preoccupante non è tanto l’affiliazione, quanto il fatto che alle volte gli articoli condivisi vengono utilizzate come fonti da altre testate e che Google Alert consideri i siti di questo network come fonti “autorevoli” tanto da inoltrarli ai propri utenti (tra cui il sottoscritto). Ma come possono essere ritenuti da Google attendibili, testi evidentemente copiati? Semplice! Google giudica male i contenuti copiati, ma se vengono tradotti risultano contenuti autentici, almeno nella lingua tradotta. Inoltre se lo schema è lo stesso, alla lunga l’algoritmo ritiene quel sito, quell’autore e quel dominio, nonché quel determinato post, come attendibili.

Un sito del network che copia contenuti dell’ANSA.

Dunque?

Tutti i siti sono stati evidentemente registrati dalla stessa persona o organizzazione, che ha la capacità anche economica di poter mantenere i costi di tutti questi siti. Molti di questi producono in automatico e per ogni lingua articoli tradotti, sfruttando il lavoro di altri giornalisti o editor. In questo modo vengono garantiti articoli di qualità, scritti in ottica SEO (Search Engine Optimization, una serie di tecniche impiegate per scalare le posizioni nelle prime pagine di ricerca) e che vengono ritenuti attendibili da Google. Basti pensare che più volte ci siamo ritrovati su Google Alert post dello stesso chiamiamolo “gruppo editoriale” tradotti in modo grossolano e che hanno come scopo ovviamente il guadagno. Molti di questi hanno l’affiliazione con Amazon (fin qui niente di strano, anche Smartphonology ha un accordo con Amazon per l’introito) e con Adsense di Google, sfruttando però il lavoro altrui. Ma chi c’è dietro a tutto questo?

Di tutti i siti di cui abbiamo fatto il “WhoIs”, ovvero cercare i dati del registrante del dominio si sono rivelati infruttuosi, perché per tutti è stato richiesto di mantenere la privacy, dunque non è stato possibile risalire all’identità del “gruppo editoriale”. Tuttavia, molti siti del network, come Dico News, TGcomnews24, e decine di altri, con contenuti in italiano, presentano post che rimandano ad uno o più ID affiliato di Amazon. Ogni utente affiliato con Amazon ha un codice univoco. Attraverso uno di questi codici, siamo riusciti ad individuare un utente, italiano, che lo ha condiviso su un gruppo Facebook per pubblicizzare un libro su una pratica orientale, pubblicato in un gruppo di cui è amministratore. Probabilmente ha solo copiato il codice da un sito del gigante network di powerhayden, e può essere che sia totalmente estraneo alla vicenda. Oppure no.

Perché questo network è un problema

Ci sono molti motivi per cui questo gigante network di centinaia di siti è un problema. Il primo è un problema di copyright. I testi sono tradotti in automatico, copiati e pubblicati su uno delle centinaia di siti web in capo al network, senza che l’autore ne sia al corrente. La traduzione serve esclusivamente per bypassare alcuni tool che cercano sui motori di ricerca i contenuti copiati. Questi sono un danno per l’autore non solo per il copyright, ma anche a livello di SEO: è una delle tecniche malevoli per danneggiare un sito, quello di copiare e riprodurre i contenuti. La traduzione serve anche per rendere quel contenuto unico: se venissero tradotti e pubblicati contenuti di testate, in ottica SEO e considerate da Google attendibili perché di qualità, cosa succederebbe? Quello che sta già accadendo, risultati nella SERP (Search Engine Results Page, in poche parole, le pagine con i risultati di ricerca) di Google e invio tramite Google Alert e Google News di articoli altrimenti attendibili, ma tradotti grossolanamente su siti Web non sicuri e con una privacy policy non conforme alla normativa europea sul GDPR.

Gli alert di Google in genere propongono all’utente dieci contenuti in una mail a seconda dell’argomento. La scintilla che ha scatenato questa nostra indagine è dovuta alla parola chiave “telefono“. In una delle ultime e-mail spedite da Google Alert al nostro indirizzo abbiamo individuato tre (3!) risultati su 10 riconducibili a questo schema di “powerhayden“.

Alle volte inoltre giornalisti ed altri editor utilizzano i post di questo network gigante come fonte. Benché i contenuti possano essere anche di qualità (anche perché spesso copiati da fonti autorevoli) quando un sito, o una testata linka la notizia copiata da uno dei siti del network in questione, si crea un cosiddetto “backlink“. Tali backlink sono considerati dall’algoritmo di Google per definire un sito attendibile e autorevole e permettere dunque alla piattaforma di scalare il posizionamento nella SERP e in Google News (o Google Alert). Si innesca così un circolo vizioso.

Perché è un problema per Google (e gli utenti)

Tutto questo conduce a un servizio per cui Google, così come gli utenti risulta danneggiata dai suoi stessi strumenti. Chi si cela dietro l’entità powerhyaden ha a disposizione centinaia di siti considerati da Big G come attendibili e i cui contenuti vengono proposti su Google News. Nonostante il continuo e evidente violazione del copyright, su tali contenuti vengono spesso mostrati banner pubblicitari di Google Adsense, con una palese violazione di una delle norme del programma. Gli utenti sono danneggiati perché, così come capitato al sottoscritto, si trova spesso irrilevanti link in casella che rimandano a siti non sicuri, con contenuti tutt’altro che unici e originali e spesso con post che mirano esclusivamente ad ottenere clic sui link di affiliazione.

Come risolvere

Non c’è un modo veloce e semplice per risolvere. Per non ricevere più contenuti non interessanti, basta segnalare il link irrilevante. Il vero problema sussiste quando il giornalista scrive un contenuto che viene copiato in una lingua su cui non ha alcun controllo, oppure quando un altro editor o un altro giornalista utilizzano come fonte questi siti. Quando viene scritto un articolo e si linka un articolo dello sconfinato network come fonte, si alimenta l’algoritmo di Google che ritiene quella determinata fonte attendibile. In questo modo non solo l’utente non trova un contenuto interessante, ma vengono tolte posizioni a chi scrive, con o senza tecniche SEO, contenuti altrimenti interessanti e davvero attendibili.

Aiutaci a crescere: lasciaci un like :)

Giornalista pubblicista, SEO Specialist, fotografo. Da sempre appassionato di tecnologia, lavoro nell'editoria dal 2010, prima come fotografo e fotoreporter, infine come giornalista. Ho scritto per PC Professionale, SportEconomy e Corriere della Sera, oltre ovviamente a Smartphonology.