ByteDance ha annunciato il lancio di un assistente vocale basato su intelligenza artificiale, alimentato dal modello linguistico Doubao, destinato a diventare parte integrante del sistema operativo di smartphone. Il debutto avverrà con il dispositivo Nubia M153, realizzato dalla società cinese ZTE. Lo strumento consente all’utente di impartire comandi vocali per svolgere attività complesse: aprire schede, cercare informazioni, prenotare biglietti, utilizzare applicazioni presenti sul dispositivo. Doubao funziona a livello di sistema operativo: ha accesso allo schermo, può interagire con le app e gestire file, moduli, promemoria, preferenze personali. È concepito per “vedere” il contenuto del telefono e operare per conto dell’utente.
Funzioni avanzate e memoria contestuale
L’assistente dispone di una “memoria”: è in grado di memorizzare informazioni sensibili come note, indirizzi o preferenze e trasformarle in promemoria o attività future. È possibile chiedere qualcosa come “dove mi sono seduto sul treno la scorsa settimana?” oppure “come si chiamava quel ristorante vicino all’ufficio che mi era piaciuto?”. Queste capacità superano quelle offerte finora da assistenti vocali tradizionali: non è solo un motore di ricerca o un riconoscitore di comandi vocali, ma un software che integra visione del contesto, memoria, capacità di agire sull’interfaccia del telefono — caratteristiche vicine a quanto descritto da anni nella narrativa di fantascienza sull’intelligenza artificiale “personale”.
Contesto competitivo: smartphone “AI-ready” e sfida globale
L’ingresso di ByteDance in questo segmento segna una evoluzione delle strategie attorno agli smartphone dotati di AI nativa. In Cina il mercato degli assistenti vocali integrati nello smartphone vede già proposte da produttori come Xiaomi e Huawei. Il nuovo assistente Doubao intende competere con queste offerte, puntando su una soluzione integrata a livello di sistema. All’estero soluzioni analoghe stanno emergendo: ad esempio Gemini Live, sviluppato da Google, offre funzioni di conversazione vocale in tempo reale su smartphone, con supporto multimodale e capacità di interagire con applicazioni, impostare promemoria, gestire calendario e messaggi.

Il successo attuale di Doubao
Secondo i dati riportati da ByteDance e agenzie finanziarie cinesi, Doubao è già oggi il chatbot AI più diffuso in Cina. Nel mese di ottobre 2025 contava 159 milioni di utenti attivi mensili, cifra superiore a quella di competitor come Yuanbao (di Tencent) e DeepSeek. Il debutto — almeno inizialmente — è limitato al prototipo Nubia M153, venduto a circa 3.499 yuan (circa 495 dollari) e disponibile in quantità limitate. ByteDance ha però dichiarato di non avere intenzione di produrre smartphone in proprio: l’obiettivo è accordarsi con diversi produttori affinché Doubao diventi disponibile su più dispositivi.
Implicazioni per l’industria smartphone e ruolo di modelli AI su misura
L’arrivo di uno strumento come Doubao riflette una tendenza più ampia: l’integrazione profonda tra hardware, sistema operativo e intelligenza artificiale. Le capacità offerte — memoria personale, comprensione contestuale, automazione di attività — suggeriscono un’evoluzione del ruolo dello smartphone: da semplice dispositivo di comunicazione e app a un assistente personale proattivo. Gli sviluppi recenti mostrano che l’adozione di modelli di linguaggio grandi (LLM) su smartphone non riguarda solo l’interazione testuale. Studi come quello su GLM-4-Voice mostrano che è possibile realizzare chatbot vocali in tempo reale — con variazione di intonazione, emozioni e ritmo — capaci di operare in più lingue e con prestazioni comparabili a una conversazione umana. Per il mercato europeo e globale, questi sviluppi rappresentano un punto di svolta. Se e quando versioni di strumenti simili dovessero essere localizzate per utenti occidentali, lo smartphone potrebbe trasformarsi davvero in un “assistente personale intelligente”, in grado di gestire calendario, messaggi, promemoria, ricerca, lavoro quotidiano e molto altro, tramite la sola voce.
Criticità e ambiti da monitorare
Nonostante il potenziale, la tecnologia è ancora in fase iniziale. ByteDance ha dichiarato che l’assistente è in fase di test e che serviranno ulteriori verifiche prima di una diffusione ampia. Molto dipenderà dall’efficacia della privacy, dalla gestione dei permessi, dalla localizzazione linguistica e dall’usabilità in contesti diversi da quello cinese. Inoltre, l’effettiva integrazione su larga scala richiederà accordi con più produttori e un supporto software continuo. La sfida riguarda non solo la capacità di offrire funzioni avanzate, ma anche la flessibilità di adattarle a diversi mercati, culture, lingue e normative.



























Lascia un commento