OpenAI ha presentato Operator, un’anteprima di ricerca che rappresenta un significativo passo avanti nell’uso dell’intelligenza artificiale. Questa tecnologia consente di interagire direttamente con un browser per compiere attività come compilare moduli, effettuare prenotazioni o creare contenuti online. Operator è progettato per semplificare le attività quotidiane e migliorare l’esperienza digitale.
Come funziona Operator
Operator si basa sul modello Computer-Using Agent (CUA), che integra le capacità visive di GPT-4o con un sistema avanzato di ragionamento tramite reinforcement learning. Grazie a queste caratteristiche, è in grado di interpretare screenshot e interagire con interfacce grafiche, simulando le azioni di mouse e tastiera. L’utente può assegnare compiti come acquistare biglietti o fare ordini online, con il sistema in grado di gestire il processo in autonomia. In caso di difficoltà, Operator è programmato per restituire il controllo all’utente.
La sicurezza è stata considerata una priorità. Operator chiede conferme prima di ogni azione critica e passa al Takeover Mode durante l’inserimento di dati sensibili. In questo modo sta all’utente mantenere il pieno controllo senza registrare informazioni personali. La gestione dei dati è completamente trasparente, esiste l’opzione per disattivare l’uso dei dati per l’addestramento del modello, cancellare cronologie di navigazione e rimuovere conversazioni passate. Operator è ancora in una fase iniziale e mostra limiti con interfacce più complesse. OpenAI punta a raccogliere feedback dagli utenti per migliorare ulteriormente il sistema. Sono già in programma l’accesso API al modello CUA, l’ampliamento delle capacità per gestire flussi di lavoro più articolati e l’estensione della disponibilità agli utenti Plus, Team ed Enterprise, con un’integrazione diretta in ChatGPT.
Leave a Reply