Le notizie di oggi sull’intelligenza artificiale con i miei commenti - 02.06.2025
C’è una nuova corsa, sempre più accelerata, verso agenti AI capaci di creare, decidere e parlare come esseri umani. Non solo testi, ma voci, video, report, slide, decisioni complesse. Una corsa che ormai non riguarda più solo i soliti tre giganti. DeepSeek ha aggiornato il suo modello R1 ed è salito sul podio della classifica Artificial Analysis, superando tutti tranne i modelli o3 e o4-mini di OpenAI. Non è una vittoria marginale. Significa che oggi possiamo avere un’alternativa reale anche fuori dai soliti ecosistemi.
Nel frattempo, l’open source continua a dare spettacolo. Tencent ha rilasciato HunyuanVideo-Avatar, un modello gratuito che trasforma una semplice foto in un video con tanto di audio. Quello che fino a ieri sembrava un trucco da film, ora lo possiamo fare da soli. Il punto non è la tecnologia, è il controllo: chi decide cosa viene generato? Chi verifica l’uso delle immagini? Perché ora che i nostri volti possono diventare video realistici, senza alcun consenso, il problema non è tecnico. È sociale, politico e culturale.
Nel mondo dei report intelligenti, invece, Perplexity prova a fare il salto di qualità. Con il nuovo servizio Labs, gli utenti Pro possono generare documenti analitici integrando più strumenti in un’unica sessione. Non si tratta solo di riassunti. Parliamo di vere e proprie analisi strutturate, con fonti, dati, e stili adattivi. È un altro pezzo della scomparsa del lavoro intellettuale intermedio. Quel lavoro che oggi facciamo noi, e domani farà una macchina connessa a cinque plugin.
Anche la voce sta cambiando faccia. Hume ha lanciato EVI 3, un modello speech-to-speech capace non solo di creare voci su misura, ma di superare le performance del GPT-4o di OpenAI. Non è più solo questione di “parlare come un umano”, ma di rispondere con toni, sfumature, emozioni. Questo sposta tutto: un agente che sa parlare bene può vendere, persuadere, manipolare. E se quel tono non è nostro, ma ci viene attribuito, cosa ci rimane della nostra identità?
Per chi lavora con la voce, arriva un altro scossone: Resemble AI ha reso open-source Chatterbox, un sistema gratuito di voice cloning che, secondo i benchmark, batte ElevenLabs. Gratis. Senza blocchi. Senza paywall. E quindi? Possiamo clonare chiunque? Possiamo imitare, sostituire, falsificare? Serve una nuova etica della voce, prima che la nostra venga usata per dire cose che non abbiamo mai detto.
E alla fine, anche le slide. Manus ha presentato Manus Slides, un sistema capace di generare automaticamente presentazioni personalizzate, complete, coerenti. Basta una richiesta, e l’agente AI crea tutto da solo. Un’altra fetta di lavoro che sparisce. Ma anche un nuovo strumento nelle nostre mani, se impariamo a usarlo con criterio. La linea tra abilità e dipendenza sarà sempre più sottile. E saremo noi a dover scegliere da che parte stare.
Area Manager
3 mesiConsiderazioni giuste, temo questa tecnologia senza controllo, soprattutto nel mio lavoro di vendita. Imparare per "contenerla"?
Collaboratore amministrativo presso Cartiere Miliani
3 mesiMi sembra tutto un incubo 😵Grazie Marco
Consulente del Lavoro | Esperta in Contrattualistica, Previdenza Pensionistica, Welfare | Abilitata Asse.Co. | Controversie Lavorative, Relazioni Industriali.
3 mesiCondivido appieno le tue considerazioni.
Dottore in storia dell'arte e beni culturali presso Università degli Studi di Catania
3 mesiOttimo consiglio
Offriamo servizi in materia di Informatica Forense - Perizie su Audio e Video - Team Indagini Difensive - Certificazioni Chat WhatsApp e E-mail - Trascrizioni da File Audio e Video -SCRIVIMI PER INFORMAZIONI
3 mesiGrazie della condivisione, Marco