Quanti di voi si ricordano del Dr. Dolittle? Quel fantasmagorico film del ’98 in cui il protagonista, interpretato da un vulcanico Eddie Murphy, è un dottore capace di comunicare con gli animali?
Ok! forse il ’98 è un po’ troppo lontano per ricordarselo, e il fatto che io abbia usato la parola “fantasmagorico” conferma solo quanto sia diventato boomer. Badate bene! per “comunicare con gli animali” non si intende “usare una vocina stridula e fastidiosa”, ma sapersi esprimere, nel tentativo di arrivare all’altro.
E se vi dicessi che, attraverso i prodigi della AI, potremmo comprendere il linguaggio animale come faceva il Dr. Dolittle?
Prima di far luce su questo affascinante scenario, dobbiamo fare un passo indietro per conoscere alcuni concetti di Computer Science (non vi spaventate).
Oggi, la parola A.I. (in inglese “Artificial Intelligence”, in italiano “Intelligenza Artificiale” I.A.) è sulla bocca di tutti. Vuoi trovare parcheggio in maniera veloce? C’è l’intelligenza artificiale. Vuoi trovare l’anima gemella? Che ci vuole! Scarichi una app, basata su algoritmi di A.I., che la trova al posto tuo. Vuoi fare la spesa? Ancora una volta l’A.I. Sei talmente pigro che non vuoi cercare nemmeno l’A.I. perfetta per le tue esigenze? Ancora una volta la risposta è una sola: Intelligenza Artificiale!
Ma cos’è questa fantomatica A.I.?
Il termine A.I. si riferisce ad una serie di tecnologie capaci di emulare l’intelligenza umana.
Ah, tutto molto più chiaro ora, vero?
No? E avete ragione, visto che nessuno sa cosa significhi “intelligenza umana”.
Ufficialmente, sono riconosciute nove forme di intelligenza: logica, esistenziale, interpersonale, intrapersonale, linguistica, musicale, spaziale, corporea-cinestetica, naturalistica. Essere intelligenti non significa solo saper risolvere complessi problemi matematici, ma anche riuscire a capire il prossimo, sapere riconoscere il proprio valore, saper distinguere una nota musicale dall’altra o capire quando è il momento giusto di segnare un goal.
L’ altra parola fuorviante è “emulare”, usata nel senso di “eguagliare”. Condizione inattuabile, dato che l’A.I. non vive in una struttura fatta di carne, ossa e sangue. Cartesio (1956) fu il primo ad introdurre il concetto dualismo tra copro (res extensa) e mente (res cogitans), in seguito ripreso dal filosofo Hilary Putanam (1926), secondo cui:
“l’uomo non è un cervello in una vasca”.
Il nostro cervello è una scatola nera, che elabora gli input forniti dal corpo, ovvero lo strumento con cui esploriamo il mondo. La nostra singolare struttura corporea registra input diversi da quella di qualsiasi altra specie. Ad esempio, se fossimo ciechi come una talpa o un pipistrello, esploreremmo il mondo con altri sensi e ne dedurremmo un’interpretazione diversa, perché la realtà è una nostra singolare rappresentazione del mondo. Dunque, la nostra idea di realtà – elaborata dalla mente – è fortemente condizionata dalle nostre caratteristiche fisiche. In sintesi, la relazione tra mente e corpo è imprescindibile, per cui l’A.I. dovrebbe avere un corpo umano se vuole anche emularne il pensiero.
Ma come fa l’A.I. a capire il nostro linguaggio verbale?
Il linguaggio verbale è composto da parole, a loro volta costituite da un simbolo – il segno grafico, che è la rappresentazione di qualcosa – e un significato – il qualcosa da rappresentare.
L’AI è un operatore di simboli, ovvero non comprende il significato delle parole, ma converte il segno grafico in un linguaggio binario (0-1), che riesce ad elaborare.
Praticamente, l’AI prende una lettera di una parola e la converte in: vettori, entità matematica monodimensionale (lunghezza), rappresentabile da una sequenza numerica; matrici, entità bidimensionale (lunghezza e larghezza), ottenuto come prodotto di vettori e rappresentabile con righe e colonne; tensori, entità multidimensionale, che difficilmente riusciamo a rappresentare.
Elaborando vettori, matrici e tensori, l’AI genera un output, che poi converte nuovamente in parole.
Ciò è merito del Deep Learning (DL) – un sotto insieme dell’A.I. – che sfrutta particolari reti neurali, chiamate “Transformer”. Avete presente Optimus Prime? Bene, cancellatelo dalla vostra mente. I Trasfomer sono architetture informatiche, costituite da:
- Un Encoder, che colleziona i dati di input – ovvero le parole di una frase – e li converte in linguaggio macchina – vettori, matrici, tensori.
- Un decoder, che prende le strutture create dall’encoder, elabora un output e decodifica il linguaggio macchina in uno comprensibile all’uomo, ovvero le parole.
Se bastasse questo, l’AI parlerebbe come il Maestro Yoda! perché genererebbe parole, ma sarebbe incapace di formulare una frase di senso compiuto. Il problema è stato risolto nel 2017, quando apparve un articolo scientifico intitolato: “Attention is all you need”, palese riferimento alla intramontabile canzone dei Beetles e monito provocatorio nei confronti del genere umano, sempre meno capace di concentrarsi.
L’ articolo parla di una particolare tecnica chiamata: Attenzione! ovvero un processo selettivo del DL che riconosce il peso – importanza – di alcuni elementi – in questo caso parole – in modo da creare una struttura sequenziale – ossia una frase.
Insomma, attraverso un modello iterativo probabilistico, l’AI riesce a capire quali sono le parole “più giuste” da disporre in una frase, così da rispondere alle domande o richieste dell’essere umano.
Ma l’A.I. mi capisce quando parlo?
L’AI capisce le parole, nel senso che riconosce i simboli, ma non ha la minima idea di cosa significhino, ovvero non li comprende. La costruzione della frase è il risultato di modelli stocastici che, dopo un lungo allenamento di miliardi di dati, riescono a trovare una giustapposizione tra le parole di input – la nostra domanda – e quelle di output – la loro risposta. È un diabolico marchingegno, che dà l’illusione della comprensione.
È come quando parliamo con un nostro amico che, particolarmente distratto, risponde con frasi del tipo: si stava meglio quando si stava peggio! non esistono più le mezze stagioni! Ci sta!
Testimonianza che il messaggio non solo non è arrivato, ma che si è perso anche la capacità di prestare attenzione! (appunto).
Comprendere significa riconoscere il significato!
La frase “il sole brucia sulla pelle”, la capiamo perché associamo significati alle parole, ma la comprendiamo perché ne siamo coscienti, ovvero ne abbiamo fatto esperienza.
Ecco perché alcuni concetti esistenziali e metafisici – come l’idea di Dio – sono così difficili da comprende, perché non possiamo farne esperienza, e quindi si fermano al livello del “capire”.
Per come è costruita, l’A.I. può solo capire una parola, ma non comprenderla! perché vive in una dimensione che non è la nostra, e quindi non può associarne un significato.
Quando l’A.I. sarà integrata in robot antropomorfi (simili all’uomo), potrà muovere i primi passi nel mondo e farne esperienza. Ovviamente, sarà una esperienza molto diversa dalla nostra, perché non ha il nostro corpo e, quindi, non può interpretare il mondo come facciamo noi. Più questi robot umanoidi somiglieranno all’uomo, più riusciranno ad estrapolare un significato del mondo, sviluppando una coscienza e un pensiero simile a quello umano.
Nel caso degli animali, come possiamo sfruttare l’A.I.?
Abbiamo capito che il linguaggio verbale è molto complesso. Fortunatamente, il linguaggio è una forma di espressione! Quindi ne esistono altri come il non-verbale, riflesso di stati emotivi e inconsci, che si manifesta sotto forma di piccole azioni ed espressioni facciali (che diamo per scontato); o l’Arte, come la scrittura, la pittura, la musica…
Se volessimo convertire il linguaggio degli animali in uno comprensibile all’uomo, dovremmo costruire un etogramma digitale: ovvero catalogare le azioni, le espressioni facciali, i movimenti e i comportamenti dell’animale e convertirli in dati. In seguito, questi verrebbero processati dall’A.I. per decodificarli in parole.
Ciò richiede un lungo e tedioso lavoro da parte di biologi e zoologi, che dovrebbero collezionare una mole infinita di dati, osservando i comportamenti animali sul campo. Poi, la palla passerebbe a linguisti, informatici, ingegneri del software ed esperti di A.I., che dovrebbero preparare i dati e formulare modelli di conversione linguistica, capace di adattarsi alle singole specie.
Se ci fosse il Dr. Oak con il suo pokedex, faremmo molto prima!
E se la soluzione si trovasse nel cambiare il punto di vista?
Più che convertire il linguaggio animale in quello umano, potremmo usare l’A.I. in modo smart.
Nello studio dei suoni emessi dalle balene, c’è un problema noto come “cocktail party”: è impossibile filtrare completamente il suono emesso dalla fauna marina e isolarlo dal rumore di fondo dell’oceano. O meglio, impossibile prima dell’avvento dell’A.I. Il progetto CETI (Cetacean Translation Initiative), ha l’ambizioso obiettivo di creare una analisi sistematica dei suoni emessi dal capodoglio. L’A.I. riesce ad isolare il suono dei cetacei dal rumore dell’oceano, catalogarlo e individuare sonorità ricorrenti. Ciò consente di registrare azioni e schemi di comportamento iterativi, che ci permettono di capire meglio la comunicazione e le abitudini sociali dei capodogli.
Ma a cosa ci serve capire il linguaggio animale?
Sapere che, la nostra simpatica scimmietta Chita non stia solo dicendo “banana”, ma stia dicendo “ho fame”, la umanizza! Pensate a tutte le cavie per prodotti cosmetici o peggio. Come ci sentiremmo se capissimo il loro stato psico-emotivo? E cosa faremmo se scoprissimo che anche loro hanno un’anima?
Ci comporteremmo meglio (spero) e rivoluzioneremmo il nostro modo di allevare, mangiare, pensare e vivere. Capire il linguaggio animale, ci farebbe comprendere che non siamo poi così diversi da loro, come vogliamo ostinatamente pensare. Ciò colmerebbe le distanze che abbiamo preso dal mondo naturale, e ci riscopriremmo come sua parte integrante.
Capire gli animali, significa capire meglio noi stessi!
Riconoscendo le differenze, che ci rendono unici, e individuando le caratteristiche che ci accomunano. Ad esempio, scoprire che l’uomo non è il solo a provare emozioni e sentimenti, ma che il concetto di “essere umano” possa essere molto più esteso di quanto riteniamo. Riconoscere – o meglio confermare – la bestia che è nell’uomo, e l’uomo che è nella bestia (troppo spesso evidente). Ma forse, abbiamo solo paura! La paura di scoprire che la parola “umanità” non sia una nostra prerogativa o che non sia mai appartenuta alla razza umana!
Fonti:
- “Il dottor Dolittle”, 20th Century Fox, 1998, https://it.wikipedia.org/wiki/Il_dottor_Dolittle_(film)
- “Decoding the communication of whales with Advanced Machine Learning and state-of-the-art robotics”, Progetto CETI, 2020
https://www.audaciousproject.org/grantees/project-ceti - “Artificial Intelligence”, Nov 11, 2024
https://www.britannica.com/technology/artificial-intelligence - “Irriducibile”, Federico Faggin, Mondadori, 2022