Home    About me    Publications    Blog    Undergrad memories

Fabio Ruini's blog

'cause Italians blog better

Archivio per la 'Tesi' Categoria

Paragrafo 4.7 – Discriminare tra gli input sensoriali: l’emergere di un meccanismo di attenzione selettiva

Lo so, dev’essere la sessantaseiesima volta che parlo di attenzione selettiva negli ultimi cinque mesi. Anche se sono consapevole del fatto che per i lettori disattenti (così, ad occhio, e croce un 99% abbondante del totale), questa sarà una novità. Così come continuerà ad esserlo la sessantasettesima volta che ne parlerò, la sessantottesima, ecc… Vi garantisco però che, per osmosi o per esaurimento, tutti voi diventerete piano piano esperti di attenzione selettiva. Spero più esperti di me, perchè ancora continuo a parlarne come un neofita. A voi, a titolo di esempio, un estratto del paragrafo 4.7 della mia Tesi. In realtà volevo pubblicare la seconda parte di questo paragrafo, ma tra tabelle e formule era un po’ un casino per il povero WordPress. Così, la seconda parte la allego in fondo al post, in comodo formato PDF. Se vi state chiedendo il perchè non abbia fatto un file PDF unico, la risposta è che manca ancora la parte che di collegamento tra le due parti (contorto giro di parole, che sono però sicuro avrete capito).

Un modello come quello che abbiamo appena descritto, pur nella sua semplicità, ci permette di osservare l’emergere di fenomeni estremamente interessanti. Prima di approfondire ciò cui sto facendo riferimento, ritengo sia però necessario aprire una piccola parentesi relativa al modo in cui gli esseri umani percepiscono gli stimoli sensoriali esterni (relativi, pertanto, all’interazione dell’organismo con l’ambiente esterno ed i suoi prodotti) e quelli interni (intesi come provenienti dall’interno del corpo).

Innanzitutto, le nostre percezioni hanno un carattere selettivo. Durante lo svolgimento delle normali attività quotidiane, noi, intesi come esseri umani normodotati, non reagiamo indifferentemente a tutti gli stimoli che ci colpiscono, ma bensì mettiamo a fuoco soltanto alcuni di essi. Tale focalizzazione percettiva prende il nome di “attenzione ”. Attraverso i processi attentivi poniamo il focus su un limitato sottoinsieme degli stimoli potenzialmente percepibili in un dato momento, resistendo così a quelli che ci distraggono, ovvero a quelli che, per il compito che stiamo affrontando in quel dato momento, ci appaiono fuorvianti o comunque superflui. Così come superfluo è il cercare di dimostrare da quale moltitudine di stimoli siamo bombardati in ciascun istante della nostra vita. Chiunque stia leggendo queste righe, ad esempio, si fermi per un attimo e provi a prestare attenzione alla pressione esercitata sulle sue spalle o sul suo collo dal vestito che indossa, oppure cerchi di captare i rumori provenienti dall’ambiente esterno. Si tratta di informazioni sensoriali che, fino a qualche secondo fa, venivano elaborate in maniera del tutto inconsapevole dal vostro cervello. Eppure, la pressione esercitata dalla stoffa appoggiata al proprio corpo, il fragore emesso da una macchina o da un paio di passanti impegnati in una vibrante discussione, sono fenomeni fisici. Assolutamente reali. Ci sono, ora che vi state prestando attenzione, ma esistevano allo stesso modo, seppur in forma leggermente diversa, anche prima. La questione, molto semplicemente, ruota attorno al fatto che le vostre risorse attentive, fino a poco fa, erano focalizzate nel compito di leggere questo paragrafo della mia Tesi e non in uno degli altri task esemplificati qui sopra.

Si può dire che il nostro sistema percettivo scelga come oggetto di attenzione soltanto gli stimoli pertinenti ed ignori gli altri, fino al momento in cui una trasformazione avvenuta in un particolare stimolo non renda quest’ultimo importante ed utilizzabile. Ma abbiamo tuttavia la prova che persino gli stimoli cui non prestiamo attivamente attenzione lasciano comunque delle tracce nel nostro sistema percettivo, anche se sul momento non siamo in grado di riconoscerli. Ad esempio, a tutti noi è capitato di frequentare, più o meno regolarmente, luoghi affollati. In un luogo affollato, di solito, il fatto che molte persone parlino contemporaneamente fa sì che il “rumore” in sottofondo sia piuttosto alto. Ma, anche in queste situazioni, siamo in grado di portare avanti una conversazione con una o più persone specifiche (a patto, ovviamente, che l’intensità del “brusio” di fondo non sia superiore rispetto a quella della voce di coloro con cui stiamo interloquendo). Lo facciamo focalizzando la nostra attenzione sui suoni emessi dal nostro interlocutore ed ignorando, per quanto possibile, il vociare della folla sullo sfondo. Parliamo, parliamo, poi, tutto d’un tratto, sentiamo pronunciare il nostro nome da qualcuno che sta alle nostre spalle. Pensavamo di non prestare alcuna attenzione alle voci della folla ed invece è bastato che qualcuno pronunciasse una determinata parola per far sì che noi ci voltassimo di scatto. Dunque, il nostro apparato percettivo/sensoriale non si limita a lavorare con quegli stimoli cui noi stiamo dedicando le nostre risorse attentive, ma elabora anche gli stimoli che stiamo pensando di ignorare. A tal proposito, reputo interessante riportare un esperimento raccontato da Ernest Hilgard, Richard e Rita Atkinson in una loro vecchia opera dei primi anni ’70 :

“Informazioni su quanto noi effettivamente registriamo delle conversazioni cui non prestiamo attenzione ci sono fornite da una situazione sperimentale […]. Si presentano al soggetto, mediante cuffie, applicate una all’orecchio destro e una all’orecchio sinistro, due differenti messaggi verbali. Il soggetto non ha difficoltà ad ascoltare uno dei due discorsi, rifiutando l’altro; ed è in grado di focalizzare alternativamente la propria attenzione sull’uno o sull’altro. Se noi gli chiediamo di ripetere ad alta voce il discorso che gli è stato trasmesso all’orecchio destro, egli riesce a farlo adeguatamente anche se il messaggio è continuo; le sue parole sono solo leggermente in ritardo rispetto a quelle che egli sta ascoltando. La sua voce tende ad assumere un’intonazione monotona, senza alcuna inflessione, e probabilmente alla fine del brano il soggetto avrà un’idea molto vaga del suo contenuto, specialmente se l’argomento è complesso. Ma che cosa avviene dell’altro messaggio, al quale egli non presta attenzione? Quante informazioni vengono, nonostante tutto, assimilate. La risposta dipende da una serie di fattori, tra cui è compresa la difficoltà dei messaggi stessi. Se il brano fatto oggetto di attenzione è costituito da una filastrocca familiare, il soggetto recepirà una notevole quantità dell’altro messaggio; se invece il materiale impiegato è più difficile, il soggetto, almeno nella maggior parte dei casi, non terrà a mente nulla del contenuto verbale di quanto gli è stato trasmesso senza che egli vi prestasse attenzione e forse non saprà neppure dire se era in inglese o in tedesco. Ha presente però alcune caratteristiche generali: se si trattava di un messaggio parlato o di una semplice tonalità, se la voce era maschile o femminile, e (ciò almeno accade con alcuni soggetti) se è stato o meno pronunciato il suo nome.
Se si interrompe il soggetto mentre sta ripetendo il messaggio su cui era focalizzata la sua attenzione e gli si chiede di dire immediatamente che cosa gli è stato appena trasmesso all’altro orecchio, sembra che risulti un temporaneo ricordo del messaggio […]. Analogamente, se qualcuno che noi stiamo ascoltando ci rivolge una domanda, subito ci viene fatto di rispondere: «Che cosa ha detto?», ma prima ancora che la domanda venga ripetuta realizziamo improvvisamente quanto ci è stato chiesto.”

Ciò che emerge in maniera chiara da questi esperimenti è che, sebbene la focalizzazione dell’attenzione non ci renda del tutto impermeabili nei confronti degli stimoli che stiamo percependo in maniera non-cosciente, la “qualità” della loro elaborazione risulta essere molto bassa. Di tutti gli stimoli che bombardano i nostri sensi, in sostanza, sono soltanto quelli che i nostri “processi mentali superiori” ci indicano come rilevanti ai fini dei meccanismi psicologici attivi in quel momento a venire selezionati per essere fatti oggetto di attenzione e quindi processati in maniera più rigorosa.

Share

Formalità burocratiche espletate

Finalmente finita tutta la burocrazia pre-Laurea. Con gli ultimi documenti fatti firmare questa mattina e consegnati nel pomeriggio, ora non mi rimane altro che ultimare la compilazione della Tesi (detto niente…). Termine ultimo di consegna (ma fortemente deprecated dalla presidenza di Facoltà): 10 aprile. Termine di consegna (altrettanto fortemente) consigliato: 6 aprile.

Ho depositato anche il titolo del mio lavoro. Dopo ore di sbattimento spese alla ricerca di un titolo adatto, alla fine mi sono buttato su un: “La motivazione come determinante del comportamento di organismi artificiali: una simulazione di Artificial Life“.

Contestualmente, e dopo una lunga agonia, su Esse3 hanno finalmente deciso di completare l’aggiornamento del mio libretto elettronico, di cui allego uno screenshot:

Screenshot del mio libretto su Esse3

Bello, vederlo tutto finito. La statistica dice:

  • Media voto: 28.933
  • Media voto ponderata in base ai crediti: 28.772
  • Media voto (in centodecimi): 105.497 (credo arrotondato per eccesso a 106)
  • Punti aggiuntivi a disposizione per la Tesi: da 2 a 9
  • Voto previsto: per il 110 dovrei farcela, speriamo nella lode

Abbondo di 8 crediti. Alla luce dei fatti, avrei potuto evitare di dare l’opzionale di Psicologia Sociale, che tra l’altro mi abbassa un pochino la media. Ma ormai è andata ed anche quello farà media.

Le varie tessere del complesso (e non poteva essere altrimenti) puzzle della mia carriera universitaria in quel di Reggio Emilia si stanno pian piano componendo a formare il disegno finale.

Dai che ce la facciamo…

Share

Quando ti accorgi che i risultati che hai sono ESATTAMENTE il contrario di ciò che dovrebbero in realtà essere…

… decisamente non sono dei bei momenti, garantisco. Fioccano parolacce, imprecazioni che per qualche minuto devono anche apparire gradevoli alle orecchie di un ipotetico ascoltatore. Accendi una sigaretta, la annienti nel giro di un paio di minuti e continui a guardare il monitor. Cerchi di rifare da capo tutto il procedimento che ti ha portato ad ottenere quei risultati così fottutamente incongrui con il discorso che stavi elaborando e ti accorgi che, per la prima volta in vita tua, non avevi sbagliato assolutamente nulla.

E’ a quel punto che le simpatiche parolacce si traducono in roboanti bestemmie. Lo smisurato orgoglio che nutrivi fino a qualche mezzoretta prima, dovuto all’aver partorito le prime due formule matematiche della tua vita (ed esserti accorto che, quello che non sei riuscito a spiegare in una pagina, rigorosamente ad interlinea doppia, è perfettamente comprensibile con una formuletta idiota da mezza riga), è soltanto un pallido ricordo.

Di fronte a te rimane solo quella fottuta tabella che tanti sacrifici ti è costata e che ti sembrava essere una delle cose più fiche di tutta la Tesi:

La maledetta tabella

Ma è possibile che i risultati siano ESATTAMENTE il contrario di quelli che ti aspettavi? O, perlomeno, di quelli che ti sarebbe piaciuto veramente tanto fossero venuti fuori?

Per la cronaca, la tabella in questione è relativa al meccanismo di attenzione selettiva. Volevi dimostrare, cosa che ti sembrava anche abbastanza ovvia, che gli organismi della tua simulazione imparano ad ignorare l’input sensoriale relativo al cibo, in misura tanto maggiore quanto più il predatore è loro vicino. La tabella dice l’esatto contrario.

Allora ti viene un dubbio. “Vuoi vedere che c’è un qualche marone nel codice?”, mormori tra te e te. Apri XCode e ti metti a spulciare le ormai incomprensibili istruzioni scritte qualche mese fa. E scopri l’errore. Righe 360 e 361 del main.cpp. “Fanculo a me e a quando ho deciso di cambiare la codifica dell’input”, urli, questa volta con voce tonante, per essere sicuro di aver sentito. E soprattutto di aver capito. Sistemi il codice, uploadi tutto sul cluster dell’ISTC, dentro alla tua home, compili, metti in coda d’esecuzione il processo e te ne vai a nanna. Perchè domattina devi essere a tutti i costi in Facoltà in mattinata. E non puoi fare come oggi, che ti sei svegliato alle 3.15 di pomeriggio, ignorando (ancora una volta, ecco il meccanismo di attenzione selettiva) pari pari la sveglia. Prima, però, compi il tuo dovere istituzionale e ti sfoghi sul blog.

Malgrado tutto, vedo la luce in fondo al tunnel della mia Tesi. Speriamo solo che la realtà, ancora una volta, non sia il contrario di quello che mi aspetto. Speriamo non sia la luce di un treno che mi corre incontro…

Share

L’oceano della verità

“Non so come il mondo potrà giudicarmi, ma a me sembra soltanto di essere un bambino che gioca sulla spiaggia e di essermi divertito a trovare, ogni tanto, un sasso o una conchiglia più bella del solito, mentre l’oceano della verità giaceva insondato davanti a me” (Isaac Newton)

Conchiglia in riva all’Oceano

No, niente. Solo per dire che ho finalmente trovato la citazione colta da inserire in apertura di Tesi…

Per la cronaca, la foto è tratta da SmugMug.com.

Share

Dio benedica l’interlinea doppia

La scrittura della mia Tesi procede. Molto meglio del previsto. Sto finendo di riassemblare le varie parti teoriche, “attingendo” (leggi: “copia/incolla/cerca di dare un filo logico al tutto”) dalle caterve di pagine e appunti buttati giù, a volte bene, più spesso schifosamente, durante il mio soggiorno romano.

Il risultato? Sono a quota 89 pagine. Comprensive di indice, copertina, ringraziamenti e bibliografia. Ma carenti di tutti (e ribadisco TUTTI) i grafici delle mie simulazioni. Andrà a finire che varcherò la fatidica soglia delle 200 pagine.

Ed il merito è in particolar modo suo: dell’interlinea doppia.

Menu per la scelta dell’interlinea

E’ verissimo che la bontà di una Tesi non si giudica dal numero di pagine. Ci mancherebbe altro. Certo è che per superare la classica sindrome della pagina bianca, l’inizio è ottimo!

Share

Startle e “riflesso Moro”

Finalmente riesco a concentrarmi e scrivere qualcosina per la tesi. Sto preparando un capitoletto, di stampo prettamente psico-neurologico, dove si introducono le principali teorie esplicative riguardanti il concetto di “motivazione” negli esseri umani. Durante lo studio/scrittura, mi sono perso un po’ nell’analisi dello “startle effect”. Questi sono i frutti:

La “startle response”, conosciuta anche come “startle reaction” o “alarm reaction”, è una categoria di risposte adottate della mente e dal corpo di un organismo nel momento in cui si trova esposto ad uno stimolo improvviso ed inaspettato, quale può essere ad esempio un lampo di luce, un forte rumore o un rapido movimento compiuto nelle vicinanze del viso. Negli esseri umani, questo tipo di risposta comprende movimenti fisici di allontanamento dallo stimolo, la contrazione dei muscoli delle braccia e delle gambe e, talvolta, anche il “blinking”, ossia lo sbattimento delle palpebre. La risposta di startle chiama in causa inoltre il sistema nervoso simpatico, provocando un aumento del battito cardiaco e modificazioni nella frequenza della respirazione. Mentre la reazione muscolare, generalmente, svanisce nel giro di pochi secondi, le altre risposte possono durare più a lungo.

Da un punto di vista evoluzionistico è facilmente intuibile come lo startle si collochi tra quei comportamenti di tipo involontario, messi in atto dall’organismo per rispondere in maniera efficiente al presentarsi di un pericolo. L’aumento del battito cardiaco, unitamente all’allargamento delle vie aeree polmonari (che si preparano a ricevere più abbondanti flussi di ossigeno), prepara il corpo all’esecuzione di un compito energeticamente dispendioso quale può essere una fuga, oppure un combattimento .

La reazione di startle è stata studiata estensivamente in relazione ai bambini. Il cosiddetto “Moro reflex”, o “effetto Moro”, così chiamato in onore del pediatra austriaco Ernst Moro che per primo lo analizzò in maniera sistematica, è uno di quei riflessi infantili (come, ad esempio, il succhiare, il rotolarsi su se stessi, ecc…) che chiama in causa proprio un meccanismo di “startle”. Quando un neonato avverte la sensazione di una perdita di equilibrio (oppure è sottoposto ad un forte rumore), la sua reazione è quella di contrarre i muscoli di gambe e braccia, protendendo queste ultime verso l’alto.

L’effetto Moro può essere osservato, seppur in forma incompleta, già nei bambini nati prematuri dopo la ventottesima settimana di gestazione. Esso è invece presente, nella sua forma completa, intorno alla trentaquattresima settimana e scompare, solitamente, nel corso del sesto mese post-parto. L’assoluta regolarità con la quale questo tipo di riflesso si manifesta (e successivamente scompare) in neonati sani ha fatto sì che, in pediatria, la sua mancanza (o il suo eccessivo perdurare) venga generalmente interpretata come un pericoloso campanello d’allarme relativo alla presenza di gravi disfunzioni, motorie o addirittura cerebrali nel bambino.

Affascinante l’ipotesi avanzata da alcuni ricercatori, secondo i quali l’effetto Moro sarebbe un “residuato” di tempi antichi. I neonati di nostri lontani antenati, quadrupedi e ricoperti di pelo, avrebbero sviluppato, nel corso dell’evoluzione, l’abitudine di farsi trasportare “passivamente” dalle madri, rimanendo aggrappati al loro pelo, in maniera tale da lasciar libere le zampe anteriori delle genitrici, necessarie per raccogliere cibo e quindi sfamare, ma anche difendere, i piccoli. L’istinto è rimasto anche negli esseri umani. Il riflesso Moro, ossia l’allungare le braccia da parte del bambino nel momento in cui si sente cadere, assomiglia decisamente alla ricerca di un appiglio: il pelo della madre, dal cui corpo si è scivolati.

Share

Deliri complessi, parte cinque: Il comportamento visto come un processo dinamico risultante da sequenze di micro-interazioni

Chiusa la parte relativa al rapporto tra reti neurali e complessità, andiamo ora ad indagare più nel dettaglio perché il comportamento possa essere visto come un fenomeno emergente.

Nolfi , in un suo lavoro recente, definisce il comportamento come un processo dinamico risultante dalle interazioni, di carattere non-lineare, tra un agente (naturale od artificiale che sia), il suo corpo e l’ambiente esterno (incluso in questo senso anche l’ambiente sociale).

Tale definizione è ben sintetizzata dallo schema che segue:

Comportamento individuale

Ad ogni singolo istante, la struttura dell’ambiente e soprattutto le sue relazioni con l’agente influenzano il corpo di quest’ultimo (ovvero la sua percezione relativa all’ambiente) e, di conseguenza, la sua risposta motoria. La risposta motoria dell’organismo, a sua volta, può produrre dei cambiamenti nella struttura dell’ambiente o comunque una differente relazione tra questo e l’agente, innescando una sequenza di azioni in cui ciascuna di esse è sempre influenzata dall’azione precedente.

Il prodotto di queste sequenze di interazioni “fine-grained” è un processo dinamico, il comportamento. In esso, il contributo dei diversi aspetti (l’agente, il corpo e l’ambiente) non può essere considerato separatamente. Ciò implica che anche una completa conoscenza degli elementi che governano le interazioni non fornisce che un piccolo contributo alla comprensione del comportamento emergente dalle interazioni. Il termine “emergente”, in questo caso, è utilizzato nel senso “tradizionale” della complessità, allo scopo di indicare una proprietà risultante da una sequenza di interazioni che possono essere difficilmente predette o inferite da un osservatore esterno anche in possesso di una conoscenza completa degli elementi interagenti e delle regole che governano le interazioni.

La relazione che vi è tra le regole di interazione ed il comportamento risultante è ulteriormente complicata dal fatto che, quando le interazioni sono di tipo non-lineare, modifiche anche minime delle regole d’interazione “di basso livello” possono tradursi in forme molto differenti di comportamento, per via dell’azione di effetti cumulativi ed amplificativi.

Share

Deliri complessi, parte quattro: Ecological Neural Networks e complessità

Anche una semplice rete neurale ecologica, come ad esempio quella che abbiamo utilizzato per modellizzare il sistema nervoso degli organismi delle simulazioni presentate in questo lavoro, può essere vista come un sistema complesso. Complessità che deriva in particolare da alcune caratteristiche, che andrò a ora spiegare nel dettaglio.

impossibilità di prevedere il comportamento complessivo della rete, ovvero il valore di attivazione dei suoi neuroni di output al presentarsi di un certo pattern di input. Mi rendo conto del fatto che questo punto possa essere controverso e presti effettivamente il fianco a facili critiche. Ciò che avviene all’interno di una rete neurale deriva infatti da precise quanto semplici regole matematiche che agiscono a livello locale. Quello che fa ciascun neurone (eccezion fatta per quelli di input) non è nient’altro che calcolare la somma pesata dei vari contributi ricevuti in ingresso ed applicare quindi a questa somma una certa funzione di trasferimento, prima di trasferire i risultato dell’elaborazione ad altri neuroni. Le regole d’interazione locali, nel momento in cui si definisce arbitrariamente l’architettura di una rete neurale, sono note a priori. Ma, in maniera più che proporzionale al crescere del numero di neuroni e di connessioni, diminuisce l’immediatezza di “comprensione”, da parte di un osservatore. Seppur in linea teorica, avendo ovviamente a disposizione tutti i dati necessari, sarebbe dunque possibile prevedere con esattezza l’output di una rete neurale, tale compito si rivela nella pratica impossibile. Ad esempio, già con una rete come la nostra, composta da 4 neuroni di input, 9+2 nello strato intermedio e 2 di output, il numero totale di connessioni sinaptiche che entrano in gioco è 76. Impossibile, per una mente umana “normale”, riuscire a dedurre l’uscita della rete semplicemente osservando il pattern in ingresso. Il problema, benché analiticamente risolvibile, deve necessariamente essere affrontato attraverso tecniche risolutive “numeriche”. In sostanza, anche il conoscere alla perfezione tutte le regole d’interazione locali non ci fornisce indicazioni utili per capire quale sarà il comportamento della rete nel suo complesso.

Non-linearità delle interazioni che hanno luogo a livello locale. Questa non è una caratteristica comune a tutte le reti neurali, dato che le funzioni di trasferimento dei singoli neuroni possono anche essere di tipo “puramente” lineare. Nella pratica, tuttavia, ciò che si fa solitamente è includere all’interno di una rete anche funzioni di trasferimento non-lineari. Tale abitudine nasce dai lavori pionieristici di Hornik, Stinchcombe e White , che già nel 1989 dimostrarono come fosse possibile, attraverso un percettrone multi-strato (MLP, multi-layer perceptron), purché dotato di una sufficiente quantità di unità neurali e con almeno un layer caratterizzato da funzioni di trasferimento non-lineari, approssimare qualsiasi tipo di funzione. E la non-linearità è proprio una delle caratteristiche “classiche” dei sistemi complessi. E’ da essa, ad esempio, che si genera la cosiddetta “dipendenza sensibile dalle condizioni iniziali” e, da qui, il suo possibile effetto manifesto, ossia il “butterfly effect”. Inoltre, la non-linearità accentua quanto sottolineato nel punto precedente, riguardo alla non-prevedibilità del comportamento complessivo della rete.

Emergentismo e gerarchia di livelli. Anche ammesso (ma non concesso) che quanto sottolineato nel primo punto sia fondamentalmente sbagliato e che il funzionamento di una rete neurale sia classificabile tra i fenomeni di tipo “deterministico” e “prevedibili” (una rete neurale, d’altronde, è un modello computazionale assolutamente deterministico in termini matematici, per quanto le sue “dimensioni” ne impediscano una comprensione immediata), la questione sulla “prevedibilità” può comunque essere spostata su di un altro piano. O meglio, parlando in termini gerarchici, su di un altro livello. Le reti neurali ecologiche utilizzate nell’ambito dell’Embodied Cognitive Science, oltre ad essere dotate di un certo livello di “fisicità” (embodiment), come conseguenza concreta di tale proprietà sono infatti caratterizzate dal fatto di essere situate all’interno di un certo contesto ambientale (situatedness). Il risultato delle interazioni che avvengono all’interno della rete neurale, ovvero la percezione dell’input sensoriale e la sua successiva elaborazione, si traducono, ad un livello “superiore”, in un comportamento motorio. Un comportamento emergente, generato da decine, centinaia o addirittura migliaia di interazioni che avvengono a livello locale, all’interno della rete.
Vale ancora il discorso fatto in precedenza. La corrispondenza tra output della rete neurale e risposta motoria dell’organismo è “hardwirata” da parte di chi progetta il modello simulativo. Dunque, pur non venendo ancora meno il rigido determinismo di fondo, vi è ad ogni modo un livello di complicazione aggiuntivo: se già era difficile riuscire a determinare l’output della rete neurale dato un qualsiasi pattern di input, ora è necessario fare ancora qualcosa in più, ossia tradurre anche questo output nel corrispondente effetto motorio. Nel nostro modello, la gamma di comportamenti motori che può adottare l’organismo è molto semplice e limitata. Esso può infatti spostarsi in avanti di una casella, ruotare il corpo di 90° in senso orario, ruotare di 90° in senso anti-orario, oppure rimanere fermo. Essendo poi i neuroni di output di tipo di booleano, l’opera di “traduzione” non è per niente difficile.
Ma immaginiamo di dover compiere l’operazione inversa. Saremmo in grado, osservato un certo comportamento dell’organismo, di risalire al pattern di attivazione dell’intera rete neurale che ha generato tale comportamento? La risposta questa volta è tanto secca quanto priva di ambiguità. No, non potremmo. Potremmo determinare in maniera molto semplice il pattern di attivazione delle unità di output, data la relazione di cui sopra, ma non quello delle unità intermedie. Svariati patterns d’attivazione dell’hidden layer, tutti più o meno diversi l’uno dell’altro, generano infatti il medesimo pattern di output. Ciò che fa la rete, d’altronde, è proprio operare una classificazione sui vari patterns di input e rispondere ad essi con il comportamento motorio più appropriato, previa trasformazione dei valori in ingresso, attraverso relazioni di tipo non-lineare, in eterogenei patterns di attivazione delle unità nascoste. Ancora una volta, dunque, quello descritto è un classico esempio di fenomeno dove anche la perfetta conoscenza di ciò che accade in maniera manifesta ad un certo livello (in questo caso, il comportamento motorio), non ci fornisce informazioni precise, ma solo qualche indicazione di massima, su ciò che accade a livello più basso (ossia, all’interno della rete neurale). Al tempo stesso, anche il conoscere alla perfezione il meccanismo di funzionamento delle interazioni che avvengono a livello locale, internamente alla rete, non ci dice molto sul comportamento motorio dell’organismo, che “emerge” come fenomeno complesso.

Questo, per ciò che riguarda le caratteristiche tali da rendere una rete neurale embodied un sistema complesso. Ma nel nostro lavoro vi sono anche un altro paio di implicazioni, potenzialmente interessanti nell’ottica della complessità, che andrò ora ad illustrare. Per trattare dei punti che seguono (e questo è il motivo per il quale ho preferito separarli concettualmente dai precedenti), occorre però abbandonare la prospettiva della singola rete neurale e considerare come “sistema” l’intera popolazione di reti neurali che evolve attraverso algoritmo genetico.

Causalità circolare. Nel paragrafo precedente abbiamo già accennato a questo concetto, le cui origini sono riconducibili alla cibernetica , con riferimento alla singola rete neurale ecologica. Se osserviamo il nostro lavoro da una prospettiva più ampia, indagando il rapporto che c’è tra il singolo organismo e la popolazione cui appartiene, possiamo però individuare un ulteriore tipo di causalità circolare.
Nel nostro modello, il comportamento dell’organismo, inteso come sequenza di azioni motorie che lo portano a perseguire un certo obiettivo, viene valutato dall’algoritmo genetico, che attribuisce alla sua performance una valutazione quantitativa. Se la valutazione ottenuta dal singolo organismo risulta essere relativamente migliore rispetto a quelle fatte registrare dai suoi conspecifici, l’architettura neurale si riproduce, diffondendosi nella generazione successiva. In caso contrario, l’architettura incriminata scompare dalla popolazione. L’agire dell’organismo su di una certa scala temporale, quella della sua vita, ha dunque ripercussioni che si manifestano su intervalli temporali più lunghi, ovvero quelli dell’evoluzione genetico/biologica della sua specie. Un organismo con un particolare “modo di comportarsi”, che nel momento in cui vive risulta essere il più “adatto” all’ambiente, condiziona il futuro evolversi della specie cui appartiene. Il singolo organismo influenza la traiettoria evolutiva della sua intera specie. Ma, alle generazioni successive, sono proprio queste nuove proprietà della specie ad influenzare lo schema comportamentale degli organismi. La relazione causale non è dunque lineare, ma circolare.
Discorso analogo potrebbe essere fatto anche se, in aggiunta all’algoritmo genetico, l’evoluzione comportamentale degli organismi procedesse anche con il ricorso ad algoritmi di apprendimento per rinforzo. A mutare sarebbe soltanto la scala temporale di riferimento, con l’aggiunta di un ulteriore livello di complessità. In quel caso, infatti, i singoli individui, nel corso della loro vita, in una prima fase imparerebbero dai loro “maestri”, per poi comportarsi nel modo appreso con l’aggiunta di qualche più o meno significativa differenza rispetto allo schema appreso. Le performance dei singoli organismi, mediate dal ruolo dei maestri durante la fase di apprendimento, determinerebbero la convergenza genetica della popolazione verso un certo schema comportamentale, il quale, una volta affermatosi, influenzerebbe il comportamento dei singoli.

Resilience. Una rete neurale, una volta “evoluta ”, risulta essere estremamente sensibile ad eventuali modifiche, anche leggere, dei pesi sinaptici che la caratterizzano. In generale, questa sensibilità alle perturbazioni diviene tanto più marcata quanto più la rete si “specializza” nell’esecuzione del/dei task cui è dedicata. Le perturbazioni, d’altro canto, sono il meccanismo fondamentale su cui si basano gli algoritmi evolutivi. E’ soltanto attraverso modifiche, casuali o “direzionate” che siano, dell’architettura globale o dei singoli pesi sinaptici, che si manifestano i progressivi miglioramenti di performance delle reti neurali. Il risultato concreto, però, è che il singolo organismo risulta essere estremamente fragile: il suo comportamento, anche e soprattutto se molto efficiente, può diventare del tutto inefficiente da un momento all’altro, in seguito ad un cambiamento anche apparentemente irrilevante del suo sotto-sistema neurale Ma così non è per l’intera popolazione, per il sistema nel suo complesso. L’evoluzione biologica, infatti, non ha luogo tanto su scala individuale, quanto piuttosto al livello dell’intera popolazione. Così, se nel passaggio da una generazione all’altra alcuni schemi comportamentali possono scomparire, altri, prima più inefficienti, possono perfezionarsi, prendendo il loro posto. In questo modo, comportamenti efficienti non scompaiono dalla popolazione. Il sistema, in altri termini, è robusto.

Share

Ancora sulla storia del cognitivismo

(continua da un post precedente)

Gli scienziati però non si rassegnarono. La sfida di capire in che modo funzionasse la mente umana rimaneva aperta. Nel mentre, i progressi ottenuti nel campo della neurobiologia e dei settori ad essa collegati fornirono l’ispirazione necessaria per la creazione di un nuovo modello computazionale, che negli anni successivi avrebbe riscosso un grandissimo successo: le reti neurali. I primi modelli di questo tipo, in realtà, nacquero già negli anni ’40, grazie ai lavori pionieristici di McCulloch e Pitts, che concettualizzarono il “neurone artificiale”, per poi rafforzarsi negli anni ’50 con il “percettrone” di Rosenblatt. Le precise critiche avanzate da Minsky e Papert nel 1969 provocarono però un brusco raffreddarsi degli entusiasmi sorti attorno al campo delle neural networks, che si riaccesero soltanto negli anni ’80, grazie ai lavori di Rumelhart ed Hopfield.

Le reti neurali fornivano un nuovo modo di guardare all’interno delle scatole nere dei modelli comportamentisti, alternativo rispetto al rigido schema algoritmico sponsorizzato dagli esperti dell’artificial intelligence. Il meccanismo di base rimaneva quello dello stimolo→elaborazione→risposta, con la differenza che, in una neural network, ad essere manipolati non sono dei simboli ma bensì delle “rappresentazioni” ancor più astratte . Ai fini pratici, soprattutto se consideriamo che anche una rete neurale, per poter essere implementata all’interno di un calcolatore, deve essere ricondotta ad un algoritmo, la differenza potrebbe apparire insignificante. Ma così non è. Una rete neurale è infatti formata da un certo numero di neuroni, connessi tra loro secondo una particolare topologia, ciascuno dei quali caratterizzato da un particolare livello di attivazione che nei sistemi nervosi reali corrisponde alla frequenza con cui questo neurone si attiva, “sparando” impulsi ai neuroni vicini. Al variare dell’input sensoriale percepito in un dato momento, i vari strati di neuroni che compongono la rete si attivano in maniera differente. Le cosiddette “rappresentazioni” sono dunque stati di attivazione delle varie unità neurali, caratterizzati anche da una certa dimensione spaziale. Esattamente come le “attivazioni” che si hanno nel cervello quando un organismo è sottoposto a determinati stimoli. Diventa chiaro, a questo punto, come le reti neurali, pur con tutte le loro limitazioni, possano vantare un livello di plausibilità biologica di almeno un ordine di grandezza superiore rispetto a quello dei modelli cognitivisti dell’intelligenza artificiale. Sebbene alcuni studiosi, come ad esempio Harnad , abbiano sostenuto che l’approccio neural network based possa essere visto come complementare, piuttosto che alternativo, a quello simbolico, le reti neurali ed il concetto di “rappresentazione distribuita” segnarono un profondo punto di rottura rispetto alla tradizione corrente.

Il modo di studiare i processi cognitivi basandosi su reti neurali divenne in seguito noto come “approccio connessionista”. A differenza delle scienze cognitive “tradizionali”, nei confronti delle quali l’intelligenza artificiale potrebbe essere vista soltanto come un relativamente poco utile corollario applicativo, il nuovo cognitivismo connessionista non può prescindere dall’utilizzo del calcolatore. Le reti neurali sono infatti strumenti che, per quanto deterministici, hanno un livello di complessità tale da non poter, di fatto, essere simulati al di fuori di un computer. I ricercatori del settore iniziarono dunque a familiarizzare con uno strumento relativamente nuovo: le simulazioni. Ciò aveva forti implicazioni per un settore, quello della psicologia, storicamente poco propenso a formulare le proprie teorie in maniera rigorosa. Il computer, da questo punto di vista, non perdona. Tra le altre cose, elaborare una simulazione significa infatti, per il ricercatore, eliminare qualsiasi possibile fonte di ambiguità dai suoi modelli teorici di riferimento. E’ questo l’unico modo possibile per poterli far “girare” con successo all’interno di un calcolatore.

Da quanto abbiamo appena sottolineato, potrebbe sembrare che l’avvento del connessionismo abbia semplicemente coinciso con un aggiornamento dei metodi computazionali precedentemente utilizzati (basati su un rigido formalismo logico) con altri, le reti neurali, biologicamente più plausibili. In realtà, il salto è stato più radicale. A mutare è stato anche l’approccio alla creazione di artefatti in grado di esibire comportamenti di carattere cognitivo. Se l’intelligenza artificiale è solita seguire metodologie di progettazione di tipo top-down, studiando le manifestazioni del fenomeno che si intende riprodurre e quindi scomponendole in una sequenza di sotto-processi implementabili in un computer o in un robot, i connessionisti fanno invece affidamento su un approccio di tipo bottom-up. Sia per esigenze pratiche (una rete neurale, d’altronde, non è “programmabile” secondo le modalità tradizionali), sia per aggiungere un’ulteriore dose di “realismo” ai propri modelli. Non è infatti un azzardo (a patto di non parlarne con le sempreverdi lobbies creazioniste ) ipotizzare che la “mente”, così come gli altri prodotti dell’evoluzione, sia emersa dalla progressiva complessificazione del sistema nervoso dell’homo sapien avvenuta nel corso dei millenni. Con le reti neurali, così come dimostrato in maniera esemplare da Elmann , è possibile riprodurre questo processo di crescita e di continua complicazione dell’architettura neurale, facendo emergere fenomeni cognitivi via via più complessi.

L’approccio connessionista si basa sull’assunto secondo il quale l’intelligenza è un processo astratto e può pertanto essere studiata “in isolamento”, senza dover necessariamente prendere in considerazione le caratteristiche fisiche dei sistemi naturali all’interno dei quali i fenomeni cognitivi hanno luogo. Diffuso ancora oggi, il connessionismo ha prodotto (e continua a produrre) risultati estremamente interessanti nella direzione di ricreare artificialmente processi mentali di alto livello. Come sempre accade quando si tratta di scienza, però, anche questa particolare visione, ad un certo punto, iniziò ad andare troppo stretta ad alcuni ricercatori. Nacque così la cosiddetta “embodied cognitive science”, un nuovo modo di approcciarsi allo studio della mente cercando di ancorarla alla sua dimensione fisica.

Share

Un po’ di storia del cognitivismo e dell’intelligenza artificiale

L’embodied cognitive science ha recentemente sfidato il punto di vista del “connessionismo tradizionale”, al punto che ad essa si fa talvolta riferimento con il termine di “neoconnessionismo”. Ma andiamo con ordine, cercando di ricostruire, almeno in linea di massima, il percorso storico più recente del pensiero scientifico relativo alla mente. Innanzitutto, l’approccio connessionista si è sviluppato a partire dalla seconda metà degli anni ’80, in risposta alle “frustrazioni” derivanti da decenni di cognitivismo “tradizionale”, incapaci di apportare significativi miglioramenti al nostro livello di comprensione della mente. Secondo la prospettiva cognitivista, il cervello è un elaboratore formale di simboli, alla stregua di un computer. Non a caso, infatti, questa corrente di pensiero ha iniziato a svilupparsi contestualmente alla comparsa dei primi calcolatori elettronici, ispiratori delle metafore “uomo uguale macchina” e “mente uguale software”. Secondo i cognitivisti, tutti i processi mentali possono essere descritti in termini di computazione di rappresentazioni simboliche, così come statuito dalla celebre “teoria rappresentazionale della mente” (RTM, Representational Theory of Mind). In altre parole, l’attività mentale equivale all’esecuzione di un algoritmo. Di conseguenza, se ciò che fa il cervello non è altro che elaborare simboli, diventa chiaro come sia di cruciale importanza, nel cognitivismo, il ruolo delle rappresentazioni simboliche.

A partire dalla metà degli anni ’50 del secolo scorso, ai cognitivisti si affiancarono i ricercatori di una neonata disciplina: l’intelligenza artificiale. Già nel 1936, Alan Turing aveva teorizzato la cosiddetta “macchina di Turing”: una struttura astratta, in grado di computare, agendo a livello di simboli, qualunque tipo di funzione matematica. La successiva elaborazione operata da John Von Neumann, che dalla teoria di Turing riuscì a ricavare un’architettura fisicamente implementabile, spianò la strada alla progettazione dei calcolatori elettronici così come noi li conosciamo oggi. La nascita dell’informatica, come abbiamo detto, fornì agli scienziati della mente l’ispirazione necessaria per abbandonare l’approccio “a black box” tipico dei comportamentisti e cercare di sostituire le tante scatole nere inserite nei vari modelli dell’epoca con un qualcosa di più dettagliato e preciso. Coloro che operarono in questa direzione vennero definiti psicologi cognitivisti. Ma con i computer, oltre che capire la mente, se questa non era altro che un vasto e complesso insieme di algoritmi dedicati alla manipolazione di simboli, diventava possibile anche cercare di ricrearla artificialmente. Ovviamente, all’interno di un computer. Nacque così il campo dell’intelligenza artificiale, con un approccio di tipo top-down alla ri-creazione dei processi mentali che ancor oggi caratterizza tale disciplina: un processo cognitivo di alto livello viene scomposto in sotto-processi più semplici, implementabili all’interno di un calcolatore e che nel loro insieme danno origine al processo di alto livello da ricreare/riprodurre. Psicologi cognitivisti e softwaristi specializzati in intelligenza artificiale iniziarono a lavorare a braccetto. Gli uni cercavano di ricondurre il modo di funzionare della mente a precisi modelli algoritmico-simbolici, mentre gli altri si dedicavano alla loro implementazione all’interno di calcolatori o di artefatti robotici.

I risultati ottenuti da questa insolita cooperazione tra psicologi ed informatici furono, per l’epoca, stupefacenti. Attorno al campo dell’intelligenza artificiale si destò un interesse senza precedenti. I successi ottenuti nei campi più disparati, dal gioco degli scacchi (è passato alla storia lo scontro tra il campione russo Gary Kasparov ed il “mostruoso” computer della IBM, Deep Blue) al riconoscimento/sintetizzazione vocale, passando per gli expert systems, fecero pensare che la creazione di moderni golem fosse ormai solo una questione di tempo. Ma, poco per volta, divenne sempre più chiaro che i risultati ottenuti erano sì interessanti, ma non rispecchiavano il vero modo di funzionare del cervello. Deep Blue ebbe la meglio su Kasparov non perché fosse in grado di ragionare come lui, ma piuttosto perché i suoi circuiti elettronici erano in grado di valutare nel giro di pochi secondi migliaia di potenziali combinazioni di mosse, prima di decidere la migliore. Nella sfida decisiva, il campione russo, sottoposto ad una tremenda pressione psicologica, abbandonò la partita, riconoscendo de facto la “superiorità” del computer nell’esecuzione di questo specifico compito. Che però non è generalizzabile, dato che la mente umana, molto semplicemente, non lavora manipolando simboli. Considerazione che diventa evidente se guardiamo ad esempio al modo in cui un artefatto tecnologico odierno può percepire il parlato: in puri termini di caratteristiche del segnale sonoro, senza riuscire a procedere ad alcun tipo di significazione. Un computer può discriminare tra parole diverse, questo è vero. Ma lo fa in un modo radicalmente diverso rispetto ad un essere umano, focalizzandosi sulle caratteristiche auditive delle parole pronunciate e non su ciò che esse significano. L’esempio del linguaggio è illuminante in merito ai limiti dell’approccio cognitivista allo studio della mente. Quando questa consapevolezza si diffuse, gli investimenti nel settore dell’artificial intelligence subirono un pesante quanto eccessivo tracollo. Venne il periodo della disillusione e del disincanto.

Share

« Pagina precedentePagina successiva »