La conoscenza è un «nuovo» che scaturisce dall’evidenza delle «cose» e dall’accorgersi della realtà, in quanto possibilità reale che la ragione si metta alla prova: ogni forma di conoscenza, in particolare la conoscenza scientifica.
Per capire come facciamo scienza dobbiamo esplorare come conosciamo il mondo e come stabiliamo che la conoscenza acquisita è fedele allo stato di fatto (dall’epistemologia all’ontologia).
Se e perché, non siamo computer o robot, manipolatori di simboli secondo istruzioni pre-stabilite. Se abbiamo una volontà libera.
Se le nostre rappresentazioni mentali riflettono il mondo o inventano un mondo.
Su queste problematiche si snoda la riflessione dell’autore che propone in modo essenziale i risultati della sua attività di ricerca.
I due momenti della cognizione sono «apprensione» e «giudizio». Il primo ha durata variabile (0,5-3 secondi) e rappresenta un presente atemporale, esso è allungato dalle emozioni, fino a raggiungere i 150 secondi nella meditazione. Il secondo implica la coscienza di sé per istituire un confronto tra le varie apprensioni. Il fatto che il giudizio non sia relativo al proprio stato mentale, ma oggettivabile, riporta in vigore l’ontologia come propria dell’agenda scientifica.
Semiosi
I processi di semiosi distinguono il vivente dal non vivente. Il non vivente obbedisce alle leggi della dinamica e ha traiettoria unica determinata dai campi di forze in cui è immerso e dalla sua condizione iniziale. Invece il vivente riconosce i segni dell’ambiente e reagisce di conseguenza modificando l’ambiente stesso.
In animali dotati di cervello, gli stimoli esterni sono combinati con memorie pregresse, interpretati, portando a decisioni motorie che richiedono un tempo da una frazione di secondo a qualche secondo: è quella che chiamiamo «apprensione». Essa richiede il reclutamento collettivo di folle di neuroni. Una singola apprensione è una unità pre-semantica, entro cui canali sensori, per esempio uditivo e visivo, che hanno tempi di risposta differenti si sincronizzano mutuamente.
Nel caso umano la disponibilità del linguaggio permette di richiamare e confrontare unità pre-semantiche separate, formulando «giudizi». Il passaggio da apprensione a giudizio richiede il passaggio da una semplice consapevolezza di sé alla «coscienza» di un sé giudice che confronta le diverse unità della catena semantica.
L’apprensione
I segnali esterni (visivi, uditivi eccetera) vengono codificati come impulsi elettrici che i neuroni si trasmettono uno con l’altro, entrando in comunicazione. I segnali dei neuroni sono treni di impulsi stereotipati (ampiezza sui 100 millivolt, durata attorno a 1 millisecondo). L’informazione è codificata come intervallo temporale fra un impulso e il successivo.
Riferendoci al sistema visivo, ogni neurone ha una codifica diversa, a seconda del segnale che ha catturato nel proprio campo recettivo. Però in presenza di un oggetto definito, i neuroni di campi recettivi diversi si «accordano» a trasmettere tutti lo stesso segnale, cioè hanno sincronizzato i loro impulsi. Questa sincronizzazione, detta feature binding, era stata già ipotizzata dai teorici della Gestalt nei primi decenni del Novecento; stati di sincronizzazione sono poi stati osservati in animali di laboratorio.
Secondo Baars e Dehaene-Changeux, una specie di centrale di raccolta, detta GWS (Global Work Space), si attiva quando i segnali in arrivo superano una soglia critica e di conseguenza la GWS trasmette una decisione ai centri motori: è avvenuto un riconoscimento.
Questa ipotesi è rappresentata nella Figura (1).
Figura (1): Lo stimolo esterno (bottom up) è modificato da ipotesi interpretative (top down) e diviene una percezione coerente che, elaborata dal GWS, stimola una decisione motoria.
Attenzione però: la cognizione non è un automatismo stimolo-risposta, come riteneva il comportamentismo ingenuo. Lo stimolo (bottom up) si combina con risorse interne che danno una interpretazione top down, come mostrato nella figura precedente. Il GWS decide dunque sulla base del segnale interpretato.
Qual è la ragione dinamica dell’interpretazione?
In genere il singolo neurone non è un ricevitore passivo che risponde a una eccitazione; piuttosto, si impegna in una dinamica che presenta caos deterministico, cioè una dipendenza sensibile dalla condizione iniziale con conseguente perdita dell’informazione iniziale nel corso del tempo. Per ritardare questa perdita, occorre riformulare il problema dinamico aggiungendo variabili di controllo. Questa aggiunta è fatta top down, ricorrendo alle risorse interne. Ogni cognizione è dunque una interpretazione, non una registrazione passiva.
E qui si passa dal determinismo a una scelta libera, compatibile con le regole dinamiche; infatti, avendo aggiunto ulteriori variabili, si è cambiato il tipo di dinamica, fuoriuscendo dalla logica causa-effetto all’interno di una dinamica pre-fissata, che regola il modo di procedere di una macchina.
La variazione di codice è la base della traduzione di un testo; infatti, tradurre Omero non vuol dire automaticamente passare da una parola del greco antico (che aveva un lessico limitato a poche migliaia di vocaboli) a una della lingua moderna (che ha un lessico di centinaia di migliaia di vocaboli). Ne sortirebbero delle ambiguità.
Il traduttore umano è un soggetto che conosce entrambe le lingue: vive una situazione nella lingua di partenza e la «narra» nella lingua di arrivo.
Lo stato di sincronizzazione collettiva che «illumina» il GWS è atemporale, rappresenta l’istante presente, come era discusso dal filosofo Henri Bergson.
[Immagine a sinistra: Henri Bergson (1859-1941)]
Dal punto di vista neuronale, anche in assenza di un oggetto esterno si può osservare la sincronizzazione nella banda gamma reclutando risorse interne.
La sincronizzazione nella banda gamma, che di solito è limitata a 3 secondi, può arrivare per soli stimoli top down fino a 150 secondi nella meditazione priva di oggetto (esperimento su monaci tibetani di A. Lutz et al, pubblicato sui Proceedings della NAS (National Academy of Sciences – US) vol 101, pp.16369 e seg. – 2009).
Ne estraiamo una considerazione sul tempo soggettivo: esso non ha nulla a che vedere con il tempo scandito da un orologio; una forte emozione, indotta da un atto di amore o da uno stato meditativo, può allungare il presente. Tutto ciò era ignoto a Benedetto Croce, quando diceva che il paradiso dei cristiani era noioso perché dopo un po’ si sapeva tutto e ci aspettava una eternità; il Croce ignorava che un amore molto grande blocca il soggetto su un eterno presente!
Abbiamo così formulato un modello di apprensione che non è rigido come un riflesso condizionato, ma può scegliere entro un repertorio di possibili interpretazioni. Questo repertorio è costruito nel corso della vita e aggiornato da incrementi di memoria.
Ciò vale sia per l’uomo sia per gli altri animali.
La differenza fra un animale e l’uomo è che l’ uomo, attraverso il linguaggio, è divenuto capace di fare un uso infinito di risorse finite (si pensi alle creazioni musicali che si appoggiano sulle stesse note). Discuteremo di questo studiando il passaggio da apprensione a giudizio sotto la guida della coscienza.
Il giudizio come confronto semantico: ruolo della coscienza
Sequenze di apprensioni memorizzate e confrontate fanno un discorso. Dunque:
discorso = sequenza di isole pre-semantiche da connettere
(qualunque linguaggio, letterario, musicale, pittorico, fa questo).
Dal confronto emerge un «giudizio di verità».
La distinzione fra apprensione (comune agli animali) e giudizio (esclusivo dell’uomo) è il cuore di Insight (L’intelligenza), un’opera filosofica di Bernard Lonergan (1904-1984) in cui si armonizza la teoria della conoscenza di Tommaso d’Aquino con la fenomenologia di Edmund Husserl (1859-1938) e Maurice Merleau-Ponty (1908-1961).
Svilupperemo una base dinamica del giudizio, e in tal modo ci allacceremo agli approcci filosofici sulla cognizione.
Nel confrontare brani di memoria, non possiamo ricorrere a modelli dinamici di tipo newtoniano, in cui un fatto d emerge come funzione determinata F di una ipotesi h, cioè
d = F(h)
In presenza di molti oggetti, dobbiamo sostituire la dinamica newtoniana con un ragionamento probabilistico; facciamo ciò con la «formula di Bayes», introdotta nel 1763 come procedura alternativa alla mera soluzione di una equazione newtoniana.
Essa consiste nella seguente sequenza:
-
A partire da una situazione iniziale, come andare avanti? Formuliamo una rosa di ipotesi h, a ciascuna assegniamo una probabilità a-priori;
-
Ogni h, inserita in un modello di evoluzione, genera dati d con probabilità P(d|h) di d condizionata dalla h da cui si parte;
-
Effettuiamo una misura e osserviamo un particolare dato d*;
-
La combinazione di iii. e ii. seleziona una particolare ipotesi h*, che acquista così una probabilità a-posteriori più alta rispetto a i.
In sintesi:
P(h*)= P(h|d) = P(h) • P(d|h) / P(d)
Dunque h* indica fra le nuove situazioni quella più plausibile, che ha cioè una maggior probabilità di accadimento; a partire da questa si ripete un ciclo di Bayes e così via.
É come la scalata di un colle di probabilità (più si sale e più aumenta la probabilità), come illustrato nella Figura che segue. In cima abbiamo la certezza? No; se badiamo alla procedura seguita, abbiamo solo acquisito la massima plausibilità.
La procedura di Bayes ha influenzato tutta la scienza del 1800.
La evoluzione di Darwin è una procedura bayesiana, in cui la «mutazione» è la formulazione di una rosa di ipotesi h; queste sono inserite in un modello di sviluppo che include il ruolo dell’ambiente; l’ambiente, che rappresenta i dati d con cui fare i conti, «seleziona» la variante più plausibile h* cioè quella che meglio si adatta (fitness) ai vincoli ambientali d.
Se pensiamo allo stile investigativo di Sherlock Holmes, esso è bayesiano.
Il modello, o regola procedurale, P(d|h) è l’algoritmo con cui si può istruire un computer, automatizzando così in un expert system il duplice compito di formulare rose di ipotesi e confrontarle con i dati.
Figura (2): Costruzione di ipotesi scientifiche vieppiù adeguate agli esperimenti, per applicazione successiva del teorema di Bayes.
La procedura è una scalata del monte della probabilità. Le stellette indicano il progresso. A ogni punto sulla curva che porta al picco corrisponde un valore di probabilità.
Si noti che la strategia darwiniana è una implementazione di Bayes.
Complessità e creatività. Bayes inverso
Bayes si basa su un modello prefissato (punto ii) della procedura su delineata, rappresentato dalla linea spessa nell’immagine precedente, su cui si collocano le stellette che rappresentano i «dati».
Invece, in un sistema complesso, partendo da un certo numero di variabili, c’è in genere un numero alto di possibili modelli evolutivi.
Chiamo creatività il salto (non-algoritmico, quindi inaccessibile a un computer) da un modello a un altro (nella Figura (3): linee orizzontali tratteggiate che fanno passare da un monte, cioè da una scalata con modello fisso, a un altro monte).
La formulazione di un giudizio corrisponde a un uso non-standard di Bayes. La collezioni dei diversi brani di discorso (versi di un poema, frasi di un romanzo, misure di una melodia, regioni pittoriche di un dipinto che stiamo esplorando) sottoposti alla nostra coscienza contengono già sia i dati d sia le h* che l’uso standard di Bayes ci avrebbe dovuto far ricostruire con l’ausilio del modello.
Possedendo già le sequenze d e h*, possiamo invertire la procedura di Bayes e servirci di quanto già acquisito per identificare il modello più appropriato che interpreta i fatti a partire da certe ipotesi:
P(d|h) = P(d) P(h*)/P(h)
Questo P(d|h) è il giudizio di verità che noi formuliamo sulla adeguatezza fra le nostre aspettative (h trasformate in h* dal fluire del discorso) e i dati d (i contenuti di realtà che ci vengono offerti).
La presenza del salto non-algoritmico implica «libera scelta», l’ermeneutica di un testo non è deterministica. L’ermeneutica di una situazione non vincola a scelta obbligata, donde il libero arbitrio.
Ci si domanda se un giorno questa procedura di scelta può essere trasferita a una macchina di calcolo, che di conseguenza acquisterebbe coscienza. Da alcuni decenni sono disponibili gli «algoritmi genetici» introdotti da John Holland (Adaptation in natural and artificial systems, MIT Press, 1992). A ogni passo di calcolo, si introducono piccole variazioni nell’algoritmo; i programmi di calcolo corrispondenti entrano in competizione come popolazioni biologiche e vince quello che meglio si adatta.
Il punto cruciale è che per fare variazioni non patologiche, occorre che l’algoritmo di partenza abbia una stabilità intrinseca in modo che le variazioni siano nel suo intorno. Riferendoci a Figura 3 è come se introducessimo piccole perturbazioni attorno alla linea in salita chiamata Bayes senza semiosi. Invece i salti orizzontali che ci portano molto lontano dalla situazione iniziale (linee tratteggiate orizzontali chiamate creatività) non sono eseguibili con una procedura variazionale accessibile a un computer.
Figura (3): Complessità semantica – Spazio delle probabilità con più massimi.
L‘ascesa verso un picco può essere automatizzata in un computer. Il prendere atto che esistono altri monti, e si può ricominciare la scalata altrove, è un atto di creatività, corrispondente a una comprensione dei segni del mondo (semiosi) guidata da tutto il retroterra dello scienziato: operazione non delegabile a un computer.
Chiameremo significato il fatto che esistano più picchi; esso va oltre l’informazione.
Possiamo identificare la complessità semantica con il numero di picchi, cioè di strategie di Bayes distinte che possiamo intraprendere.
Creatività e formulazione delle descrizioni scientifiche
Nella scienza dei computer la complessità C di un problema è definita come la lunghezza in bit della più corta istruzione che permette di risolvere il problema.
D’altronde, se il problema dinamico è affetto da caos deterministico, l’informazione contenuta nelle condizioni iniziali si perde al passare del tempo e occorre rimpiazzarla con ulteriore informazione: si pensi per esempio all’aggiornamento quotidiano dei dati meteorologici per riuscire a prevedere la situazione climatica. Denotiamo con K, in onore del matematico russo Andrej N. Kolmogorov (1903-1987), la velocità di perdita dell’informazione. Un sistema regolare come il moto Terra-Sole avrà K = 0; un sistema imprevedibile perché in continua agitazione, come un gas di molecole a una certa temperatura, avrà un K altissimo, che tende all’infinito; i sistemi caotici avranno un K positivo, il cui valore è inversamente proporzionale al grado di prevedibilità, cioè cresce all’aumentare del caos.
Da questo consegue che, per un computer che opera con un certo algoritmo, C cresce linearmente con K, come mostrato nell’immagine seguente.
Figura (4): Diagramma C-K: confronto fra i modi di procedere di un computer e di un essere umano
- Entro un unico codice, la complessità C cresce linearmente con la velocità K di perdita caotica dell’informazione. Invece lo scienziato è opportunista, e cerca il codice migliore per ridurre C. Ipotizzando nuove variabili, si introduce una teoria efficace che trascura le variabili veloci e descrive solo le variabili lente.
- Tentativo di organizzare l’insieme degli oggetti della scienza nel diagramma C-K; il gas di Boltzmann è privo di dettagli significativi e lo riassumiamo in pochi parametri termodinamici, quindi basso C anche se K è altissimo; invece – per quanto ne sappiamo oggi – il cervello umano ci appare come l’oggetto più complesso dell’Universo.
Nei decenni passati, quando era in voga la cosiddetta Intelligenza artificiale forte, si credeva che l’intelligenza umana vista come capacità di soluzione dei problemi sarebbe stata un giorno rimpiazzabile da un super-computer. Al riguardo Herbert A. Simon (1916-2001) sviluppò un programma di calcolo, che chiamò BACON. Questo programma, alimentato con i dati astronomici noti all’inizio del Seicento, finiva con lo stabilire le leggi di Keplero e di conseguenza poteva arrivare al modello di Newton.
Il risultato di per sé era modesto, in quanto si affrontava un problema con C = K = 0.
Appena si sale con C e K, l’istruzione diventa così lunga da essere inutile (pensate di dover fare girare un computer per 48 ore per prevedere il clima di domani).
A differenza del computer, che è vincolato a una procedura, l’uomo può fare salti non-algoritmici, cioè variare il codice descrittivo del problema, così come abbiamo detto per la traduzione letteraria.
In tal modo, guidato dai segni che gli vengono dal mondo, egli può effettuare una variazione di codice che lo porta a una teoria scientifica che, pur spiegando tutti i dati osservativi, sia a più bassi C e K (si veda la Figura (4)).
Nella parte b. si presenta un tentativo di classificazione delle differenti descrizioni scientifiche che si adottano a seconda dei dati osservativi da spiegare. Come si vede, la fisica non procede attraverso una «teoria del tutto», cioè con variabili fondamentali legate da equazioni universali da cui dedurre qualunque fenomeno, ma riformula una teoria efficace (il termine fu introdotto dal fisico russo Lev D. Landau (1908-1968)) in corrispondenza a fenomeni specifici, trascurando le variabili non significative e limitandosi a quelle rilevanti, in modo da affrontare problemi in cui C e K siano abbastanza bassi.
L’introduzione di valutazioni legate all’uso che se ne vuol fare richiede una semiosi, cioè una capacità di vedere la dinamica in studio legata all’ambiente in cui si opera. Questa adattabilità va ben oltre il potere di un algoritmo con cui si può istruire un computer.
Fisica e metafisica
La fisica ha elaborato un metodo che permette di dedurre il futuro di un sistema a partire dalla conoscenza delle leggi di forza e dalle condizioni iniziali. Questo metodo è stato ritenuto in grado di spiegare i fenomeni; una volta che siano note tutte le leggi di forza si sarebbe in possesso di una «teoria del tutto».
La fisica, col suo procedere deduttivo, sembra aver escluso le cause finali e ridotto la dinamica a ricerca delle cause efficienti. In base a questo determinismo, detto anche chiusura causale della fisica, i cosiddetti «eliminativisti» hanno escluso qualunque possibilità di volontà libera. Ogni nostro atto è determinato dalle condizioni iniziali dei nostri atomi e molecole e noi saremmo degli automi.
Abbiamo visto che, per effetto della complessità, a pari numero di oggetti interagenti corrisponde un numero altissimo di possibili scenari (si pensi alla Figura (3) con un numero enorme di possibili picchi alternativi). Il risalirne uno corrisponde alla scelta di un algoritmo definito; un salto creativo da un algoritmo a un altro corrisponde a una ri-codifica, cioè a una riformulazione diversa dello stesso problema con gli stessi oggetti. La creatività dunque ci permette di scegliere un modo alternativo di descrivere un gruppo di fenomeni, attenendoci a quello più opportuno, cioè più adeguato a interpretare il flusso di apprensioni coordinate dal linguaggio.
Dunque: risalendo il singolo picco di Bayes si ottiene la «certezza», cioè la massima plausibilità compatibile con un algoritmo fisso; invece saltando in modo adattivo si raggiunge la «verità». Ma i salti adattivi, non algoritmici, fuoriescono dalle cause efficienti e reintroducono le cause finali.
Nella formulazione dei giudizi, la ricerca della verità, esplorando diverse probabilità condizionate di generare dati a partire da ipotesi, equivale alla ricerca di un finalismo nella sequenza semantica; si converge a una verità in virtù della coscienza che è in grado di confrontare diverse formulazioni e scegliere la più adeguata.
Il limitarsi alle cause efficienti, cioè all’applicazione universale di un singolo algoritmo, rappresenta un limite alla latitudine di un programma scientifico. La critica formale fu fatta da Kurt Gödel nel 1931 con il suo teorema di incompletezza che possiamo illustrare con riferimento alla Figura (3). Se la stelletta più in basso a destra rappresenta un corpo di assiomi e la linea in salita un formalismo deduttivo, raggiungere la cima di un colle vuol dire aver enunciato tutti i teoremi dimostrabili, cioè derivabili algoritmicamente dagli assiomi. Invece un matematico creativo «vede» altri enunciati, compatibili con gli assiomi, ma non dimostrabili dall’algoritmo prescelto.
Questo teorema di Gödel rappresenta una critica meta-matematica alla completezza di qualunque teoria formale.
C’è un equivalente in natura di questa procedura creativa?
La risposta positiva a questa domanda è stato il grande contributo filosofico di Charles R- Darwin (1809-1882). Torniamo alla Figura (3).
L’arrampicarsi su un monte (linea solida) visualizza l’evoluzione «entro una specie», nell’ambito di una procedura standard; ma arrivati in cima, qualunque ulteriore passo è una ricaduta verso il basso, cioè una riduzione di probabilità. Forse è questo che ha segnato l’estinzione massiccia di certe specie (per esempio, i dinosauri) senza bisogno di invocare quel deus ex machina che è il grosso meteorite. Invece, un salto «al di fuori della specie», fuori dalla procedura algoritmica, (linea tratteggiata orizzontale) ha permesso di sperimentare altre linee procedurali (gli uccelli e i mammiferi che rimpiazzano i dinosauri).
Stiamo applicando alla evoluzione biologica quella creatività che abbiamo già attribuito al soggetto umano che formula un giudizio. In effetti, la storia della vita è ricca di creatività, cioè di scelte adattive nuove che violano procedure già stabilite. Non è vero, come propugnato da Richard Dawkins (1941-…) e altri biologi, che ogni salto fuori dall’algoritmo finora seguito sia come lanciare un numero alla roulette. Non vale un argomento strettamente probabilistico, come quello racchiuso nella metafora dell’«orologiaio cieco». In un paesaggio complesso le varie scelte hanno un differente peso adattivo, in quanto innescano procedure diverse. Pertanto emergerà alla lunga una scelta vincente. Dunque, con buona pace delle letture riduttivistiche fatte dai seguaci entusiasti, già in Darwin è incorporato un solido argomento finalistico, e non una catena casuale di cause efficienti, cioè dei salti a caso da una procedura a un’altra.
Possiamo vedere la nascita della coscienza personale e del giudizio nell’uomo come una creatività naturale ottimizzata dal confronto immediato fra i vari brani del discorso, che permette il giudizio di verità?
Questo va bene, e spiega il nostro ruolo, visto che a livello dell’apprensione (entro l’isola pre-semantica) siamo dei mediocri operatori, battuti in acutezza per esempio da aquile (visione), cani (odorato) e linci (udito).
Come mostrato prima nella Figura (3), mentre una macchina di calcolo procede secondo un preciso algoritmo (o delle varianti elaborate secondo un protocollo prestabilito, come nel caso degli «algoritmi genetici» di John H. Holland (1929-….)) il ricercatore umano può esplorare regioni apparentemente disconnesse con la situazione di partenza: è quello che abbiamo chiamato «creatività».
Ma perché questi salti non degenerino in capriccio, occorre che sia attivo un giudice in grado di mettere a confronto situazioni diverse e scartare quelle non significative. È la presenza a se stesso di questo giudice che consideriamo come il nucleo della «coscienza».
In conclusione, la fisica, a partire da Galileo e Newton, aveva sostituito le «cose» con gli «oggetti», cioè con collezioni di misure, come nel codice a barre di un negozio.
Invece il Bayes inverso re-introduce la «cosa», come una realtà solo in parte catturata dal punto di vista h in cui ci si è collocati: è questo il senso di P(d|h).
Fortunato Tito Arecchi
(Professore Emerito di Fisica presso l’Università degli Studi di Firenze)
Indicazioni Bibliografiche
Molti lavori sono stati già citati nel corso dell’esposizione.
-
La sincronizzazione collettiva dei neuroni come accesso al GWS si trova in lavori del mio gruppo, a partire da Phys. Rev. Letters, 86, 791(2001) fino a Chaos 19, 015104 (2009).
-
L’uso del teorema di Bayes e la sua visualizzazione in situazioni semplici e complesse rispettivamente sono stati da me discussi a partire dal 2007 (Eur. Phys. J. Special Topics, 146, 205).
-
Una sintesi di questi argomenti si può trovare nel mio libro: F.T. Arecchi, Coerenza, Complessità e Creatività , S. Di Renzo, Roma 2007.
-
L’analisi delle procedure linguistiche con l’introduzione del Bayes inverso è stata da me fatta in: Dynamics of consciousness: complexity and creativity, the Journal of Psychophysiology, 2010.
Il testo di questo articolo riprende la relazione svolta dall’autore nel luglio 2010 alla Summer School dell’Associazione Culturale “Il Rischio Educativo” e pubblicata in La conoscenza conta, Annuario 2009/2010, n. 4, Milano 2011.
© Pubblicato sul n° 44 di Emmeciquadro