Free Book: I cookie: cosa sono e come funzionano

I cookie: cosa sono e come funzionano ALTRI capitoli

I cookie
La funzione dei cookie è tenere traccia del passaggio di un utente

I cookie di terze parti
Una pioggia di cookie che si abbatte su ignari utenti web

Come vedere i cookie
Catturare i cookie con tcpdump

Oltre i cookie
I cookie, ormai, sono stati soppiantati da altre tecnologie

I cookie di Flash
Non hanno scadenza e non possono essere eliminati dal browser

Che fare?
Ci si può difendere da tutti questi attacchi alla nostra privacy?

Testi di riferimento

I cookie

Il protocollo HTTP non offre alcun meccanismo che permetta, ad un server, di identificare un utente, nel corso di più connessioni, o richieste, successive. Quindi, se un utente si connette ad un server e gli invia cinque richieste distinte, per cinque pagine web differenti oppure per una stessa pagina web, aggiornata cinque volte consecutive, il server accetterà queste cinque richieste come se provenissero da cinque computer differenti. Questo accade perchè HTTP è un protocollo "stateless", senza stato: o meglio, che non mantiene informazioni di stato. Le informazioni di stato, infatti, richiedono risorse fisiche e tempi molto superiori a quelli richiesti da una serie di connessioni isolate e distinte. In un mondo senza stato, però, sarebbe impossibile permettere ad un utente di accedere ad un negozio online, scegliere, con calma, gli articoli più interessanti, selezionare, per ciascun articolo, la quantità desiderata, per poi passare alla cassa e perfezionare l'acquisto. Per poter fare questo, è necessario trovare un meccanismo che permetta al server di gestire vere e proprie sessioni di lavoro, dove con il termine sessione si intende un insieme di connessioni ( richieste ) HTTP, tutte riconducibili ad un unico soggetto. Sarebbe sufficiente inviare, ad ogni richiesta HTTP inviata dal client, un dato che identifichi la sessione, intesa come una serie di richieste HTTP anonime dietro alle quali si cela sempre lo stesso utente, in modo che il server possa memorizzare sul proprio disco fisso tutti i dati ad essa legati ( quali pagine l'utente ha visitato, quali articoli di un catalogo ha prenotato, etc. ). Esistono, fondamentalmente, tre meccanismi HTTP, in grado di trasportare informazioni di sessione:

QUERY_STRING: è la stringa testuale che può essere aggiunta ad un qualsiasi indirizzo web e che può trasportare qualsiasi informazione aggiuntiva;
```
  http://www.test.it/t.php?SESSION_ID=fertghde88
```

i campi nascosti di un modulo ( form ) HTML ( hidden field );


  <input type="hidden" name="SESSION_ID" value="fertghde88">

i cookie.

I cookie sono header HTTP, utilizzati dal server e dal computer client per trasportare i dati di una sessione. Dal lato client ( il vostro computer ), i dati vengono mantenuti in memoria, per la durata della sessione, per poi essere salvati sul disco fisso, in uno o più file, gestiti dal browser. Dal lato server, invece, i dati vengono immediatamente salvati in un qualche database, per rimanervi, presumibilmente, per sempre.

Il meccanismo dei cookie serve solo al trasporto di dati. I cookie non trasportano virus e non possono danneggiare direttamente il sistema operativo. Un sito web utilizza i cookie per raccogliere informazioni sugli utenti che accedono al sito. Tutti i dati che immettete nei campi di una form ( modulo ), quando eseguite un acquisto, o vi registrate ad un servizio, oppure chiedete, semplicemente, alcune informazioni, verranno accuratamente salvate sul disco fisso del server, in un qualche database, ed andranno a costituire il vostro profilo personale. Il problema che nasce dall'utilizzo dei cookie è: chi raccoglie le mie informazioni personali e a quale scopo? Con lo sviluppo dei cosiddetti social network, il profilo personale creato in un qualche database potrebbe contenere informazioni molto sensibili, quali i nostri numeri telefonici, i numeri telefonici dei nostri amici, gli appuntamenti presi, gli impegni concordati, le vacanze prenotate, etc. Attraverso la raccolta delle nostre informazioni personali, per esempio, è possibile che qualcuno venga a conoscenza del fatto che un'intera famiglia sarà assente da casa dal giorno X al giorno Y, che la casa non è munita di un impianto di allarme, che i gioielli sono custoditi nel terzo cassetto del mobile posto in camera da letto, etc. Tutto questo non è più fantascienza, ma una solida realtà!

Quando un computer client invia una prima richiesta HTTP ad un server, il server, se desidera aprire una sessione con il client, invia una risposta HTTP che contiene un particolare header HTTP, definito nella RFC 2109, del febbraio 1997:


  Set-Cookie

nel quale il server invia un primo dato, solitamente un identificativo ( ID ) di sessione, nella forma NOME/VALORE, che segnala al client l'apertura di una sessione. Per esempio:


HTTP/1.1 200 OK
...
Set-Cookie: ASPSESSIONIDSCQBDDSB=KNGBMBODHCPJEDEOMLAGEDIP; path=/
...

Il computer client, per accettare di aprire una sessione, deve inviare, al server, in tutte le richieste HTTP successive, un header aggiuntivo di sessione:


  Cookie

contenente lo stesso dato identificativo inviato, precedentemente, dal server:


GET /nuova_home.css?v=1 HTTP/1.1
...
Cookie: ASPSESSIONIDSCQBDDSB=KNGBMBODHCPJEDEOMLAGEDIP
...

Nel corso della sessione di lavoro, sarà proprio quel dato identificativo a permettere al server di distinguere le richieste HTTP di un utente dalle richieste HTTP di un altro utente, permettendo, così, al server di memorizzare una serie di informazioni, relative al singolo utente. Se il browser del computer client non invia un header Cookie al server, il server non sarà in grado di memorizzare alcunché, poiché non sarà in grado di distinguere una richiesta HTTP dall'altra. Questo è ciò che accade con i browser che non supportano i cookie, oppure quando un utente disabilita i cookie nel proprio browser. Un cookie inviato dal computer client, all'interno dell'header HTTP Cookie, contiene solo la coppia NOME/VALORE ( IDentificativo ), che il browser ha trovato nel precedente header HTTP Set-Cookie ricevuto dal server. Gli attributi eventualmente ricevuti con l'header del server Set-Cookie non vengono inclusi nell'header Cookie del computer client. Quindi, il server non sarà in grado, dal solo header Cookie, di sapere qual'è la data di scadenza del cookie, per quale computer host quel cookie è valido, per quale percorso ( path ), se, per quel cookie, sono stati impostati gli attributi Secure e HttpOnly. Il server, nelle risposte HTTP successive, può inviare un secondo header:


  Set-Cookie

contenente o le stesse informazioni inviate con la prima risposta, oppure informazioni differenti. Il server può anche decidere di non inviare alcun altro header Set-Cookie. Oppure, il server, al fine di terminare la sessione, può inviare un header Set-Cookie contenente il dato:


  Max-Age=0

oppure una data di scadenza già passata:


  Expires=Sun, 06 Nov 1994 08:49:37 GMT

Un server può inviare un header Set-Cookie ad ogni risposta HTTP inviata al computer client. Un computer client, invece, dovrebbe inviare un header Cookie ad ogni richiesta HTTP inviata al server. Il server può, anche, alterare la portata ( scope ) del cookie, specificando due attributi addizionali: Path e Domain. Per esempio, il server può indicare al browser del computer client ( user agent ) di inviare il cookie ( header HTTP Cookie ) per qualsiasi percorso ( PATH ) e per qualsiasi sottodominio di example.com:


   == Server -> User Agent ==

   Set-Cookie: SID=31d4d96e407aad42; Path=/; Domain=example.com

   == User Agent -> Server ==

   Cookie: SID=31d4d96e407aad42

Come vedremo nel prossimo esempio, il server può inviare, al browser del client ( user agent ), più cookie. Per esempio, il server può memorizzare un identificativo di sessione e la lingua di default per l'utente remoto, inviando due distinti header HTTP Set-Cookie:


   == Server -> User Agent ==

   Set-Cookie: SID=31d4d96e407aad42; Path=/; Secure; HttpOnly
   Set-Cookie: lang=en-US; Path=/; Domain=example.com

   == User Agent -> Server ==

   Cookie: SID=31d4d96e407aad42; lang=en-US

In questo esempio, l'header HTTP Cookie ( quello inviato dal computer Client al server ) contiene due cookie, uno chiamato SID ( Session ID ), l'altro chiamato lang. Da notare, inoltre, che il server invia altri due attributi, Secure e HttpOnly, al fine di implementare una maggiore protezione dei dati. Se il server desidera che il browser del computer client ( user agent ) conservi il cookie anche per le sessioni successive, e non solo per la sessione corrente, può specificare una data di scadenza del cookie, inviando l'attributo Expires:


   == Server -> User Agent ==

   Set-Cookie: lang=en-US; Expires=Wed, 09 Jun 2021 10:18:14 GMT

   == User Agent -> Server ==

   Cookie: SID=31d4d96e407aad42; lang=en-US

Il browser del computer client ( user agent ) potrà, comunque, eliminare il cookie prima della data di scadenza, nel caso in cui avesse terminato lo spazio su disco riservato ai cookie, oppure se ricevesse una richiesta di eliminazione da parte dell'utente. Anche il server può chiedere al computer client di eliminare un cookie, inviando un header HTTP Set-Cookie con una data di scadenza già passata. Attenzione: se il cookie contiene entrambi gli attributi:


  Max-Age
  Expires

quello che prevale, determinando l'effettiva data di scadenza, è il primo ( Max-Age ). Il computer client eliminerà il cookie solo se gli attributi Path e Domain, dell'header Set-Cookie, coincidono con gli attributi Path e Domain originari ( quelli inviati al momento della creazione del cookie ). Informalmente, il response header Set-Cookie comprende il token Set-Cookie, seguito da un cookie ( RFC 6265: HTTP State Management Mechanism ):


  "Set-Cookie:" SPACE set-cookie-string

Ciascun cookie inizia con la coppia NAME=VALUE, seguita da zero o più coppie di attributo/valore, ciascuna separata dall'altra da un punto e virgola:


  NAME "=" VALUE *(";" SPACE cookie-av)

  cookie-av = "Expires" "=" value
            | "Domain" "=" value
            | "Max-Age" "=" value
            | "Path" "=" value
            | "Secure"
            | "httponly"

dove:


  "Expires" "=" value

contiene la data di scadenza del cookie. La data di scadenza deve essere espressa nel formato riportato nella RFC 2616: Hypertext Transfer Protocol -- HTTP/1.1, Sezione 3.3.1:


  wkday "," SPACE date1 SPACE time SPACE "GMT"
  Sun, 06 Nov 1994 08:49:37 GMT

così come definito nella RFC 1123 ( un aggiornamento della RFC 822 ). GMT è un acronimo per Greenwich Mean Time.


  "Domain" "=" value
  Domain=foo.com

contiene il dominio per il quale il cookie è valido, il dominio al quale il browser ( user agent ) dovrà inviare l'header HTTP Cookie, con i valori specificati dal server. Per esempio, avendo:


  Domain = example.com

il browser del client ( user agent ) dovrà includere il cookie nell'header HTTP Cookie, per tutte le richieste HTTP inviate a:


  example.com
  www.example.com
  www.corp.example.com

Qualsiasi punto premesso al nome di dominio ( .domain.com ) verrà ignorato dal browser, mentre qualsiasi punto posposto al nome di dominio ( domain.com. ) costringerà il browser del client ( user agent ) ad ignorare l'intero attributo. Il browser del client ( user agent ), inoltre, respingerà qualsiasi cookie che specificherà una portata ( scope ) che non includa il server di origine. Per esempio, il browser accetterà un cookie dal dominio:


  foo.example.com

quando l'attributo "Domain" avrà il valore:


  Domain = foo.example.com

oppure, il valore:


  Domain = example.com

ma lo respingerà, quando l'attributo "Domain" avrà il valore:


  Domain = bar.example.com

oppure, il valore:


  Domain = baz.foo.example.com

Molti browser sono configurati per respingere i valori dell'attributo "Domain" corrispondenti a suffissi pubblici, quali:


  Domain = com
  Domain = co.uk

Questo, per ovvie ragioni di sicurezza. Se l'attributo "Domain" non fosse indicato, il browser del client ritornerebbe il cookie esclusivamente al server di origine, senza nemmeno includere eventuali sottodomini. L'attributo:


  "Path" "=" value

contiene la directory per la quale il cookie è valido. Il contenuto di un server, dal quale ha origine l'header Set-Cookie, infatti, è distribuito su più aree del filesystem, ciascuna delle quali verrà contattata da gruppi di applicazioni differenti. Solo per alcune di queste aree, probabilmente, sono necessarie le informazioni di stato. Queste aree vengono definite dall'attributo Path. Un browser ( user agent ) dovrà rigettare un cookie ( non memorizzandone, su disco fisso, le informazioni ), se si presenterà almeno una delle seguenti condizioni:

Il valore dell'attributo " Path " non compare nel request-URI. Il request-URI è l'indirizzo della risorsa web richiesta dal computer client e riportata nella cosiddetta Request Line di una richiesta HTTP:
```
  Request-Line = Method SPACE Request-URI SP HTTP-Version CRLF
```
La Request-Line inizia con un token ( stringa ) che identifica il metodo da usare ( GET/POST/HEAD ), seguito dal Request-URI e dal numero di versione del protocollo. Ecco due esempi:
```
  GET http://www.w3.org/pub/WWW/TheProject.html HTTP/1.1
  
  GET /pub/WWW/TheProject.html HTTP/1.1
  Host: www.w3.org
```
In entrambi i casi, il cookie verrà respinto, se conterrà, per esempio:
```
  Path=/sandra
```
Quando "Path" viene omesso dal server, il browser del computer client utilizzerà, come "Path", quello riportato nella Request Line HTTP. Nel nostro esempio:
```
 /pub/WWW
```
Il valore dell'attributo " Domain " non contiene punti interni e non è
```
  .local
```
Per esempio, un header Set-Cookie con:
```
  Domain=com
```
oppure:
```
  Domain=com.
```
verrà sempre respinto, perchè non contiene punti interni.
Il nome di host derivato dalla richiesta HTTP non è contenuto nel Dominio indicato dall'attributo " Domain ". Un computer client deve sempre indicare un header HOST, nelle richieste HTTP/1.1:
```
  GET /pub/WWW/TheProject.html HTTP/1.1
  Host: www.w3.org
```
Per esempio, un header Set-Cookie inviato da un server, invocato da una richiesta HTTP contenente l'header:
```
  Host: x.foo.com
```
e contenente, a sua volta, l'attributo:
```
  Domain=foo.com
```
verrà sempre accettato.
L'host indicato nella richiesta HTTP è un Host Domain Name, o HDN, non un indirizzo IP, ed è scritto nella forma HD, dove la D rappresenta il valore dell'attributo " Domain ", mentre H è una stringa testuale contenente uno o più punti. Per esempio, un header Set-Cookie inviato da un server, invocato da una richiesta HTTP contenente l'header:
```
  Host: y.x.foo.com
```
e contenente, a sua volta, l'attributo:
```
  Domain=foo.com
```
verrà sempre rigettato, poiché H è:
```
  y.x
```
e contiene un punto.
L'attributo Port contiene una lista di porte e la porta contenuta nella richiesta HTTP non compare in quella lista. Quindi, un header Set-Cookie, con:
```
  Port="80,8000"
```
verrà accettato se la richiesta HTTP era stata inviata alla porta 80, oppure alla porta 8000, ma verrà respinto in qualsiasi altro caso.

Tornando agli attributi disponibili per i cookie, abbiamo:


  "Max-Age" "=" value

indica l'intervallo temporale di validità del cookie, espresso in secondi, dopo il quale il computer client dovrà eliminare il cookie. Il valore zero indica: elimina subito. Alcuni browser ( user agent ) non supportano l'attributo Max-Age. Se il cookie contiene sia l'attributo Max-Age, sia l'attributo Expires, il primo ( Max-Age ) ha la precedenza. Se il cookie non contiene ne l'attributo Max-Age, ne l'attributo Expires, il browser del computer client eliminerà il cookie al termine della sessione corrente. L'attributo:


  Secure

non richiede alcun valore, ma indica al browser ( User Agent ) di rispondere al server, utilizzando solo canali di trasmissione sicuri ( solitamente, HTTP over Transport Layer Security, o TLS ). Se assente, il browser potrà utilizzare, per il trasporto, anche canali non protetti. L'attributo:


  HttpOnly

non ha nulla a che vedere con il precedente attributo ( Secure ). I due attributi possono essere attivati entrambi contemporaneamente. L'attributo HttpOnly limita la portata ( scope ) del cookie alle sole richieste HTTP, ecludendo tutte le funzioni ( API ) di accesso diverse da HTTP. Le funzioni ( API ) del browser, per esempio, esporrebbero il cookie a script esterni. Il browser, alla ricezione di un header Set-Cookie, dovrà mantenere le informazioni di stato, relative a ciascuno dei server, separate l'una dall'altra, individuando ciascun server con il suo nome ( dominio ) oppure il suo indirizzo IP ed il numero di porta. Se l'header Set-Cookie, ricevuto dal server, ha lo stesso nome ( NAME ), lo stesso dominio ( Domain ) e lo stesso percorso interno ( Path ) di un cookie ricevuto in precedenza, il nuovo cookie dovrà sostituire quello già esistente. A meno che il nuovo cookie contenga l'attributo:


  Max-Age = 0

nel qual caso, il browser dovrà eliminare sia il vecchio che il nuovo cookie. In tutti gli altri casi, i cookie verranno accumulati e conservati fino alla loro naturale scadenza, per poi essere distrutti. Un server può creare un header HTTP Set-Cookie per raccogliere informazioni quali l'elenco delle risorse del server richieste dal singolo utente. Oltre agli attributi appena discussi, è bene ricordare che "i cookie possono memorizzare un'ampia gamma di informazioni inclusi i dati identificativi dell'utente. Per dati identificativi si intendono quei dati che possono essere utilizzati per identificare o contattare l'utente, come il nome, l'indirizzo e-mail, l'indirizzo di casa o dell'ufficio o il numero di telefono. In ogni caso qualsiasi sito ha accesso solo alle informazioni personali che vengono esplicitamente fornite dall'utente, attraverso la compilazione di un modulo web ( form ), per esempio. Quindi, un sito web non può ottenere l'indirizzo e-mail del visitatore a meno che non venga fornito direttamente dall'utente e non può avere accesso agli altri dati presenti sul computer" ( Gestione dei cookie, Mozilla Support ). Le informazioni di sessione, contenute nei cookie ed inviate sia dal server che dal client, sono in clear text ( testo immediatamente leggibile ). Quindi, qualsiasi informazione sensibile, trasmessa negli header Set-Cookie e Cookie è esposta a chiunque intercetti la comunicazione, che potrebbe, addirittura, alterarne il contenuto. Tutto questo implica che per la trasmissione di informazioni personali o finanziarie dovrebbero essere utilizzati solo canali di trasmissione sicuri. Inoltre, se le informazioni inviate fossero molte, la loro gestione, da parte del client, soprattutto, diverrebbe molto onerosa, in termini di risorse. Questo è il motivo per il quale, solitamente, il server invia un solo dato identificativo ( nonce o "session identifier" ), come negli esempi visti in precedenza. Grazie al dato identificativo, il server sarà in grado di estrarre le informazioni di stato necessarie, direttamente dai file installati sul proprio filesystem. In molti computer client, inoltre, è possibile che lo User Agent ( browser ) ponga dei limiti al numero ed alle dimensioni dei cookie salvati su disco fisso. Una impostazione abbastanza frequente potrebbe essere: 300 cookie, di 4096 byte ciascuno, con un massimo di 20 cookie per host o dominio. Questi limiti vengono posti, solitamente, per evitare che un server invii troppi cookie, di dimensioni incontrollabili, al fine di impedire, al client, di ricevere cookie da altri server ( Denial of Service Attack ). Lo User Agent ( browser ), inoltre, " deve prevedere un qualche meccanismo che permetta all'utente di gestire i cookie memorizzati. Uno User Agent, per esempio, può permettere all'utente di eliminare tutti i cookie ricevuti in un determinato intervallo di tempo, oppure i cookie inviati da un server specifico. Molti browser ( User Agent ) offrono, all'utente, la possibilità di esaminare il contenuto di ciascuno dei cookie memorizzati. I browser ( User Agent ) devono permettere all'utente di disabilitare i cookie. Quando i cookie sono disabilitati, il browser non dovrà mai includere un header Cookie nelle richieste HTTP in uscita e non dovrà elaborare alcun header Set-Cookie, presente nelle risposte HTTP in entrata. Alcuni browser ( User Agent ) offrono all'utente la possibilità di non accettare i cosiddetti cookie persistenti, quei cookie la cui durata si dilata nel tempo, per un numero imprecisato di differenti sessioni. Con questa configurazione attiva, il browser deve trattare tutti i cookie in arrivo come se l'opzione " persistent " fosse impostata a " false ". Alcuni browser molto popolari chiamano questa opzione " modalità privata di navigazione " ( private browsing mode ). Alcuni browser, inoltre, permettono all'utente di approvare i singoli cookie in entrata. Normalmente, questa possibilità genera molte noiose finestre di dialogo ( prompt ), ma alcuni utenti ritengono questo inconveniente poca cosa, rispetto alla possibilità di controllare la ricezione dei cookie" ( RFC 6265: HTTP State Management Mechanism ).

I cookie di terze parti

Nei browser, quali Firefox, è possibile impostare le proprie preferenze, in relazione all'accettazione o meno dei cookie. In Firefox, per esempio, è possibile aprire la scheda:


  Modifica
    Preferenze
      Privacy

Alla voce:


  Impostazioni cronologia

selezionare:


  utilizza impostazioni personalizzate

Per attivare i cookie, contrassegnare la voce:


  Accetta i cookie dai siti

Nel menù immediatamente successivo, dovremo scegliere se:


  Accettare i cookie di terze parti

	sempre
	mai
	dai siti visitati

Cosa sono i cookie di terze parti? "I cookie di terze parti sono cookie impostati da un sito web diverso da quello che si sta attualmente visitando. Ad esempio, il sito cnn.com potrebbe contenere al suo interno un pulsante "Mi piace" di Facebook. Quel pulsante imposterà un cookie che può essere letto da Facebook. Questo potrebbe essere considerato come un cookie di terze parti. Alcuni inserzionisti pubblicitari utilizzano questi tipi di cookie per tenere traccia delle visite dell'utilizzatore su tutti i siti sui quali offrono i propri servizi" ( Disattivare i cookie di terze parti, Mozilla Support ). Quando si visita un sito web, esistono buone possibilità che il sito contenga piccole immagini o piccoli pezzi di codice JavaScript, messi li solo affinchè il browser contatti un server diverso dal server corrente, così da permettere alle sconosciute "terze parti" di registrare ogni nostra visita.

Catturare i cookie con tcpdump

Il comando tcpdump, da eseguire da terminale e con privilegi di root ( amministratore ), permette di catturare tutto il traffico TCP/IP in transito da una specifica scheda di rete, salvandolo, eventualmente, in un file di testo:


	tcpdump -Avnl > traffic & tail -f traffic

In questo esempio, tcpdump si mette in ascolto sulla scheda di rete di default, stampa, in modalità verbose ( con più dettagli: -v ), i dati in transito, utilizzando la codifica testuale ASCII ( -A ), senza convertire gli indirizzi IP delle macchine nel loro nome ( risparmiando tempo, quindi, non dovendo effettuare anche la conversione DNS: -n ), occupando il buffer con ciascuna riga di output ( line buffered: -l ), salvando ciascuna riga nel file a ( >a ). Contemporaneamente ( & ), la shell esegue un secondo comando, ( tail ), che stampa a video le ultime 10 righe del file a, aggiornando l'output ad ogni nuova riga aggiunta al file ( -f ). Se abbiamo salvato il file in formato testuale, come nel nostro esempio, sarà sufficiente, una volta chiusa la sessione di tcpdump, leggere l'intero file, chiamato " a ", e catturare le righe contenenti la sequenza " Cookies ":


	cat a | grep Cookie

Vi siete connessi alla home page del giornale " La Repubblica "? Eseguendo il comando precedente dovreste trovare, tra le altre, righe come le seguenti ( nel nostro esempio, ciascuna riga viene spalmata su più righe, per un semplice problema di spazio ):


  Set-Cookie: cRepu=AUwClEx2xOYATAAAAAABaJxzBgAAAAEAAQAA;
    path=/; domain=adagiof3.repubblica.it;
    expires=Wed, 04-Dec-2024 20:30:33  GMT

  Set-Cookie: cProfile=AQKUTHbE5gBMAAAAAAAPAAABSnN6xnMAB2RlZmF1bHQ=;
    path=/; domain=adagiof3.repubblica.it;
    expires=Mon, 22 Dec 2014 20:30:33  GMT

  Set-Cookie: cS=AQ==; path=/; domain=adagiof3.repubblica.it;

  Set-Cookie: cRead="NmJlY2Y2NWM1ODRkNmE5YWIxN2Y0NzdkNzEzMDk4OGY=";
    Version=1; Domain=adagiof3.repubblica.it;
    Max-Age=2592000;
    Expires=Tue, 06-Jan-2015 19:30:33 GMT; Path=/

  Set-Cookie: cP=0; path=/; domain=adagiof3.repubblica.it;
    expires=Sat, 01 Jan 2000 00:00:00 GMT;

  Set-Cookie: OAX=X+j56lSEqt0ABoyS;
    path=/; expires=Thu, 07-Jan-16 19:30:37 GMT;
    domain=.repubblica.it

  Set-Cookie: RMFD=011XxhXRO10PwvJ;
    path=/; expires=Thu, 07-Jan-16 19:30:37 GMT;
    domain=.repubblica.it

Per ciascuno dei cookie inviati dal server di Repubblica, dovremmo trovare, in ogni successiva richiesta, inviata dal nostro computer allo stesso server di Repubblica, un header Cookie corrispondente:


  Cookie: cRepu=AUwClEx2xOYATAAAAAABaJxzBgAAAAEAAQAA;
    cProfile=AQKUTHbFHgJGAAAADQAPAAABSnN6xo8AB2RlZmF1bHQ=;
    cRead="NmJlY2Y2NWM1ODRkNmE5YWIxN2Y0NzdkNzEzMDk4OGY=";
    OAX=X+j56lSEqt0ABoyS;
    RMFD=011XxhXRO10PwvJ;

In questo esempio, uno stesso header Cookie contiene più cookie. Quando il nostro computer reinvia un cookie al server di riferimento, come nel nostro ultimo esempio, significa che quel cookie è stato memorizzato in una qualche area del nostro disco fisso. Dove e sotto quale forma un cookie venga memorizzato su disco fisso, dipende dal browser che si sta utilizzando.

Oltre i cookie

I cookie, inizialmente, furono creati per una nobile missione: permettere, ad un server, di distinguere uno User Agent ( browser ) dall'altro, in modo da poter modellare i servizi offerti sulle informazioni inviate dall'utente che utilizzava quel browser. Naturalmente, l'abuso era dietro l'angolo e, di abuso in abuso, si arrivò alla formulazione di leggi, che si prefiggevano lo scopo di limitare la portata di tali abusi, e ad una serie di utility, che mettevano l'utente nelle condizioni di cancellare i cookie salvati. L'insieme di queste misure hanno comportato, ovviamente, una riduzione dell'efficacia dello strumento cookie. "Oggi, i cookie rappresentano ancora il principale meccanismo che le agenzie di advertising, quali Google, utilizzano per tracciare e profilare gli utenti, attraverso i siti web e nel tempo, arrivando, in alcuni casi e per ciascun utente, a costruire, negli anni, un singolo e gigantesco profilo. Molti membri dell'EFF ( The Electronic Frontier Foundation ) rispondono a queste minacce utilizzando i programmi di gestione dei cookie, offerti dai loro browser, per limitare sia il numero dei cookie da accettare, sia la loro durata. Oggi, la situazione dei cookie è la seguente: i siti che desiderano tracciare i loro utenti hanno a disposizione nuove tecnologie, alle quali è molto difficile opporsi, poichè hanno un comportamento simile a quello dei cookie, ma sono molto meno conosciute, molto più difficili da identificare e molto più difficili da controllare" ( New Cookie Technologies: Harder to See and Remove, Widely Used to Track You ).

I cookie di Flash

"Una delle principali tecnologie utilizzate ai giorni nostri è quella dei cosiddetti "cookie Flash", un tipo di cookie gestito dai plug-in di Adobe Flash, nascosto nelle applicazioni Flash, contenute nelle pagine web. I file di questi cookie sono salvati al di fuori della portata del browser. Il browser non è in grado di permettere o negare l'accesso dell'utente ai cookie gestiti dalle applicazioni Flash. Un utente non viene informato della creazione di un cookie di Flash. Un cookie di Flash non ha scadenza. I cookie di Flash possono tracciare un utente, al pari di quanto possono fare i cookie HTTP tradizionali, solo che i cookie di Flash vengono memorizzati o recuperati ogniqualvolta un utente accede ad una pagina web, in cui sia presente un'applicazione Flash." ( New Cookie Technologies: Harder to See and Remove, Widely Used to Track You ). "Adobe Flash offre agli sviluppatori la possibilità di creare applicazioni dinamiche, usando un linguaggio simile a JavaScript: ActionScript. Queste applicazioni sono connesse alla rete e possono caricare in memoria codice sorgente e dati, direttamente da Internet. Adobe include, anche, metodi per aggirare il vincolo di sicurezza, che dovrebbe essere applicato da qualsiasi browser, chiamato same-origin security policy, che impone di non permettere ad un'applicazione residente su un server di leggere i dati presenti su un server differente. Flash è anche browser-independent nella identificazione della locazione di memorizzazione dei dati. Se un utente apre un sito web con un browser, creando un oggetto Flash ( LSO: Local Shared Object ), potrà, in un secondo tempo, riaprire lo stesso oggetto Flash, anche utilizzando un browser differente. Grazie a questo meccanismo, Adobe garantisce, agli sviluppatori, la persistenza dei dati, attraverso browser differenti. Flash non offre alcuna interfaccia web ( browser ) per modificare le impostazioni sulla privacy o sulla memorizzazione. Flash, a questo scopo, mette a disposizione, con un click sul tasto destro del mouse, applicato al video in esecuzione, un menù contestuale, relativo al solo video in caricamento, che non può essere nascosto dallo sviluppatore e che può riferirsi esclusivamente al video in esecuzione. Per vedere o modificare le impostazioni generali, relative a tutti i siti, oppure, per vedere quali siti stiano memorizzando dati sul computer dell'utente, Adobe obbliga l'utente stesso ad aprire un video Flash speciale, ospitato sui suoi server, Flash Player Help, raggiungibile solo con una connessione HTTP ( insicura ). Un utente, quindi, che, per un qualsiasi motivo non fosse in grado di raggiungere il sito Adobe di controllo, non avrà alcuna possibilità di vedere o eliminare i dati salvati nel suo computer" ( Cleaning Up After Cookies ). Per gli utenti Firefox, esiste un plug-in, BetterPrivacy, che permette, attraverso un'interfaccia molto semplice ed intuibile, di gestire ( vedere o cancellare ) i cookie Flash. Gnash, il player GNU SWF, include "soldumper", una utility che permette di leggere direttamente i file in cui sono memorizzati gli oggetti LSO ( Local Shared Object ), i cookie Flash. In un sistema Linux, i dati di Adobe Flash vengono memorizzati in una sottodirectory, salvata nello spazio di ciascun singolo utente:


  ~/.macromedia/Flash_Player

All'interno di questa sottodirectory, potreste trovare diverse altre directory, le più importanti delle quali sono:


	macromedia.com
	#SharedObjects

La prima directory contiene le impostazioni globali e persistenti per il player Flash e una sottocartella, per ciascun dominio visitato, contenente le impostazioni Flash specifiche per quel dominio. La seconda directory contiene i cookie Flash. Un cookie Flash viene impostato quando un sito web pubblica un contenuto Flash embedded. Per esempio, un sito web potrebbe includere un banner pubblicitario in Flash, fornito da un'azienda che ha affittato lo spazio pubblicitario, oppure potrebbe caricare un file nascosto SWF ( ShockWave Flash ), il cui unico scopo sarebbe quello di memorizzare le impostazioni utente, quali il volume da assegnare ad un video Flash oppure la memorizzazione di un contenuto Flash in una qualche cache, sul disco locale, per una migliore performance ( qualità ), soprattutto nel caso di una connessione di rete poco affidabile. Questo significa che un'applicazione Flash potrebbe trasferire alcuni dati, da una Società pubblicitaria al computer di un utente, senza che l'utente sia a conoscenza di questa transazione e senza, nemmeno, che l'utente debba cliccare sul banner pubblicitario o sul video ( Flash Cookies and Privacy ).

Che fare?

Sfortunatamente, non esiste un metodo semplice, per evitare il tracciamento delle nostre abitudini di rete, volendo visitare un sito web moderno, magari un sito di social networking ( Facebook, Twitter, etc. ), ricco di codice JavaScript e di cookie. Per limitare i danni da queste pratiche di tracciamento, è possibile prendere qualche buona abitudine:

Impostare il proprio browser su una policy molto restrittiva, riguardo ai cookie, quale:
```
  non salvare la cronologia
```
per far si che tutti i dati relativi alla sessione siano eliminati con la fine della sessione.
Disabilitare i Flash cookie o qualsiasi altro Super Cookie.
Installare le estensioni Firefox:
```
  RequestPolicy
  NoScript
```
che aiutano a capire quando le pagine web che stiamo visitando contengono codice di altri siti. Questi tool sono molto efficaci, ma richiedono una certa competenza: molti siti web, infatti, contengono molto codice JavaScript e potrebbero non funzionare correttamente, quando sottoposti al controllo di questi tool.
Per incrementare la sicurezza dei nostri dati, non è mai da escludere l'uso di TOR, un software ed una rete di server proxy che permettono a chiunque di navigare con un indirizzo IP diverso da quello assegnato dall'ISP ( Internet Service Provider ).