Datamizer è unico perchè usa tecnologia software proprietaria.
Le due fondamentali prestazioni che rendono DM cosi speciale rispetto agli altri prodotti di archiviazione/ compressione / cifratura sono la Anonimizzazione e la Pseudonimizzazione.
Alla data in cui DM viene rilasciato e diffuso sulla rete, nessun software applicativo o piattaforma nota è specificamente indirizzata a risolvere i problemi di chi deve conformarti agli adempimenti delle norme per la Protezione dei Dati Personali (vedi riferimenti).
Essenzialmente per soddisfare queste due grandi caratteristiche occorrono conoscenze di modellazione matematica, statistica e probabilistica (non sono la stessa cosa), ed ovviamente una robusta esperienza di informatica per la implementazione di algoritmi, applicazioni e prassi automatiche utilizzabili in modo semplice per gli utenti finali.
In sintesi estrema e semplificando in modo sfacciato, si può dire e scrivere che Datamizer assimila la Anonimizzazione con le tecniche di Permutazione e realizza la Pseudonimizzazione con la Criptologia. Nel primo caso ci si riferisce al "mischiare dei dati" (shuffling), nel secondo parleremo di "offuscamento del dato"
Sempre in prima battuta, si può approssimare che la Pseudonimizzazione agisce sulle tipologie di "dato verticale" (campi / colonne di una tabella), laddove la Anonimizzazione investe l'ordine/disordine del "dato orizzontale" (righe e/o records)
Una l'altra o tutte e due?
In effetti sembra quali illogico usare tecniche di Anonimizzazione senza aggiungere anche la Pseudonimizzazione. In parole elementari è chiaro che se oltre al caotico rismischiare delle carte aggiungo lo "scarabbocchiarle", la possibilità di risalire al mazzo di carte in chiaro ed ordinato come era in precedenza è di fatto impossibile.
Comunque, esistono delle circostanze, normalmente ignorate dai software di compressione ecifratura a scopo di stoccaggio delle informazioni digitali, che trattiamo di seguito per spiegare come sia desiderabile la sola Anonimizzazione. Si potrebbe cioè preferire di non cifrare (offuscare)
Come mischiare le carte
Concettualmente può sembrare banale il mettere "disordine" in un insieme ordinato di elementi. Non lo è affatto nel caso di stringhe significanti. Pensiamo al Cognome, al Nome e al codice fiscale di una persona. Abbinando questi dati comprendo anche la sua Età e il Comune di nascita.
Ovviamente la cifratura ci nasconde queste informazioni, tuttavia ci sono almeno tre circostanze nelle quali bisogna lasciare in chiaro:
1. Statistiche su dati aggregati (Es.: report amministrativi, studi consultivali di marketing, indagini epidemiologiche di trial clinici)
2. Impossibilità di intervenire sul sw gestionale (La software-house è fallita, il programmatore ha lasciato la sw-house, ecc.)
3. I sistemisti vogliono creare un Honeypot da "dare in pasto" ad eventuali hackers o insiders che volessero esfiltrare informazioni aziendali
Nei casi sopra citati ha senso lasciare in chiaro i records dei valori nelle tabelle del database. E' però vincente scambiare i dati ordinalmente coso che chi li vede sta guardando dati falsi... Il termine falso è riferito al fatto che qualitativamente guardando un record nel quale ho messo un Cognome non più corrispondente al suo Nome non potrò risalire alla identità effettiva della persona o ad un suo dato metrico come ad esempio l'Età.
In questa situazione, i numeri, le cifre e quanto altro sia un dato legato all'intera tabella ha sempre lo stesso contenuto e se facessimo delle statistiche (Es. Media, range o deviazione standard della Età) queste non cambierebbero di significato e valore.