Synthetic data
Abbiamo scelto di non mettere il titolo in italiano perché “dato sintetico” può creare confusione tra “sintetico” in senso di “artificiale” o di “breve, riassuntivo”. In realtà nel parlare di dati sintetici si parla di una nuova frontiera di applicazione dell’Intelligenza Artificiale, stavolta per tutelare la privacy. Finora i dati erano o personali, quindi riferibili ad una persona fisica specifica, oppure anonimi, quando risulta impossibile destrutturarli e risalire alla/e persona/e. I dati sintetici consentono di creare un campione virtuale, costituito da persone immaginarie, che rispecchiano però un analogo campione reale. Se, ad esempio, prendo le foto di 1000 classi di quinta superiore, il sistema sarà in grado di costruire una classe immaginaria, che rispecchia però i dati salienti di una classe reale: distribuzione delle altezze, proporzione fra maschi e femmine, rappresentanza delle diverse etnie, acconciature ecc ecc saranno false, ma abbastanza attendibili da poterci lavorare senza violare la privacy di alcuna persona reale.