Desarollada por primera vez hace más de diez años, la confidencialidad diferencial es un modelo de protección de la privacidad matemáticamente probado. Se utiliza para añadir intencionalmente ruido en los bases de datos seudónimas para impedir la reidentificación de los consumidores durante el análisis de los datos.
¿Porqué existe la confidencialidad diferencial?
Pongamos un ejemplo. En 2006, Netflix publicó 100 millones de archivos con la clasificación de los usuarios sobre las películas para que investigadores externos analicen y mejoren las recomendaciones. Los datos personales, como los nombres de los usuarios, las direcciones electrónicas o las informaciones de facturación, fueron borrados de estos archivos de datos.
Poco después de la publicación de los datos, los investigadores se dieron cuenta de que podían reidentificar a los individuos asociados a estos archivos comparando las clasificaciones de Netflix de películas con las clasificaciones de la mismas películas en la base de datos de IMBD, donde había más informaciones personales disponibles. El conjunto de películas vistas por un individuo constituía una “huella digital” única que podía utilizarse para reidentificar a los individuos asociados a los archivos “anonimizados”. Los investigadores tuvieron éxito en el 84% de los casos para los usuarios que tenían cuentas Netflix e IMDB.
Aunque revelar las clasificaciones de las películas puede parecer inofensivo, exponer todos los medios de una persona puede ser clave para inferir su afiliación política, su género o cualquier otra categoría de datos protegidos. La confidencialidad diferencial permite a las empresas recoger y compartir informaciones agregadas sobre los usuarios, preservando al mismo tiempo la privacidad de los usuarios individuales. El principal mecanismo para conseguirlo es añadir ruido a los datos agregados.
¿Por qué utilizar la confidencialidad diferencial?
La confidencialidad diferencial se utiliza para proteger la privacidad de los consumidores y permitir a las empresas colaborar en el marco de políticas de seguridad de la información que, de otro modo, podrían impedir el intercambio de datos.
Hoy en día, muchas empresas quieren encontrar formas seguras de mantener el control de sus datos y compartirlos con los terceros autorizados. La confidencialidad diferencial puede ayudar a las partes propietarias preservar la confidencialidad de sus archivos individuales exponiendo sólo los datos agregados, protegiendo así el valor de sus datos y sus relaciones con los clientes.
¿Cuando elegirán los colaboradores de datos utilizar la confidencialidad diferencial?
La confidencialidad diferencial puede ser de especial interés para las partes que desean colaborar pero que no tienen un alto nivel de confianza. Es un técnica excelente para casos de uso basados en informaciones direccionales que nos requieren un alto grado de precisión.
Por ejemplo, si usted es un distribuidor y quiere colaborar con sus proveedores, es posible que no quiere o no necesita utilizar la confidencialidad diferencial para analizar las opiniones de los clientes. De hecho, ambas partes se dedican a proteger las informaciones que comparten sobre sus consumidores y colaboran desde mucho tiempo con controles de confidencialidad de los datos similares. Sin embargo, si usted es una institución financiera sujeta a regulaciones de datos únicas y específicas de su industria, debe cumplirlas. A continuación, puede utilizar la confidencialidad diferencial cuando trabaja con una aerolínea para encontrar clientes comunes que puedan responder a una oferta de tarjeta de crédito de marca compartida.
La confidencialidad diferencial … no es una solución mágica.
Es importante señalar que las técnicas de confidencialidad no impiden la reidentificación del consumidor en un entorno abierto, a menos que se tengan en cuenta todas las combinaciones posibles de datos en el cálculo de los resultados de la consulta. La repetición de consultas en la misma base de datos puede revelar el nivel de ruido agregado en los resultados de la confidencialidad diferencial y permitir sustraerlo en futuras consultas. Esta situación es conocida por los profesionales como “reducción del presupuesto de protección de la privacidad” y representa los límites de las técnicas de confidencialidad diferencial contra los ataques de consulta de datos arbitrarios.
Descubra cómo LiveRamp puede ayudarlo a monitorear, administrar y activar sus datos.
Descubra nuestro ebook: Direccionabilidad en un mundo sin cookie