FECHA:
2021-01-20
IDENTIFICADOR UNIVERSAL: http://hdl.handle.net/11093/1695
TIPO DE DOCUMENTO: doctoralThesis
RESUMEN
En las últimas décadas, desde que la secuenciación del genoma se convirtió en un fenotipo de bajo coste de obtención, numerosos campos de la salud se desarrollaron como consecuencia de esta amplia disponibilidad de datos genómicos. La secuenciación de nueva generación (Next generation sequencing, NGS) trajo posibilidades sin precedentes para la investigación, como los estudios de asociación de todo el genoma (Genome-Wide Asociation Studies, GWAS). La creciente asequibilidad de la secuenciación del genoma y, como consecuencia, la disponibilidad generalizada de datos genómicos abre nuevas oportunidades en el campo de la medicina, allanando el camino hacia la medicina personalizada (también conocida como medicina genómica), los diagnósticos médicos potencialmente mejorados y la predicción de riesgos de enfermedades mediante la realización de pruebas de susceptibilidad en la atención médica de un futuro cercano. Los servicios directos al consumidor (Direct-to-Customer, DTC) como OpenSNP1 o 23andMe2 permiten a las personas compartir sus datos genómicos y determinar sus antepasados. Por otro lado, este rápido aumento también plantea graves riesgos de privacidad debido a la naturaleza intrínsecamente sensible de la información genómica. Dado que la información sobre el ADN es única y está correlacionada entre los miembros de la familia, no puede considerarse solo como una cuestión de privacidad individual. Estos datos genómicos tienen serias implicaciones en la privacidad, ya que incluyen información sobre el fenotipo, la etnia, los miembros de la familia, las enfermedades, etc., de un individuo. Por estos motivos, los casos legales se tuvieron que adaptar a la realización creciente de pruebas de paternidad, y los forenses avanzaron al investigar las escenas del crimen con pruebas de identidad genómica. A través de factores como el almacenamiento de datos de bajo coste o métodos de búsqueda simples para acceder a los datos disponibles en línea, el progreso digital ha proporcionado nuevas perspectivas en las tecnologías de la información modernas y el mundo digitalizado, afectando de manera potencialmente negativa al estado de la privacidad y la protección de datos. Al mismo tiempo, esta tecnología en rápido desarrollo también puede ayudar a minimizar o evitar riesgos para la protección de datos. Consecuentemente, en este mundo en rápida digitalización, los requisitos de los principios de privacidad pueden llegar a dar forma a mejoras tecnológicas y redefinir conceptos como la minimización de datos, la ofuscación, el anonimato y la seudonimización, para compensar los peligros inherentes de la digitalización misma. No obstante, para cubrir la gama más amplia de principios fundamentales de protección de datos, mediante la minimización del uso de datos personales, la maximización de la seguridad de los datos y el empoderamiento de las personas, se acuñó la expresión
“Tecnologías de mejora de la privacidad” (PETs, de Privacy Enhancing Technologies en inglés). De acuerdo con la definición de la Agencia de la Unión Europea para la Seguridad de las Redes y la Información (ENISA), las PETs son: "Soluciones de software y hardware, es decir, sistemas que abarcan procesos, métodos o conocimientos técnicos para lograr una funcionalidad específica de protección de datos o privacidad o para proteger contra los riesgos de privacidad de un individuo o un grupo de personas físicas". Las PETs se aplican a medidas técnicas generalizadas para garantizar la privacidad en varios campos, desde la salud electrónica hasta el análisis de datos de tráfico. Estas implicaciones de privacidad pueden a veces ser incluso barreras tanto para la investigación médica como para la disponibilidad de datos genómicos. Por lo tanto, recientemente, algunos grupos de investigación han propuesto técnicas de preservación de la privacidad para procesar datos genómicos. Debido a la necesidad de métodos que mejoren la privacidad, se han así implementado varias soluciones que permiten a los científicos trabajar con datos genómicos mientras se protege la información confidencial. Hasta ahora, los métodos más prometedores se basan en la criptografía. Los individuos y las instituciones médicas tienden a entregar sus datos a plataformas de terceros para
evitar perder datos al mantenerlos en dispositivos locales. Sin embargo, la subcontratación de datos genómicos los expone a los proveedores de servicios e infraestructuras y los hace vulnerables a ataques y accesos que violan la privacidad de los pacientes. Por lo tanto, el objetivo principal de esta tesis es la investigación de las soluciones criptográficas más adecuadas y su adopción para diseñar e implementar protocolos que preserven la privacidad para almacenar, consultar y procesar de forma segura las secuencias genómicas subcontratadas (o datos de comportamiento de los usuarios en línea) en un entorno no confiable. Estas soluciones, además, son escalables y eficientes, lo que garantiza la privacidad de las personas y el poder de gestión de acceso. Investigamos, diseñamos y desarrollamos métodos para proteger esta información sensible de accesos no autorizados durante el procesamiento, minimizando la fuga de datos durante las transacciones de datos y garantizando la seguridad de las soluciones propuestas contra diferentes tipos de comportamientos maliciosos. Además, como aplicación alternativa de nuestros métodos de mejora de la privacidad, se propone una adaptación destinada a la optimización de los métodos de publicidad dirigida sobre los datos de comportamiento en línea del individuo. En resumen, en esta tesis, nos centramos inicialmente en el diseño de protocolos genéricos para aplicaciones de salud digital conscientes de la privacidad, específicamente en el campo de la "privacidad genómica". Extendemos nuestros métodos a la protección de datos en las redes sociales, es decir, al área de la "publicidad dirigida". The field of genomic research has considerably grown in recent years due to the unprece-dented advances conducted by Next Generation Sequencing (NGS). Developments in this field have resulted in the current high availability of genomic data. The increasing affordabil-ity of genome sequencing and, as a consequence, widespread availability of genomic data open up new opportunities in the field of medicine. On the other hand, this rapid increase also poses severe privacy risks due to the inherently sensitive nature of genomic information. As DNA information is unique and correlated among family members, it cannot be regarded as just a matter of individual privacy concern. The availability of genomic data raises profound privacy implications as it includes information about an individual’s phenotype, ethnicity, family members, disease conditions, and more. These privacy implications may sometimes even be barriers to both medical research and the availability of genomic data. Therefore, recently, researchers proposed privacy-preserving techniques to process genomic data. Scien-tists deploy various solutions enabling them to work on genomic data due to the need for privacy-enhancing methods to protect these sensitive pieces of information. So far, the most promising methods are based on cryptography. We investigate the existing cryptography-based techniques for privacy-preserving ge-nomic data and online behavior analysis on the path to building generic privacy-enhancing protocols and recognize their drawback...
Ficheros en el ítem
- Nombre:
- Namaziesfanjani_Mina_TD_2020_AA.pdf
- Tamaño:
- 3.422Mb
- Formato:
- Descripción:
- Copia do orixinal