Science and Technology Production

Detección de mutaciones y variaciones en el número de copias del genoma mitocondrial.

Tesis

Date:

07/07/2023

Summary *

La medicina de precisión es una innovadora disciplina médica que revoluciona la forma en que se diagnostican, tratan y previenen enfermedades. Utiliza técnicas avanzadas de análisis de datos, genómica y biología molecular para identificar las características específicas de cada persona y diseñar estrategias de diagnóstico y tratamiento personalizadas [1]. Su base de conocimiento fundamental es el genoma humano, ya que proporciona información crucial sobre la composición genética de cada persona y su influencia en la salud y las enfermedades.El genoma humano consta de dos componentes principales: el genoma nuclear y el genoma mitocondrial [2]. El genoma nuclear se encuentra en el núcleo de las células y contiene la mayor parte de la información genética. Por otro lado, el genoma mitocondrial se encuentra en las mitocondrias y es responsable de la producción de energía celular.En el contexto de esta tesis, el foco se encuentra en el análisis del genoma mitocondrial. Aunque tanto el genoma nuclear como el genoma mitocondrial desempeñan un papel crucial en la genética humana, el enfoque se basa en comprender las variaciones estructurales y genéticas presentes en el genoma mitocondrial. Las variaciones estructurales del genoma humano mitocondrial, como los polimorfismos de un solo nucleótido, inserciones o deleciones de nucleótidos, las fusiones de genes o las variaciones en el número de copias de ADN (CNV) desempeñan un papel importante en la variabilidad genética y pueden tener implicaciones significativas en el desarrollo de enfermedades, como el cáncer [3]. El advenimiento de las tecnologías de secuenciación de nueva generación (NGS) ha hecho posible la identificación de estas variaciones a partir de la secuencia del genoma/exoma de un paciente. Actualmente la identificación de éstas variaciones tiene un impacto clínico importante tanto para el diagnóstico como en el tratamiento de ciertos tipos de tumores o de ciertas enfermedades de origen hereditario. Sin embargo el procesamiento de los datos de NGS para la identificación de dichas alteraciones no es trivial, requiriendo un alto conocimiento de bioinformática para su análisis. En este proyecto se desarrollará una plataforma amigable y simple para el procesamiento de muestras de pacientes para la identificación de variaciones del número de copias y alteraciones estructurales del ADN mitocondrial humano. La misma permitirá un acceso simple y amigable, generar reportes y construir una base de datos de CNVs y alteraciones mitocondriales en una cohorte de pacientes argentinos para su aplicación en entornos de medicina de precisión.La propuesta consiste en desarrollar una librería en lenguaje R que facilite la identificación de variantes estructurales del genoma mitocondrial humano y permita generar una base de datos de dichas variantes. En términos generales el procesamiento de una muestra de secuenciación del genoma mitocondrial de un paciente consiste en 3 etapas: la alineación de los archivos crudos de la secuenciación, el procesamiento y la visualización.Una vez recibido el archivo con los datos crudos de la secuenciación de la muestra por parte del proveedor (Macrogen en este caso), ésta es descargada en un servidor. Luego la misma se procesa con un algoritmo de recorte de los adaptadores (propios del proceso de secuenciación) y de eliminación de lecturas de baja calidad con el software Trimgalore. Luego la secuencia resultante es alineada con respecto al genoma de referencia humanos (hg19 o hg38) utilizando el software BWA. Una vez obtenida la muestra alineada con respecto al genoma humano, es posible buscar sobre ella alteraciones, tanto del número de copias como de las bases en el genoma mitocondrial. Por lo tanto, el usuario podrá elegir el tipo de análisis que desea. Las opciones serían las siguientes:1. Detección de mutaciones en el genoma mitocondrial: La búsqueda de inserciones y deleciones será hecha con los softwares GATK (versión 4), SamTools, y Picard.2. Detección de variaciones en el número de copias del genoma mitocondrial: Para este análisis es necesario contar con una base de datos de referencia de secuencias alineadas a exones de muestras que se denomina “control”. Para obtener estas referencias, el usuario deberá almacenar previamente por lo menos una muestra que se considera “normal”. Estas referencias se comparan contra la muestra en estudio y a partir de un algoritmo denominado ExomeDepth se estima la probabilidad de que una determinada región presente alguna alteración con respecto a los casos “control”.Independientemente del tipo de detección que se lleve a cabo, los resultados de cada paciente analizado son luego integrados en una base de datos que contiene información sobre la mutación y/o variación específica encontrada: posición de la mutación, bases de referencia y alteración, números de identificación del cromosoma donde se encuentra, y otros datos referidos a las calidades de filtrado de información. Además de estos datos convencionales, se agrega a la base de datos información sobre estas mutaciones provenientes de las bases de datos HMTVAR, VarSome y Franklin (esta última provista por FLENI), como las patologías a las que se relaciona cada mutación, índices genéticos, frecuencias en las que se encuentran estas mutaciones, la probabilidad de que dicha variación sea patogénica o no, entre otras.Finalmente, se genera una base de datos local con los resultados de todos los pacientes analizados por el software. La base de datos permite tener una descripción de las mutaciones y variaciones mitocondriales en la población que permiten luego caracterizar a la misma en términos de:- ¿Cuáles son las mutaciones/variaciones más frecuentes globalmente?- ¿Hay mutaciones/variaciones específicas para un diagnóstico determinado?- ¿Es posible caracterizar el nivel de incerteza de las estimaciones a través de un análisis poblacional de las mutaciones/variaciones?Responder este tipo de preguntas es fundamental no solo para conocer a la población objetivo, sino para evaluar la confianza del proceso analítico y su posible implementación como herramienta diagnóstico o de guía terapéuticaComo resultado de este trabajo se implementa una librería en lenguaje R denominada MitoR que permita:a. Administrar todas las herramientas de software complementarias al análisis.b. Visualizar las variantes/mutaciones encontradas en el genoma mitocondrial del paciente.c. Administrar la base de datos.d. Utilizar la base de datos para caracterizar a la población en estudio de la institución usuaria.e. Utilizar dicha base de datos para retroalimentar el sistema y mejorar la identificación de las variaciones/mutaciones.f. Generar una visualización que permita representar los resultados obtenidos de manera simple para los profesionales que la utilicen. Information provided by the agent in SIGEVA

Key Words

ADNVARIACIÓN EN EL NÚMERO DE COPIASGENOMA MITOCONDRIALMUTACIÓN