Por favor, use este identificador para citar o enlazar este ítem:
https://cnbcolombia.com:8080/jspui//handle/123456789/147
Título : | Big data y los retos en salud |
Autor : | Salgado Escobar, Fabián Camilo |
Palabras clave : | Conferencia 20° Congreso CNB 2022 |
Fecha de publicación : | 14-dic-2022 |
Editorial : | CNB Colegio Nacional de Bacteriología |
Resumen : | Big Data y los retos en salud 1 Conversar de Big Data en salud podría interpretarse como un tema novedoso, sin que sea tácitamente así, pues es la salud uno de los campos en los que más se usan datos de manera directa e indirecta, entendidos como registros clínicos, medidas biométricas, indicadores de valores clínicos para evaluar condiciones de salud, resultados de exámenes, entre otros. Lo anterior nos indica que tendría entonces cabida en prácticamente todos los ámbitos: ensayos clínicos, epidemiología, salud pública, gestión administrativa, y ahora fuertemente en la aplicación de telemedicina y genómica, en donde se espera que el futuro y presente de la salud y de los sistemas y modelos de atención en salud fortalezcan la manera en que se recogen, almacenan, se procesan, se analizan y consultan los datos de manera estructurada, segura y debidamente anonimizada. Es por ello por lo que a manera introductoria debemos considerar terminología con la que no estamos familiarizados y que para el desarrollo que se versa a continuación es necesaria aclarar; Empecemos entonces con definiciones en un lenguaje no tan técnico y que nos acerquen un poco son: Analytics: “es en general la utilización de técnicas de análisis de datos para resolver problemas de negocio. Es la categoría más general, que incluye tanto análisis de datos en Big Data como en Small Data, tanto técnicas “sencillas” como porcentajes, medias, tablas cruzadas o gráficos como “avanzadas”: modelos predictivos, text mining, etc. “ (González Diaz, 2019) Big Data: “Es el análisis de grandes volúmenes de información. Se divide en dos ámbitos principales: Big Data tecnología, que se encarga principalmente del desarrollo del software (Hadoop, Spark, etc.), y de la configuración y mantenimiento de la arquitectura de la plataforma. Y Big Data Analytics, que se encarga de la explotación mediante técnicas y lenguajes analíticos (R, Python, etc.)” (González Diaz, 2019) ; de igual forma, se asocia el término a características clave que lo definen, y que se denominan las «V» de Big Data: volumen, velocidad y variedad, adicionalmente se sumaron dos características como son veracidad de los datos y valor de los datos (Menasalvas, Gonzalo , & Rodriguez González , 2017) . Datos: Son la representación de hechos como texto, números, gráficos, imágenes, sonido, video. Técnicamente es el plural de la palabra proveniente del latín datum, que significa “un hecho”, sin embargo, usualmente se utiliza el término como una cosa singular. Los hechos son capturados, almacenados y se expresan como datos consultables. Metadatos: Los metadatos son el término usado para describir y especificar los datos y otro contenido esencial en el entorno de datos, se suele usar la frase de “datos sobre los datos” para definir su concepto. La riqueza del Big Data en salud nos propone entonces muchos retos y nos debemos enfocar en que los datos por sí solos, no proporcionan ninguna ganancia y carecen de sentido, pero si les proporcionamos un contexto, podemos transformarlos en información. Esto requiere como elementos necesarios que consideremos: Definir el significado de los elementos de datos para el ámbito de la salud y sus elementos relacionados. Formatos de presentación de los datos en salud Periodo de tiempo representando los datos La importancia de los datos para un uso determinado 1 Fabian Camilo Salgado, Bacteriólogo especialista en epidemiología y magister en Big Data y Analytics La información contribuye a la generación de conocimiento como el fin último en el ciclo de vida de los datos. El conocimiento es la comprensión, conciencia y reconocimiento de una situación y su familiaridad con su complejidad; es información en perspectiva integrado desde un punto de vista basado en el reconocimiento y la interpretación de patrones, tendencias, entre otras, que permiten generación de hipótesis y teorías sobre las causas. Ahora bien, los datos requieren de un tratamiento adecuado que debe ser mediado por condiciones que permitan entenderlos como insumos que den valor en esa producción de conocimiento, esto se logra mediante lo que definimos como La Calidad del Dato, la cual debe ser entendida en dos perspectivas: Cómo de bien sintetizan la información de objetos, eventos y conceptos que representan. Cómo de bien permiten cubrir las expectativas de los consumidores de los datos Para ello, buscamos que los datos sean medidos en seis dimensiones: 1. Data Completeness – o completitud del dato: indica si hay vacíos en los datos que se esperaba recopilar y de los que realmente se recopilan. 2. Data Uniqueness – o unicidad del dato: es una medida discreta de duplicidad de datos, identificados dentro de un conjunto de datos o en comparación con otro conjunto de datos, que cumplen con las mismas especificaciones de información o reglas de negocio. 3. Data Timeliness – u oportunidad del dato: es una medida que indica si los datos son recopilados en el momento adecuado, para que estos sean válidos y útiles para el proceso de negocio que los requiera. 4. Data Validity – o validez del dato: consiste en garantizar que los datos sigan un formato estándar, como AAAA/MM/DD para las fechas, o que tengan un rango de valores correcto. 5. Data Accuracy – o precisión / exactitud del dato: indica el grado de precisión en que un dato describe correctamente el objeto en el contexto del mundo real. Este contexto identifica una versión única de la verdad y se usa como referencia para identificar desviaciones. La precisión de los datos afecta directamente la exactitud de las decisiones y debe considerarse como un componente clave para las prácticas de análisis de datos. 6. Data Consistency – o consistencia del dato: mide la coherencia de los datos. La coherencia significa que los datos en todos los sistemas reflejan la misma información y están sincronizados entre sí en toda la empresa. Vemos entonces que, teniendo datos de calidad, obtenemos información y con ella generamos conocimiento, pero cómo darlos a conocer es otro tema que el Big Data encamina con lo que se denomina visualización de datos. Mencionaré entonces los tipos de gráficos más utilizados, así como sus casos de uso. Cada tipo de gráficos tiene unas propiedades visuales que nos ayuda a agruparlos según qué buscamos trasmitir. Aunque hay variaciones respecto a esta clasificación, los principales bloques son: Comparación: Este bloque está formado por aquellos gráficos que nos ayudan a comparar entre categorías o buscan comparar o mostrar elementos en diferentes periodos de tiempo dando respuesta a preguntas como: ¿Cuánto?, ¿Cuáles? son los elementos más representativos y los menos? o Ejemplo de gráficos: Gráfico de barras o bar charts, gráficos de radar, gráficos de intensidad de color o Heatmaps. Evolución en el tiempo: Este bloque nos permite hacer el seguimiento de uno o varios elementos a través del tiempo. Este gráfico se usa cuando la temporalidad es un factor importante del análisis y situamos este variable en el eje x de nuestro gráfico. o Ejemplo de gráficos: Gráfico de líneas, gráficos de pendientes o gráficos de áreas. Composición: Esta parte está formada por aquellos gráficos que nos ayudan a ver la relación entre las partes y el todo. Este bloque incluye tanto gráficos que muestran una “foto” estática en el tiempo como gráficos que nos ayudan a ver la evolución de las partes hasta llegar a una foto final. Nos permiten responder a preguntas como: ¿Cuál es el peso de este elemento respecto al global? o Ejemplo de gráficos: Pie chart o gráficos del quesito, Treemaps o diagramas de árbol, gráficos de Donuts, Waterfall chart o gráfico de cascada. Relación: Esta categoría de gráficos nos ayuda a ver la relación o correlación que existe entre variables. o Ejemplos de gráficos: Gráficos de dispersión, gráficos de burbujas o gráficos de coordenadas paralelas. Distribución: Este bloque contiene aquellos gráficos que nos ayudan a ver la naturaleza de nuestros datos mediante la distribución de sus datos. En estos gráficos la forma nos ayudará en la comprensión de la variable. o Ejemplo de gráficos: Histogramas, diagramas de cajas o Box Plots o gráficos de densidad. Mapas: Este tipo de gráficos nos permiten representar medidas sobre una zona geográfica concreta o ubicación. Aunque este recurso es susceptible de ser usado siempre que tengamos datos referenciados a un lugar, su objetivo principal es ayudarnos a encontrar en los datos patrones geográficos. o Ejemplo de gráficos: Mapa cloroplético, mapas de símbolos proporcionales (por ejemplo, gráfico de burbujas sobre un mapa) Flujos: Estos gráficos nos ayudan a entender los flujos entre entidades pudiendo obtener información tanto de los sentidos en los que se establece el flujo como de la proporción de las nuevas distribuciones. Ejemplo de gráficos: Gráfico Sankey, diagrama de Chord o gráfico de conjuntos paralelos. Cómo vamos en salud La ética de los datos. En salud, es un ámbito especialmente delicado y por ende muy regulado, se lleva años trabajando en la importancia del uso del consentimiento informado y la necesidad de abordar dilemas éticos (de priorización, etc.) en el desempeño de la profesión y es necesario ligarlo a que en la actualidad enfrentamos un sector altamente tecnologizado en el que el uso de dispositivos de monitoreo individual. (Buenadicha, Galdon Clavell, Hermosailla, Loewe, & Pombo , 2019) En Colombia el uso de los datos está amparado por la Constitución Política en su artículo número 15 y con la Ley de Protección de Datos Personales o Ley 1581 de 2012. Se busca entonces que, con el cumplimiento regulatorio como marco principal, la información extraída de todos estos datos tenga el potencial de lograr una salud más eficaz con capacidad de reducir el gasto médico y las tasas de mortalidad por enfermedad aplicando técnicas Big Data. Que mediante el análisis de datos en el sector salud, el fitness, la nutrición y el bienestar en general se aumente significativamente la eficacia de los sistemas que actualmente nutren el modelo sanitario, abordando la salud con diferentes enfoques como son: Medicina poblacional y tecnologías Big Data, centrándose en analizar un grupo de personas representantes de la población general y extrapolar los resultados obtenidos al resto de la población. Medicina preventiva a partir del Big Data, que identifique y anticipe las necesidades de los pacientes, analizando el impacto y el estudio de los históricos de datos con políticas preventivas específicas, evaluando servicios y programas de gestión de salud, así como promoción de la salud, partiendo del análisis de datos para aumentar el bienestar social en todos los sentidos. Medicina participativa con la tecnología del Big Data, en la que pacientes, médicos, familiares y otros comprendan conceptos de e-paciente, influencia online y la capacidad para desarrollar propuestas de forma conjunta basadas en técnicas Big Data de análisis de texto libre, análisis del sentimiento y normalización y codificación automática de datos médicos para conseguir: Medicina personalizada con Big Data, que aplique técnicas de Big Data para optimizar los costes y salvar vidas y que mejore la calidad asistencial dando un trato más personalizado a los pacientes, fortaleciendo la telemedicina y la teleasistencia para mejorar coberturas de acceso a los servicios de salud, promoviendo el autocuidado de las personas. Y finalmente la implementación y adopción de Modelos algorítmicos para una Medicina predictiva, creando modelos algorítmicos en salud entrenados a medida que permitan tratar mejor la información informatizada, predecir la evolución de los pacientes o sus necesidades, y que constituyan un apoyo a la práctica de los profesionales sanitarios: Bibliografía Buenadicha, C., Galdon Clavell, G., Hermosailla, M. P., Loewe, D., & Pombo , C. (2019). La Gestión Ética de los Datos. Banco Interamericano de Desarrollo. González Diaz, I. (2019). Big Data para CEO's y Directores de Marketing. Madrid: Data Centric. Menasalvas, E., Gonzalo , C., & Rodriguez González , A. (2017). BIG DATA EN SALUD: RETOS Y OPORTUNIDADES. Economía Industrial . Recuperado el Octubre de 2022, de https://www.mincotur.gob.es/Publicaciones/Publicacionesperiodicas/EconomiaIndustrial/RevistaEconomiaIn dustrial/405/menasalvas,%20gonzalo%20y%20rodr%C3%8Dguez.pdf Alba Daniel, (2021). Programa de Gestión de Datos, Módulo Gobierno del Dato, Máster Big Data & Analytics. Claus O. Wilke (2019) Fundamentals of Data Visualization. O`Reilly. Páginas web: Kate Harrison (2015) A Good presentation is about a Data and a Story: https://www.forbes.com/sites/kateharrison/2015/01/20/a-good-presentation-is-aboutdata-and-story Gapminder. Plataforma de visualización de datos: https://gapminder.org David McCandless (2020) Information is Beautiful: https://informationisbeautiful.net Cole Nussbaumer Knaflic. (2020) Storytelling with data: http://www.storytellingwithdata.com Instituto de Ingeniería del Conocimiento, Big Data en medicina: aplicaciones útiles; https://www.iic.uam.es/lasalud/big-data-en-medicina-aplicaciones-utiles/ |
URI : | https://cnbcolombia.com:8080/jspui//handle/123456789/147 |
Aparece en las colecciones: | Memorias de Congreso |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
BIG DATA Y LOS RETOS EN SALUD.pdf | 2,41 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.