El nodo País Vasco, liderado por la investigadora Irantzu Barrio Beraza (Universidad del País Vasco UPV/EHU), está formado por 19 miembros. Sus principales líneas de investigación se centran en la modelización de la calidad de vida relacionada con la salud, desarrollo y validación de modelos predictivos en ciencias biosanitarias, experimentales y sociales y propuestas semiparamétricas, bayesianas y de verosimilitud empírica de modelización en análisis de supervivencia, datos longitudinales y modelos de sobredispersión.

Investigadores que participan en el nodo

Investigador/a principal: Irantzu Barrio Beraza (Universidad del País Vasco UPV/EHU)

Ver todos los miembros

Principales líneas de investigación

Los modelos para el análisis de datos longitudinales constituyen una herramienta fundamental para la modelización de experimentos en que se mide una o más variables a lo largo del tiempo. Dentro del mismo, existen propuestas paramétricas y semiparamétricas que permiten modelizar fenómenos no estacionarios en varianza y correlación. Las distintas propuestas y extensiones que se pueden enmarcar en este tipo de análisis son las siguientes: a) Modelos antedependientes en el análisis de datos longitudinales; b) Modelos antedependientes Bayesianos en el análisis de datos longitudinales; c) Estudio de extensiones que permitan el análisis de pseudo paneles dependientes; d) Modelos antedependientes semiparamétricos de parámetros cambiantes en el análisis de datos longitudinales. Entre los campos de aplicación de este tipo de modelos se encuentran la Medicina (Epidemiología), Biología, Agricultura, Genética, Genómica y Economía, en donde su uso ha demostrado su enorme utilidad y necesidad de profundización y propuesta de modelos alternativos dentro de este contexto.

De igual forma, la propuesta y análisis de supervivencia y sus aplicaciones en Medicina ha motivado la necesidad de implementar modelos semiparamétricos y propuestas de inferencia basadas en bootstrap que permitan resolver problemas específicos de variables que no requieren la hipótesis de una forma paramétrica específica para el efecto de las mismas sobre la variable de respuesta. Por tanto, la propuesta de un modelo de regresión parcial censurado se encuentra perfectamente motivado por esta necesidad y sus aplicaciones en estudios de SIDA y en Finanzas han demostrado su enorme utilidad. Algunas de las extensiones que se pueden enmarcar en este tipo de análisis son las siguientes: a) Modelo de regresión no paramétrico censurado en el análisis de datos de supervivencia; b) Inferencia basadas en bootstrap o técnicas de remuestreo acordes con el modelo propuesto; c) Desarrollo del software que permita el uso y aplicación de estas técnicas.

El estudio de propuestas alternativas de modelización estadística de resultados percibidos por el paciente, como por ejemplo la calidad de vida relacionada con  la salud, es otra de las áreas de gran interés cuyo uso ha demostrado ser muy valorado en las distintas áreas de la Medicina (Epidemiología). Algunas de las extensiones que planteamos analizar dentro de esta temática son: a) Modelo de regresión beta-binomial; b) Propuestas alternativas; c) Análisis de sensibilidad de distintas propuestas de modelización.

En los estudios longitudinales de calidad de vida relacionada con la salud nos encontramos habitualmente con pérdidas de seguimiento. Las perdidas pueden ser completamente aleatorias (MCAR), aleatorias (MAR) o no aleatorias (MNAR), dependiendo de si la no respuesta es independiente del resultado de interés, es dependiente únicamente de los resultados observados, pero independiente de los perdidos o no observados, y, finalmente de si es dependiente de ambos, tanto de los resultados observados, como de los no observados. Las estrategias de modelización para un mecanismo de respuesta de tipo PNA, tipo selection models (SeM)  y pattern mixture models (PMM), consideran la distribución conjunta de la variable resultado y del proceso de valores perdidos. Estas técnicas de análisis de datos con pérdidas de seguimiento, aunque introducidas inicialmente hace más de una década, están en constante desarrollo, especialmente en cuanto a su aplicación se refiere. En nuestro ámbito geográfico, la utilización de técnicas de modelización de las pérdidas de seguimiento en el análisis de datos de resultados percibidos por el paciente es prácticamente inexistente.

Los modelos de predicción clínica juegan un papel fundamental en la toma de decisiones para la práctica clínica hospitalaria. El desarrollo y validación de modelos predictivos con una alta capacidad predictiva y discriminativa permitiría a los facultativos médicos tomar decisiones con un buen nivel de certeza. El desarrollo de modelos predictivos se basa en la modelización estadística, donde las características de la variable respuesta, la relación entre los predictores y la respuesta, los datos longitudinales y el tratamiento de pérdidas de datos no aleatorias son factores que determinan el tipo de modelos a utilizar y su validez. El desarrollo de modelos de predicción clínica fiables y útiles requiere una experiencia previa en la modelización estadística de resultados, tanto crudos como mortalidad o supervivencia, como resultados percibidos por el paciente, y en el tratamiento estadístico de las pérdidas de seguimiento en estudios longitudinales. Además, el éxito real del desarrollo de modelos predictivos reside en su aplicabilidad en la práctica clínica, para lo cual es necesario implementarlos en herramientas informáticas con una interfaz gráfica intuitiva y de fácil uso y manejo, de modo que los resultados se obtengan de forma automática y transparente para el clínico y se puedan utilizar de manera fiable en la toma de decisiones diaria.

En el análisis de la base genética de enfermedades infecciosas de etiología vírica, es importante el desarrollo de herramientas para la detección y análisis de polimorfismos que se puedan usar como marcadores para la progresión de las enfermedades. El análisis de datos y la modelización estadística en este contexto, requiere de un tratamiento de muestras pequeñas, debido a la baja frecuencia de aparición de algunos genes.

La modelización matemática de la historia natural de enfermedades neurológicas mediante modelos estocásticos de simulación con eventos discretos es un tema actual y de gran interés en epidemiología. Conocer cuál es la distribución adecuada para cada variable y calcular sus parámetros a partir de los datos primarios plantea dificultades por la propia naturaleza de la variable. La validez de los modelos depende, no solo de los datos originales, sino de las distribuciones aplicadas y de su parametrización. En este sentido, nuestro trabajo dirigido a la representación matemática de las enfermedades requiere el uso de la estadística para que los modelos cumplan el objetivo de traducir los datos epidemiológicos al lenguaje matemático.

En general, todos los modelos requieren de contrastes de bondad de ajuste y de su estudio específico. En este sentido, los contrastes de estadísticos de divergencia en potencia para la bondad de ajuste y del análisis de sus residuos tienen una especial relevancia porque algunos de los miembros de su familia son contrastes de uso común. Sus usos en Psicología, Agricultura y Biología han justificado su estudio. Algunas de las extensiones que planteamos analizar dentro de esta temática son: a) Modelos multinomiales; b) Tablas de contingencia; c) Distribuciones bivariadas.

Entre las líneas actuales de investigación de este nodo se encuentran:

  • Estudio de las propiedades teóricas, aproximaciones alternativas y utilidad de los modelos antedependientes en el análisis de datos longitudinales, incluyendo propuestas paramétricas, semiparamétricas y bayesianas.
  • Análisis de datos longitudinales con pérdidas de seguimiento no ignorables (MNAR) en el contexto de los modelos antedependientes.
  • Estudio de las propiedades y extensiones del modelo de regresión parcial censurado en el análisis de datos de supervivencia.
  • Propuesta de modelo no paramétrico censurado, comparando técnicas de inferencia clásica y técnicas de remuestreo bootstrap. Estudio de sus propiedades en el análisis de datos de supervivencia.
  • Estudio de la distribución y modelización estadística de resultados percibidos por el paciente, como por ejemplo la calidad de vida relacionada con la salud.  Alternativas metodológicas: regresión lineal múltiple, bootstrap, regresión tobit, regresión ordinal logística y probit,  regresión binomial-logístico-normal y coarsening. Análisis de sensibilidad y propuestas de recodificación.
  • Aplicación de técnicas de suavizado (GAM, p-splines) a modelos aplicados al análisis de resultados como evolución, supervivencia y calidad de vida relacionada con la salud.
  • Desarrollo, implementación y validación de métodos de tratamiento de pérdidas de seguimiento en estudio longitudinales de calidad de vida relacionada con la salud.
  • Desarrollo de modelos predictivos de evolución clínica, mortalidad, supervivencia o cambios en la calidad de vida relacionada con la salud. Creación de herramientas tecnológicas para su empleo en la práctica clínica hospitalaria.
  • Detección de marcadores genéticos para la progresión de enfermedades de etiología vírica mediante métodos de modelización estadística.
  • Modelización matemática de la historia natural de enfermedades neurológicas mediante modelos estocásticos de simulación con eventos discretos.
  • Estudio de  estadísticos de divergencia en potencia en contrastes de bondad de ajuste en contrastes de homogeneidad e independencia en tablas de contingencia y en distribuciones bivariadas o multinomiales total y parcialmente especificadas.

Creemos relevante mencionar que, además de los objetivos metodológicos que hemos mencionado previamente en cada una de las áreas de interés en este nodo, muchos de estos objetivos han surgido como resultado de investigaciones en las distintas áreas de conocimiento que las justifican y que, en nuestra opinión, debe implicar un interés por transferir estos conocimientos a la sociedad en general y a los distintos campos de aplicación de la Bioestadística en particular. Por ello, como objetivos principales nos planteamos:

(a)   Difusión de técnicas estadísticas desarrolladas a través de publicaciones de carácter general o de las que contengan aplicaciones de la metodología propuesta en los distintos campos de la Medicina.

(b)   Difusión de técnicas estadísticas desarrolladas a través de cursos de verano o cursos de carácter general en hospitales o instituciones médicas.

(c)    Organización de jornadas de difusión de técnicas estadísticas desarrolladas orientadas a un público no especializado.

Desarrollo de software que pueda ser utilizado de manera amigable por todos aquellos profesionales de la Medicina y la Biología interesados en la aplicación de las técnicas estadísticas desarrolladas.

Instituciones presentes en el nodo

Actividades de consulting de bioestadística

Varios miembros del equipo investigador tienen firmados convenios de colaboración estables en materia de asesoría en bioestadística con organismos públicos, a saber:

  • Convenio de Colaboración entre el Departamento de Matemática Aplicada y Estadística e Investigación Operativa de la UPV/EHU y el Hospital de Galdakao de Osakidetza-Servicio Vasco de Salud para el asesoramiento en metodología estadística. Desde Enero de 1997 se renueva anualmente (en vigor).

También se han firmado contratos puntuales de apoyo a la investigación en bioestadística a través de la OTRI con diferentes instituciones, a saber:

  • Delegación Territorial de Sanidad de Guipúzcoa
  • LEA ARTIBAI Ikastetxea S. C., Área de Tecnología de los Alimentos
  • Fundación Vasca de Innovación e Investigación Sanitarias (BIOEF)
  • Hospital de Basurto del Servicio Vasco de Salud / Osakidetza
  • Hospital Galdakao-Usansolo del Servicio Vasco de Salud / Osakidetza
  • Hospital de Cruces del Servicio Vasco de Salud / Osakidetza
  • Euskal Estatistika Erakundea / Instituto Vasco de Estadística  EUSTAT.

Además, existen una colaboración activa de los miembros del equipo investigador con grupos de investigación de departamentos de la Universidad del País Vasco (UPV/EHU), mediante la coautoría de los trabajos resultantes, a saber:

  • Genómica y Sanidad Animal.
  • Biología Vegetal y Ecología.
  • Zoología y Biología Celular Animal.
  • Inmunología, Microbiología y Parasitología.
  • Química Analítica.

Finalmente, algunos miembros participan asiduamente en los procesos de selección de personal en el área de bioestadística,  a través de la Fundación Vasca de Innovación e Investigación Sanitarias (BIOEF) o de los hospitales del Servicio Vasco de Salud, y como miembros/asesores de las comisiones de evaluación de la Oferta de Empleo Público realizada por el Servicio Vasco de Salud para la cobertura de plazas de apoyo a la investigación.

Entidades y grupos con los que colabora

Servicio Vasco de Salud / Osakidetza

Fundación Vasca de Innovación e Investigación Sanitarias (BIOEF)

Instituto de Investigación en Servicios de Salud Kronikgune

Basque Center for Applied Mathematics – BCAM

Euskal Estatistika Erakundea / Instituto Vasco de Estadística EUSTAT

Grupo consolidado de investigación “Econometrics Research Group” de la Universidad del País Vasco (UPV/EHU)

Grupo consolidado “Genómica y Sanidad Animal” de la Universidad del País Vasco (UPV/EHU)

Grupo consolidado de investigación en Modelización matemática y estadística aplicada y optimización (MATHMODE) del Gobierno Vasco

Grupo de investigación en Inferencia Bayesiana de la Universidad Nacional de Colombia (Bogotá, Colombia)

Proyecto “Uso de proyectores en la caracterización en el Modelo Lineal General Mixto” financiado por el Consejo Nacional de Ciencia y Tecnología (CONACYT) y promovido por la Universidad Veracruzana (Veracruz, México)

Red de Investigación en Servicios Sanitarios en Enfermedades Crónicas

Red de Investigación en Cronicidad, Atención Primaria y Promoción de la Salud (RICAPPS)

Listado de miembros del nodo

  • Irantzu Barrio Beraza

    Investigador/a principalComité EjecutivoUniversidad del País Vasco UPV/EHU
  • Amaia Bilbao González

    Comité de ConsultoríaHospital Universitario de Basurto
  • Amaia Iparragirre Letamendia

    Universidad del País Vasco UPV/EHU
  • Arantzazu Arrospide Elgarresta

    Hospital Alto Deba
  • Begoña Marina Jugo Orrantia

    Universidad del País Vasco UPV/EHU
  • Cristina Galán García Arcicollar

    Basque Center for Applied Mathematics (BCAM)
  • Diana Pérez Valencia

    Basque Center for Applied Mathematics (BCAM)
  • Dorleta García Rodríguez

    Centro Tecnológico AZTI
  • Inmaculada Arostegui Madariaga

    Universidad del País Vasco UPV/EHU
  • Javier Mar Medina

    Hospital Alto Deba
  • José Maria Quintana López

    Hospital Galdakao-Usansolo
  • Joseph E. Cavanaugh

    The University of Iowa (Estados Unidos)
  • Josu Najera Zuloaga

    Universidad del País Vasco UPV/EHU
  • Leire Citores Martínez

    Centro Tecnológico AZTI
  • Lore Zumeta Olaskoaga

    Basque Center for Applied Mathematics (BCAM)
  • Maider Mateo Abad

    Instituto de Investigación Sanitaria Biodonostia
  • Rolando de la Cruz Mesia

    Universidad Adolfo Ibañez (Chile)
  • Urko Aguirre Larracoechea

    Hospital Galdakao-Usansolo
  • Vicente Núñez Antón

    Universidad del País Vasco UPV/EHU