Selección de modelos anidados para datos longitudinales usando criterios de información y la estrategia de ajuste condicional

  1. Vallejo Seco, Guillermo 1
  2. Arnau Gras, Jaume
  3. Bono Cabré, Roser
  4. Fernández García, Paula 1
  1. 1 Universidad de Oviedo
    info

    Universidad de Oviedo

    Oviedo, España

    ROR https://ror.org/006gksa02

Revista:
Psicothema

ISSN: 0214-9915

Año de publicación: 2010

Volumen: 22

Número: 2

Páginas: 323-333

Tipo: Artículo

Otras publicaciones en: Psicothema

Resumen

Un marco teórico potente resulta clave para especificar el modelo mixto que explica mejor la variabilidad de datos longitudinales. A falta de teoría, la mayoría de las investigaciones realizadas hasta la fecha, se ha centrado en ajustar la matriz de dispersión usando criterios de selección de modelos para elegir entre estructuras de covarianza no anidadas. En este trabajo, comparamos el desempeño del estadístico razón de verosimilitud (LRT) condicional y de varias versiones de los criterios de información para seleccionar estructuras de medias y/o de covarianzas anidadas, asumiendo conocido el verdadero proceso generador de datos. Los resultados numéricos indican que los criterios de información eficientes funcionaban mejor que sus homólogos consistentes cuando las matrices de dispersión usadas en la generación eran complejas y peor cuando eran simples. Globalmente, el desempeño del LRT condicional basado en el estimador de máxima verosimilitud completa (FML) era superior al resto de los criterios examinados. Sin embargo, el desempeño era inferior cuando se basaba en el estimador máxima verosimilitud restringida (REML). También encontramos que la estrategia sugerida en la literatura estadística de usar el estimador REML para seleccionar la estructura de covarianza y el estimador FML para seleccionar la estructura de medias debería ser evitada.

Referencias bibliográficas

  • Ato, M., & Vallejo, G. (2007). Diseños experimentales en Psicología. Madrid: Pirámide.
  • Claeskens, G., y Hjort, N.L. (2008). Model Selection and Model Averaging. New York: Cambridge University Press.
  • Dayton, C.M. (2003). Model comparisons using information measures. Journal of Modern Applied Statistical Methods, 2, 281-292.
  • Feng, R., Zhou, G., Zhang, M., y Zhang, H. (2009). Analysis of Twin Data Using SAS. Biometrics, Epub 2008 July 21 [PMID: 18647295].
  • Ferron, J., Dailey, R., y Yi, Q. (2002). Effects of misspecifying the first-level error structure in two-level models of change. Multivariate Behavioral Research, 37, 379-403.
  • Fitzmaurice, G.M., Laird, N.M., y Ware, J.H. (2004). Applied Longitudinal Analysis. Hoboken, NJ: John Wiley.
  • Gómez, V.E., Schaalje, G.B., y Fellingham, G.W. (2005). Performance of the Kenward-Roger method when the covariance structure is selected using AIC and BIC. Communications in Statistics Simulation and Computation, 34, 377-392.
  • Gurka, M.J., y Edwards, L.J. (2008). Mixed models. En C.R. Rao, J.P. Miller y D.C. Rao (Eds.): Handbook of Statistics, vol. 27, Epidemiological and Medical Statistics (pp. 253-280). New York: Elsevier Science.
  • Gurka, M.J. (2006). Selecting the best linear mixed model under REML. The American Statistician, 60, 19-26.
  • Kowalchuk, R.K., y Headrick, T.C. (2009). Simulating multivariate g-andh distributions. British Journal of Mathematical and Statistical Psychology. DOI:10.1348/000711009X42 3067.
  • Hedeker, D., y Gibbons, R.D. (2006). Longitudinal Data Analysis. Hoboken, NJ: John Wiley.
  • Keselman, H.J., Algina, J., Kowalchuk, R.K., y Wolfinger, R.D. (1998). A comparison of two approaches for selecting covariance structures in the analysis of repeated measurements. Communications in Statistics-Simulation and Computation, 27, 591-604.
  • Kreft, I.G., y de Leeuw, J. (1998). Introducing Multilevel Modeling. Thousand Oaks, CA: Sage.
  • Lee, H., y Ghosh, S.K. (2009). Performance of information criteria for spatial models. Journal of Statistical Computation and Simulation, 79, 93-106.
  • Liang, H., Wu, H., y Zou, G. (2008). A note on conditional AIC for linear mixed-effects models. Biometrika, 95, 773-778.
  • Littell, R.C., Milliken, G.A., Stroup, W.W., Wolfinger, R.D., y Schabenberger, O. (2006). SAS System for Mixed Models. 2nd edition. Cary, NC: SAS Institute Inc.
  • Littell, R.C., Pendergast, J., y Natarajan, R. (2000). Modelling covariance structure in the analysis of repeated measures data. Statistics in Medi-cine, 19, 1793-1819.
  • Micceri, T. (1989). The unicorn, the normal curve and other improbable creatures. Psychological Bulletin, 92, 778-785.
  • Molenberghs, G., y Verbeke, G. (2001). A review on linear mixed models for longitudinal data, possibly subject to dropout. Statistical Modelling, 1, 235-269.
  • Orelien, J.G. y Edwards, L.J. (2007). Fixed-effect variable selection in linear mixed models using R2 statistics. Computational Statistics & Data Analysis, 52, 1896-1907.
  • SAS Institute Inc. (2008). SAS/STAT® Software: Version 9.2. SAS Institute Inc., Cary, NC.
  • Schabenberger, O. (2004). Mixed model influence diagnostics. Proceedings of the Twenty-Ninth Annual SAS Users Group International Conference. Cary, NC: SAS Institute Inc., Paper 189-29.
  • Singer, D.J., y Willet, J.B. (2003). Applied Longitudinal Data Analysis. New York: Oxford University Press. SPSS for Windows (2008). Version 17, SPSS Inc., IL: Chicago.
  • Tukey, J.W. (1977). Modern techniques in data analysis. NSF-sponsored regional research conference at Southern Massachusetts University (North Dartmouth, MA).
  • Vaida, F., y Blanchard, S. (2005). Conditional Akaike information for mixed-effects models. Biometrika, 92, 351-370.
  • Vallejo, G., Arnau, J., y Bono, R. (2008a). Construcción de modelos jerárquicos en contextos aplicados. Psicothema, 20, 830-838.
  • Vallejo, G., Ato, M., y Valdés, T. (2008b). Consequences of misspecifying the error covariance structure in linear mixed models for longitudinal data. Methodology, 4, 10-21.
  • Vallejo, G., Fernández, P., Herrero, J., y Conejo, N. (2004). Alternative procedures for testing fixed effects in repeated measures designs when assumptions are violated. Psicothema, 16, 498-508.
  • Vonesh, E.F., Chinchilli, V.M., y Pu, K. (1996). Goodness-of-Fit in generalized nonlinear mixed-effects models. Biometrics, 52, 575-587.
  • Wang, J., y Schaalje, G.B. (2009). Model selection for linear mixed models using predictive criteria. Communications in Statistics Simulation and Computation, 38, 788-801.
  • Zimmerman, D.L., y Núñez-Antón, V. (2009). Antedependence Models for Longitudinal Data. London: Chapman & Hall/CRC.