Modelo de regresión binaria con mala clasificación y error de medición tipo Berkson con Distribución t-Student

Autores/as

  • Marcos Antonio Alves Pereira Universidad Federal do Cariri, Céará, Brasil
  • Betsabé Grimalda Blas Achic Universidad Federal de Pernambuco, Pernambuco, Brasil

DOI:

https://doi.org/10.21754/iecos.v24i2.2003

Palabras clave:

Modelo de regresión binaria, error de tipo Berkson, error de clasificación, Distribución t-Student

Resumen

En este artículo, presentamos un modelo de regresión diseñado para ajustar datos binarios afectados por error de clasificación en la variable respuesta y error de medición tipo Berkson en la covariable. La suposición convencional de distribución normal para el error de medición puede representar inadecuadamente observaciones atípicas presentes en el conjunto de datos. Para abordar esta limitación, nuestro modelo incorpora error de clasificación en la variable respuesta y error de medición tipo Berkson, empleando la Distribución t de Student para modelar de manera más robusta estas observaciones atípicas. Utilizamos la función de distribución acumulativa de la distribución t de Student como la función de enlace, mejorando la capacidad para capturar las características únicas del conjunto de datos. Estimamos los parámetros del modelo mediante el método de máxima verosimilitud. Realizamos un estudio exhaustivo de simulación de Monte Carlo para evaluar minuciosamente el impacto de los errores de medición y el error de clasificación. Además, aplicamos el modelo propuesto a un conjunto de datos reales de sobrevivientes del bombardeo atómico en Japón, demostrando su adaptabilidad y adecuación en escenarios prácticos. Nuestros resultados resaltan la robustez y flexibilidad de este modelo en el manejo efectivo de escenarios de regresión binaria complejos que involucran errores de medición y error de clasificación.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Bazán, J. L., Romeo, J. S., & Rodrigues, J. (2014). Bayesian skew-probit regression for binary response data. Brazilian Journal of Probability and Statistics, 28(4), 467-482. https://doi.org/10.1214/13-BJPS218

Bolfarine, H., & Lachos, V. H. (2006). Skew binary regression with measurement errors. Statistics, 40(6), 485-494. https://doi.org/10.1080/02331880600589270

Branco, M. D., & Dey, D. K. (2001). A general class of multivariate skew-elliptical distributions. Journal of Multivariate Analysis, 79(1), 99-113. https://doi.org/10.1006/jmva.2000.1960

Burr, D. (1988). On errors-in-variables in binary regression—Berkson case. Journal of the American Statistical Association, 83(403), 739-743. https://doi.org/10.1080/01621459.1988.10478656

Carroll, R. J., Spiegelman, C. H., Lan, K. G., Bailey, K. T., & Abbott, R. D. (1984). On errors-in-variables for binary regression models. Biometrika, 71(1), 19-25. https://doi.org/10.1093/biomet/71.1.19

Carroll, R. J., Ruppert, D., Stefanski, L. A., & Crainiceanu, C. M. (2006). Measurement error in nonlinear models: a modern perspective. Chapman and Hall/CRC. https://doi.org/10.1201/9781420010138

de Andrade Moral, R., Hinde, J., & Garcia Borges Demétrio, C. (2017). Half-normal plots and overdispersed models in R: the hnp package. Journal of Statistical Software, 81(10). https://doi.org/10.18637/jss.v081.i10

Dunn, P. K., & Smyth, G. K. (1996). Randomized quantile residuals. Journal of Computational and graphical statistics, 5(3), 236-244.

https://doi.org/10.1080/10618600.1996.10474708

Ekholm, A., & Palmgren, J. (1982). A model for a binary response with misclassifications. In GLIM 82: Proceedings of the international conference on generalised linear models (pp. 128-143). Springer New York. https://doi.org/10.1007/978-1-4612-5771-4_13

Kannel, W. B., & Gordon, T. (1968). The Framingham Study: an epidemiological investigation of cardiovascular disease. United States. Department of Health, Education, and Welfare, National Institutes of Health.

Lange, K. L., Little, R. J., & Taylor, J. M. (1989). Robust statistical modeling using the t distribution. Journal of the American Statistical Association, 84(408), 881-896. https://doi.org/10.1080/01621459.1989.10478852

Lin, P. E. (1972). Some characterizations of the multivariate t distribution. Journal of Multivariate Analysis, 2(3), 339-344.

https://doi.org/10.1016/0047-259X(72)90021-8

Liu, H., & Zhang, Z. (2017). Logistic regression with misclassification in binary outcome variables: a method and software. Behaviormetrika, 44(2), 447-476. https://doi.org/10.1007/s41237-017-0031-y

Nash, J. C., & Varadhan, R. (2011). Unifying optimization algorithms to aid software system users: optimx for R. Journal of Statistical Software, 43, 1-14. https://doi.org/10.18637/jss.v043.i09

Pereira, M. A. A., & Russo, C. M. (2019). Nonlinear mixed-effects models with scale mixture of skew-normal distributions. Journal of Applied Statistics, 46(9), 1602-1620. https://doi.org/10.1080/02664763.2018.1557122

R Core Team, R. (2021). R: A language and environment for statistical computing. R Foundation for Statistical Computing.

Roy, S., Banerjee, T., & Maiti, T. (2005). Measurement error model for misclassified binary responses. Statistics in medicine, 24(2), 269-283.

https://doi.org/10.1002/sim.1886

Sposto, R., Preston, D. L., Shimizu, Y., & Mabuchi, K. (1992). The effect of diagnostic misclassification on non-cancer and cancer mortality dose response in A-bomb survivors. Biometrics, 48(2), 605-617. https://www.jstor.org/stable/2532315

Publicado

2023-12-31

Cómo citar

Alves Pereira, M. A., & Blas Achic, B. G. (2023). Modelo de regresión binaria con mala clasificación y error de medición tipo Berkson con Distribución t-Student. Revista IECOS, 61–78. https://doi.org/10.21754/iecos.v24i2.2003

Número

Sección

Artículos de Investigación