Repositorio UVigo

New contributions to the identification of groups in non parametric curves

Investigo Repository

New contributions to the identification of groups in non parametric curves

Martínez Villanueva, Nora
 
DATE : 2021-07-27
UNIVERSAL IDENTIFIER : http://hdl.handle.net/11093/2387
UNESCO SUBJECT : 1209.13 Técnicas de Inferencia Estadística ; 1209.06 Métodos de Distribución Libre y no Paramétrica ; 1209 Estadística
DOCUMENT TYPE : doctoralThesis

ABSTRACT :

Several problems in statistical inference can be considered as part of statistical modelling. Thewaytoaboardinferenceproblemsleadstotwodifferentfocus: parametricand nonparametricones. Parametricmodelsrequireassumptionsaboutstructureanddistributional form, unlike nonparametric models in which the model structure is not specified in advance but is instead determined from data. As nonparametric models are flexible, their applicabilityhasgainedincreasingimportanceinwidelydiversefields,suchasmedicine, biology end engineering and their development continue at an active pace today. One of the main goals in nonparametric statistical modelling is to understand the dependence between a response variable and an explanatory variable through regression models. The comparison of these regression models has been widely investigated in the literature. This problem has also been abroad in many longitudinal medical studies in which is interesting to compare survival between patients. However, when the null hypothesis of equality of curves is rejected, ascertaining whether groups of curves can exist ... [+]
Several problems in statistical inference can be considered as part of statistical modelling. Thewaytoaboardinferenceproblemsleadstotwodifferentfocus: parametricand nonparametricones. Parametricmodelsrequireassumptionsaboutstructureanddistributional form, unlike nonparametric models in which the model structure is not specified in advance but is instead determined from data. As nonparametric models are flexible, their applicabilityhasgainedincreasingimportanceinwidelydiversefields,suchasmedicine, biology end engineering and their development continue at an active pace today. One of the main goals in nonparametric statistical modelling is to understand the dependence between a response variable and an explanatory variable through regression models. The comparison of these regression models has been widely investigated in the literature. This problem has also been abroad in many longitudinal medical studies in which is interesting to compare survival between patients. However, when the null hypothesis of equality of curves is rejected, ascertaining whether groups of curves can exist is still a challenge. Thus, the main objective of this dissertation is to determine groups of multiple survival curves and regression curves. Regarding this, a new procedure is presented. Its performance is analysed through simulation studies and it is proved that is able to assign curves to their corresponding groups and to select the optimal number of them. Additionally, the method is illustrated using different real data applications. Finally, with the aim of making these methods available for their usage in real life problems by researchers, developers or stakeholders, an R package (clustcurv v2.0.1) has been developed which is freely available from the CRAN (Comprehensive R Archive Network). [-]
 
Varios problemas de inferencia estadística pueden considerarse como parte del modelado estadístico. La forma de abordar los problemas de inferencia lleva a dos enfoques diferentes: paramétricos y no paramétricos. Los modelos paramétricos requieren suposiciones sobre la estructura y la forma de distribución, a diferencia de los modelos no paramétricos en los que la estructura del modelo no se especifica de antemano, sino que se determina a partir de los datos. Como los modelos no paramétricos son flexibles, su aplicabilidad ha ganado una importancia cada vez mayor en campos muy diversos, como la medicina, la biología y la ingeniería y su desarrollo continúan a un ritmo activo en la actualidad. Uno de los principales objetivos del modelado estadístico no paramétrico es comprender la dependencia entre una variable de respuesta y una variable explicativa a través de modelos de regresión. La comparación de estos modelos de regresión ha sido ampliamente investigada en la literatura. Este problema también ha estado en el exterior en muchos estudios médicos longitudinales en los que es ... [+]
Varios problemas de inferencia estadística pueden considerarse como parte del modelado estadístico. La forma de abordar los problemas de inferencia lleva a dos enfoques diferentes: paramétricos y no paramétricos. Los modelos paramétricos requieren suposiciones sobre la estructura y la forma de distribución, a diferencia de los modelos no paramétricos en los que la estructura del modelo no se especifica de antemano, sino que se determina a partir de los datos. Como los modelos no paramétricos son flexibles, su aplicabilidad ha ganado una importancia cada vez mayor en campos muy diversos, como la medicina, la biología y la ingeniería y su desarrollo continúan a un ritmo activo en la actualidad. Uno de los principales objetivos del modelado estadístico no paramétrico es comprender la dependencia entre una variable de respuesta y una variable explicativa a través de modelos de regresión. La comparación de estos modelos de regresión ha sido ampliamente investigada en la literatura. Este problema también ha estado en el exterior en muchos estudios médicos longitudinales en los que es interesante comparar la supervivencia entre pacientes. Sin embargo, cuando se rechaza la hipótesis nula de igualdad de curvas, determinar si pueden existir grupos de curvas sigue siendo un desafío. Así, el principal objetivo de esta tesis es determinar grupos de múltiples curvas de supervivencia y curvas de regresión. Al respecto, se presenta un nuevo procedimiento. Se analiza su desempeño mediante estudios de simulación y se comprueba que es capaz de asignar curvas a sus grupos correspondientes y seleccionar el número óptimo de ellas. Además, el método se ilustra utilizando diferentes aplicaciones de datos reales. Finalmente, con el objetivo de hacer que estos métodos estén disponibles para su uso en problemas de la vida real por parte de investigadores, desarrolladores o partes interesadas, se ha desarrollado un paquete R (clustcurv v2.0.1) que está disponible gratuitamente en CRAN (Comprehensive R Archive Network) [-]
 
Varios problemas de inferencia estatística poden considerarse como parte do modelado estatístico. O xeito de abordar os problemas de inferencia leva a dous enfoques diferentes: paramétricos e non paramétricos. Os modelos paramétricos requiren suposicións sobre a estrutura e a forma da distribución, a diferenza dos modelos non paramétricos nos que a estrutura do modelo non se especifica previamente, senón que se determina a partir dos datos. Como os modelos non paramétricos son flexibles, a súa aplicabilidade cobrou cada vez máis importancia en campos moi diversos como a medicina, a bioloxía e a enxeñaría, e o seu desenvolvemento continúa a un ritmo activo na actualidade. Un dos obxectivos principais do modelado estatístico non paramétrico é comprender a dependencia entre unha variable de resposta e unha variable explicativa a través de modelos de regresión. A comparación destes modelos de regresión foi amplamente investigada na literatura. Este problema tamén estivo no exterior en moitos estudos médicos lonxitudinais nos que é interesante comparar a supervivencia entre pacientes. ... [+]
Varios problemas de inferencia estatística poden considerarse como parte do modelado estatístico. O xeito de abordar os problemas de inferencia leva a dous enfoques diferentes: paramétricos e non paramétricos. Os modelos paramétricos requiren suposicións sobre a estrutura e a forma da distribución, a diferenza dos modelos non paramétricos nos que a estrutura do modelo non se especifica previamente, senón que se determina a partir dos datos. Como os modelos non paramétricos son flexibles, a súa aplicabilidade cobrou cada vez máis importancia en campos moi diversos como a medicina, a bioloxía e a enxeñaría, e o seu desenvolvemento continúa a un ritmo activo na actualidade. Un dos obxectivos principais do modelado estatístico non paramétrico é comprender a dependencia entre unha variable de resposta e unha variable explicativa a través de modelos de regresión. A comparación destes modelos de regresión foi amplamente investigada na literatura. Este problema tamén estivo no exterior en moitos estudos médicos lonxitudinais nos que é interesante comparar a supervivencia entre pacientes. Non obstante, cando se rexeita a hipótese nula de igualdade de curvas, determinar se poden existir grupos de curvas segue sendo un desafío. Así, o obxectivo principal desta tese é determinar grupos de curvas de supervivencia múltiples e curvas de regresión. A este respecto, preséntase un novo procedemento. O seu rendemento analízase mediante estudos de simulación e compróbase que é capaz de asignar curvas aos seus grupos correspondentes e seleccionar o número óptimo deles. Ademais, o método está ilustrado usando diferentes aplicacións de datos reais. Finalmente, co obxectivo de facer estes métodos dispoñibles para o seu uso en problemas da vida real por investigadores, desenvolvedores ou partes interesadas, desenvolveuse un paquete R (clustcurv v2.0.1) que está dispoñible gratuitamente en CRAN (Comprehensive R Archive Network) [-]

Show full item record



Files in this item

Attribution-NonCommercial-NoDerivatives 4.0 International Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International
2013 Universidade de Vigo, Todos los derechos reservados
Calidad So9001