Análisis de la evolución histórica computacional y de la calidad del código de los modelos climáticos
UNIVERSAL IDENTIFIER: http://hdl.handle.net/11093/7247
UNESCO SUBJECT: 2502 Climatología
DOCUMENT TYPE: doctoralThesis
ABSTRACT
En esta tesis, se lleva a cabo un estudio cualitativo centrado en la reproducibilidad de los modelos climáticos. Para ello, se han usado los modelos pertenecientes al Proyecto de Intercomparación de Modelos Acoplados (CMIP). Para realizar este estudio, el primer paso consistirá en evaluar la accesibilidad del código fuente de estos modelos, con el objetivo de comprender la disponibilidad y la transparencia de la información subyacente. Los modelos climáticos deberían de estar disponibles en repositorios públicos en los que se aseguren su disponibilidad y accesibilidad. Esto es, los datos de entrada del modelo, el propio modelo y los datos de salida del modelo. Adicionalmente a esto se analizan los derechos de uso, copia, distribución y modificación de los modelos, desentrañando las licencias asociadas a cada uno de ellos. En caso de no disponibilidad del código o incumplimiento de los derechos de uso, copia, distribución y modificación, contradiría la definición del método científico.
Por otro lado, otro elemento fundamental de esta tesis es la evaluación de la calidad del código de los modelos climáticos. Se examina la estructuración del código en relación con las buenas prácticas de programación, siguiendo los estándares definidos en ingeniería del software. Esta evaluación se lleva a cabo mediante una herramienta de desarrollo propia denominada FortranAnalyser, la cual ha evolucionado y mejorado continuamente desde su origen como parte integral del Trabajo Fin de Máster (Estudio de la reproducibilidad computacional del CMIP5) que sirvió como prueba de concepto de esta tesis.
Una vez recopilada toda la información esencial se procede a realizar un análisis detallado de la evolución histórica computacional y de la calidad del código a lo largo de todas las fases del CMIP. Este análisis permite visualizar los avances y progresos alcanzados a lo largo de los años, proporcionando una perspectiva valiosa sobre la mejora continua de los modelos climáticos. De este modo se busca contribuir significativamente a la conservación de la trazabilidad de los modelos climáticos y asegurar así la reproducibilidad científica, un
pilar fundamental en investigación. Al hacerlo se facilitará a los futuros investigadores y desarrolladores la comprensión de las tecnologías y metodologías empleadas en el desarrollo de los modelos, así como el funcionamiento intrínseco del código. Este enfoque tiene como propósito adicional fomentar el mantenimiento efectivo del software a lo largo de todo el ciclo de vida del proyecto.
Finalmente se exponen las conclusiones sobre la vanguardia en cuanto a la reproducibilidad de los modelos climáticos. Estas conclusiones no solo serán valiosas para la comunidad científica, sino que también proporcionan orientación y perspectivas esenciales para futuras investigaciones y desarrollos en este campo. Además, también se exponen algunas soluciones con el objetivo de mejorar los niveles de reproducibilidad
y replicabilidad, así como herramientas que ayuden a mejorar todo el ciclo de vida del proyecto, pudiendo ser aplicadas en las futuras fases del CMIP y por supuesto, en otros ámbitos de investigación científica. Neste traballo, realizarase un estudo cualitativo sobre a reproducibilidade dos modelos climáticos. Inicialmente, realizarase unha evaluación da accesibilidade do código fonte dos modelos. A continuación, analizaranse os dereitos de uso, copia, distribución e modificación dos mesmos. Con isto, averiguarase a licenza asociada a cada modelo. Logo, farase unha análise da calidade do código dos modelos, avaliando a correcta estructuración do mesmo en relación ao uso de boas prácticas de programación, tal e como se coñecen no ámbito de enxeñaría do software. Esta avaliación será realizada mediante unha ferramenta de desenvolvemento propio, nada na realización do Traballo Fin de Mestrado (Estudo da reproducibilidade computacional do CMIP5) do que parte iste proxecto, e que ofreceu melloras adicionais ao longo dos últimos anos: FortranAnalyser. Despois, e unha vez obtida toda a información necesaria, poderase realizar unha análise da evolución histórica computacional e da calidade do código dos modelos climáticos ao longo de tódalas fases do CMIP (Proxecto de Intercomparación de Modelos Climáticos) e observar os progresos que se obtiveron ao longo do transcurso dos anos. Con esta tese, contribuirase a conservación dunha trazabilidade dos modelos. Diste xeito, axudarase a futuros desenvolvedores comporender as tecnoloxías e metodoloxías usadas, funcionamento do código… para favorecer o mantemento do software ao longo de todo o ciclo de vida do proxecto. Adicionalmente, poderanse obter unhas conclusións correctamente xustificadas sobre o estado do arte. This thesis presents a qualitative study focused on the reproducibility of climate models is conducted. To achieve this, models belonging to the Coupled Model Intercomparison Project (CMIP) have been used. The first step in this study involves assessing the accessibility of the source code of these models, aiming to understand the availability and transparency of the underlying information. Climate models should be available in public repositories that ensure their availability and accessibility, including the model’s input data, the model itself, and the output data produced by the model. Additionally, rights for use, copy, distribution, and modification of the models are analyzed, unraveling the licenses associated with each of them. Lack of code availability and/or non-compliance with usage rights would contradict the definition of the scientific method.
Another fundamental element of this thesis is the evaluation of thequality of the code of climate models. The code structure is examined in relation to programming best practices, following standards defined in software engineering. This evaluation is carried out using a custom developed tool, FortranAnalyser, which has evolved and improved continuously since its inception as part of the Master’s Thesis (Study of the computational reproducibility of CMIP5), serving as a proof of concept for this thesis.
Once all essential information is gathered, a detailed analysis of the computational and code quality historical evolution throughout all the CMIP phases is conducted. This analysis allows to check the advances and progress made over the years, providing valuable insight into the continuous improvement of climate models. The aim is to significantly contribute to the preservation of the traceability of climate models and thus ensure scientific reproducibility, a fundamental pillar in research. By doing so, future researchers and developers will be able to better understand the technologies and methodologies used in model development, as well as the intrinsic functioning of the code. This approach also aims to promote effective software maintenance throughout the entire project lifecycle.
Finally, conclusions are presented regarding the current state of the art in terms of the reproducibility of climate models. These conclusions are not only valuable for the scientific community but also provide essential guidance and perspectives for future research and developments in this field. Additionally, some solutions are proposed to enhance reproducibility and replicability levels, along with tools to improve the entire
project lifecycle. These can be applied in future phases of CMIP and, of course, in other areas of scientific research.