Resumen
Se presenta una propuesta para la digitalización de documentos en soporte de papel del Archivo Nacional, enfocándose en el control de calidad de las imágenes digitalizadas, comprendiendo como se lleva a cabo esta labor actualmente y a partir de ahí se desarrolló el objetivo del trabajo que consiste en la automatización de la actividad de gestión y evaluación de la calidad de las digitalizaciones realizadas, empleando Deep Learning, a través de una herramienta gratuita y fácil manejo. Se desarrolló un modelo de aprendizaje supervisado en la plataforma Teachable Machine, de Google, para clasificar las imágenes digitales en correctas y defectuosas. Con dicha herramienta se obtuvo un 100% de efectividad, ofreciendo un parámetro como punto de partida para conocer la exactitud de este proceso.
ABSTRACT
A proposal is presented for the digitization of paper-based documents from the National Archive, focusing on the quality control of digitized images. This proposal encompasses the current execution of this task and develops the objective of automating the activity of managing and evaluating the quality of the digitizations performed, using Deep Learning through a free and easy-to-use tool. A supervised learning model was developed on Google’s Teachable Machine platform to classify digital images as correct or defective. With this tool, a 100% effectiveness was achieved, providing a benchmark to understand the accuracy of this process.
Citas
Glass, G. y Hopkins, K. (1996). Statistical methods in education and psychology. Englewood Cliffs, New Jersey. Prentice-Hall.
Google Cloud. (2022). TensorFlow.js:Crea tu propia. https://codelabs.developers.google.com/tensorflowjs-transfer-learning-teachable-machine?hl=es-419#0
Hernández, R., Fernández, C. y Baptista, M. (2014). Metodología de la investigación. México: McGraw-Hill. https://www.uca.ac.cr/wp-content/uploads/2017/10/Investigacion.pdf
Junta Administrativa del Archivo Nacional. (2021). Norma Técnica Nacional NTN-003 Digitalización de documentos textuales en soporte papel del 13 de diciembre de 2021. Costa Rica. https://www.archivonacional.go.cr/index.php?option=com_content&view=article&id=142
Larkin, J. (2022). ¿Qué es TensorFlow y para qué sirve? Incentro. https://www.incentro.com/es-ES/blog/que-es-tensorflow
LeViet, K. (2021). Compila e implementa un modelo de detección de objetos personalizado con TensorFlow Lite (Android). https://developers.google.com/codelabs/tflite-object-detection-android?hl=es-419#0
López, K. (2015). Modelo de automatización de procesos para un sistema de gestión a partir de un esquema de documentación basado en Business Process Management (BPM). Universidad & Empresa. 17(29), 131-155. https://www.redalyc.org/articulo.oa?id=187243745006
Teachable Machine. (2017) ¿Qué es Teachable Machine? https://teachablemachine.withgoogle.com/faq
UNESCO. (2021). Noción de preservación digital. https://webarchive.unesco.org/web/20230612012537/https://es.unesco.org/themes/information-preservation/digital-heritage/concept-digital-preservation
Zúñiga Fallas, M. (2023). Automatización del proceso de gestión y evaluación de la calidad de las digitalizaciones realizadas en el Departamento de Conservación de la Dirección General del Archivo Nacional utilizando Deep Learning. [Tesis de maestría]. Universidad de Costa Rica. https://hdl.handle.net/10669/89398