Propuesta para la automatización de la evaluación de calidad de digitalizaciones del patrimonio documental usando un modelo de Deep Learning
PDF
HTML

Palabras clave

Teachable Machine
aprendizaje profundo
automatización
control de calidad
digitalización
Deep Learning
Automation
Quality Control
Digitization

Cómo citar

Zúñiga Fallas, M. (2024). Propuesta para la automatización de la evaluación de calidad de digitalizaciones del patrimonio documental usando un modelo de Deep Learning. Revista Del Archivo Nacional, 88, e614. Recuperado a partir de https://www.dgan.go.cr/RAN/index.php/RAN/article/view/614

Resumen

Se presenta una propuesta para la digitalización de documentos en soporte de papel del Archivo Nacional, enfocándose en el control de calidad de las imágenes digitalizadas, comprendiendo como se lleva a cabo esta labor actualmente y a partir de ahí se desarrolló el objetivo del trabajo que consiste en la automatización de la actividad de gestión y evaluación de la calidad de las digitalizaciones realizadas, empleando Deep Learning, a través de una herramienta gratuita y fácil manejo. Se desarrolló un modelo de aprendizaje supervisado en la plataforma Teachable Machine, de Google, para clasificar las imágenes digitales en correctas y defectuosas. Con dicha herramienta se obtuvo un 100% de efectividad, ofreciendo un parámetro como punto de partida para conocer la exactitud de este proceso.

ABSTRACT

A proposal is presented for the digitization of paper-based documents from the National Archive, focusing on the quality control of digitized images. This proposal encompasses the current execution of this task and develops the objective of automating the activity of managing and evaluating the quality of the digitizations performed, using Deep Learning through a free and easy-to-use tool. A supervised learning model was developed on Google’s Teachable Machine platform to classify digital images as correct or defective. With this tool, a 100% effectiveness was achieved, providing a benchmark to understand the accuracy of this process.

PDF
HTML

Citas

Glass, G. y Hopkins, K. (1996). Statistical methods in education and psychology. Englewood Cliffs, New Jersey. Prentice-Hall.

Google Cloud. (2022). TensorFlow.js:Crea tu propia. https://codelabs.developers.google.com/tensorflowjs-transfer-learning-teachable-machine?hl=es-419#0

Hernández, R., Fernández, C. y Baptista, M. (2014). Metodología de la investigación. México: McGraw-Hill. https://www.uca.ac.cr/wp-content/uploads/2017/10/Investigacion.pdf

Junta Administrativa del Archivo Nacional. (2021). Norma Técnica Nacional NTN-003 Digitalización de documentos textuales en soporte papel del 13 de diciembre de 2021. Costa Rica. https://www.archivonacional.go.cr/index.php?option=com_content&view=article&id=142

Larkin, J. (2022). ¿Qué es TensorFlow y para qué sirve? Incentro. https://www.incentro.com/es-ES/blog/que-es-tensorflow

LeViet, K. (2021). Compila e implementa un modelo de detección de objetos personalizado con TensorFlow Lite (Android). https://developers.google.com/codelabs/tflite-object-detection-android?hl=es-419#0

López, K. (2015). Modelo de automatización de procesos para un sistema de gestión a partir de un esquema de documentación basado en Business Process Management (BPM). Universidad & Empresa. 17(29), 131-155. https://www.redalyc.org/articulo.oa?id=187243745006

Teachable Machine. (2017) ¿Qué es Teachable Machine? https://teachablemachine.withgoogle.com/faq

UNESCO. (2021). Noción de preservación digital. https://webarchive.unesco.org/web/20230612012537/https://es.unesco.org/themes/information-preservation/digital-heritage/concept-digital-preservation

Zúñiga Fallas, M. (2023). Automatización del proceso de gestión y evaluación de la calidad de las digitalizaciones realizadas en el Departamento de Conservación de la Dirección General del Archivo Nacional utilizando Deep Learning. [Tesis de maestría]. Universidad de Costa Rica. https://hdl.handle.net/10669/89398

Descargas

Los datos de descargas todavía no están disponibles.