Radiografía de la digitalización del patrimonio bibliográfico en España

3 febrero, 2026 at 07:33

El patrimonio bibliográfico es memoria, investigación, identidad local y también futuro. Digitalizarlo significa abrir puertas para que una persona en un pueblo, un aula o un centro de investigación pueda llegar a manuscritos, incunables, impresos antiguos, prensa histórica, carteles o materiales sonoros sin depender de la distancia. Pero la digitalización no ocurre por inercia; requiere decisiones, recursos y coordinación entre instituciones. Por eso, contar con una fotografía del momento en el que estamos ayuda a priorizar, evitar duplicidades y detectar lo que aún no ha llegado al mundo digital. Y no se trata solo de escanear: también hay que describir, publicar y asegurar que ese acceso se mantenga con el tiempo.

Del papel al acceso digital del patrimonio bibliográfico

El Grupo de Trabajo para la Estrategia Nacional de Digitalización del Consejo de Cooperación Bibliotecaria ha publicado el «Informe sobre la digitalización del patrimonio bibliográfico en España». Su labor se enmarca en la Estrategia Nacional de Digitalización 2022-2026 y parte de una idea muy práctica: mejorar la recogida de datos para conocer con precisión la situación del país y orientar planes y proyectos. El informe nace de la necesidad de conocer el estado actual, detectar lagunas en contenidos, lenguas y tipologías, y coordinar esfuerzos en digitalización, acceso en línea y preservación a largo plazo. Con ese enfoque, el documento no se queda en lo declarativo, sino que intenta ordenar el terreno para que las decisiones futuras se apoyen en información comparable, sin perder de vista que cada tipo de biblioteca trabaja con realidades muy distintas.

El informe combina dos encuestas (a bibliotecas e instituciones, y a bibliotecas digitales y repositorios) con una fase de depuración y ampliación de datos para evitar duplicidades y completar lo que no llega por cuestionario. En la encuesta a bibliotecas digitales se enviaron 400 cuestionarios entre octubre de 2024 y febrero de 2025 y se recibieron 48 respuestas (12 %). A partir de ahí, el trabajo se alimenta también de fuentes ya conocidas por el sector, como Hispana, las bibliotecas virtuales del Ministerio de Cultura y otros repertorios, además de información procedente de ayudas a la digitalización y de la revisión de webs de proyectos. El resultado no es un ranking ni una «foto bonita»: es un mapa de situación pensado para decidir mejor qué digitalizar, cómo difundirlo y cómo cuidarlo.

Una foto con datos sobre participación, avances y desigualdades en la digitalización

Para empezar, el informe deja claro el reto de medir bien. Los cuestionarios a bibliotecas e instituciones se enviaron a más de 7.600 centros y se recibieron 396 respuestas, un 5,18 % del total. Puede parecer poco, pero el documento recuerda un matiz importante, y es que no todas las bibliotecas conservan patrimonio bibliográfico, y aun así están representadas todas las tipologías. Además, hay pistas que ayudan a leer el dato con justicia: en universidades respondieron bibliotecas centrales de 29 de las 50 universidades públicas, lo que eleva la representatividad real de ese bloque. Y hay otra idea que conviene incorporar: el informe explica que, a veces, las instituciones no separan con claridad patrimonio y no patrimonio al digitalizar, o mezclan en bibliotecas digitales materiales de distinta naturaleza, lo que complica medir con precisión y obliga a interpretar los resultados con cuidado.

Cuando miramos cuánto se ha digitalizado, el mapa es desigual y, justo por eso, valioso. La mayor parte de las colecciones digitalizadas por biblioteca se mueve en cifras pequeñas (hasta mil obras), y solo siete bibliotecas declaran superar las cien mil. Si lo comparamos con el fondo patrimonial que se conserva en cada institución, el contraste es aún más claro: la mayoría sitúa lo digitalizado alrededor del 10 %, y solo cuatro bibliotecas dicen estar entre el 91 % y el 100 %. Es una señal de que todavía queda mucho por planificar, financiar y sostener en el tiempo. También es una invitación a mirar hacia dentro y preguntarse qué colecciones de especial interés siguen esperando su turno, y si la selección se está haciendo con criterios compartidos o con urgencias puntuales.

También conviene mirar el marco legal y de acceso, porque condiciona el uso social de lo digitalizado. En bibliotecas digitales analizadas, el predominio del dominio público es notable: el 81 % de las obras digitalizadas se sitúa en ese marco, frente a un 19 % con derechos. Y en bibliotecas físicas que difunden digitalizaciones, el acceso abierto es mayoritario: 139 bibliotecas (85 %) disponen o participan en una biblioteca digital abierta. Estos datos dibujan una oportunidad clara: si hay mucho material en dominio público y mucho acceso abierto, el siguiente salto está en mejorar visibilidad, reutilización y consistencia de servicios. Ahí no solo importa el «acceso», también importa cómo se declaran licencias y condiciones de reutilización, porque es lo que convierte una colección digital en un recurso realmente utilizable por investigación, docencia y proyectos culturales.

Software y metadatos que dan visibilidad al patrimonio bibliográfico en internet

Si la digitalización es el «qué», la difusión es el «para quién». La infraestructura que permite que los contenidos viajen y se integren en portales nacionales e internacionales marca la diferencia. En bibliotecas físicas, un 67 % afirma disponer de repositorio OAI-PMH, mientras que un 33 % no usa este protocolo, incluso cuando su biblioteca digital es abierta. En el análisis ampliado a bibliotecas digitales y repositorios, el dato es más alto: de 211 bibliotecas digitales analizadas, 198 (94 %) cuentan con OAI-PMH, lo que facilita la recolección por Hispana y la proyección hacia Europeana. Y el informe pone números a esa visibilidad: de 234 bibliotecas digitales con datos, 214 forman parte de Hispana y, dentro de ellas, 108 participan también en Europeana. Es decir, no se trata solo de publicar, sino de estar donde la gente busca.

Aquí la tecnología tiene mucho que decir, y el informe lo aterriza con nombres y porcentajes. En bibliotecas físicas, dos soluciones aparecen con el mismo peso en la gestión de objetos digitales: Digibib y DSpace, usadas por 27 bibliotecas cada una. En la muestra ampliada de 157 bibliotecas digitales, DSpace es la más utilizada (59 bibliotecas, 37,6 %) y Digibib se mantiene con fuerza (34 bibliotecas, 22,3 %). Que una parte importante del ecosistema se apoye en estas plataformas ayuda a entender por dónde pasan muchos flujos reales de trabajo. También señala un terreno donde es más fácil impulsar mejoras compartidas: interoperabilidad, parametrización, formación y prácticas replicables, especialmente en lo que afecta a publicación, metadatos y recolección.

Hay otro mensaje igual de práctico: no basta con tener repositorio, hay que saber qué está haciendo el repositorio. El informe observa que Dublin Core es el formato de metadatos más utilizado, pero detecta una discrepancia llamativa: solo 69 bibliotecas declaran usarlo cuando 198 indican disponer de repositorio OAI-PMH. La lectura que propone es directa: puede haber desconocimiento sobre los formatos que genera o soporta el sistema, o sobre cómo se expone la información para su recolección. Aun así, se ve diversidad: junto a Dublin Core aparecen MARC21, METS, MODS o PREMIS, y también se menciona EDM, esencial para participar en Europeana. Estos hallazgos no «señalan», ayudan: apuntan justo a los sitios donde una revisión técnica o una sesión de formación puede mejorar mucho la visibilidad sin necesidad de digitalizar una sola página más.

Qué se hace para preservar y cuánto patrimonio está descrito en el CCPB

Difundir es imprescindible, pero si pensamos a largo plazo la preservación es lo que garantiza que lo digitalizado no se pierda con el tiempo. En las bibliotecas que responden, la práctica más habitual es mantener varias copias de los archivos en distintos soportes: 58 bibliotecas lo indican, lo que equivale al 57 % de quienes afirman aplicar medidas de preservación. Además, muchas combinan más de una estrategia, por eso el número de respuestas puede ser mayor que el de instituciones. Junto a estas copias, el informe recoge el uso de software de preservación proporcionado por terceros, donde se menciona Digibib como una de las soluciones empleadas. También se cita AbsysNet en el apartado de otras herramientas, lo que refuerza una idea sencilla: la preservación suele apoyarse en varios sistemas que deben trabajar de forma coordinada.

El informe también aterriza la preservación en decisiones concretas: formatos y calidad. Entre bibliotecas con datos de preservación, TIFF aparece como formato predominante y, en cambio, se advierte que JPEG no es adecuado «en general» para preservar porque se usa para difusión, y su presencia puede indicar sistemas deficientes o desconocimiento. Esta observación no busca señalar a nadie: marca un punto de mejora real. En paralelo, el informe muestra también qué formatos se usan para difundir: PDF y JPEG dominan (y además suelen convivir), seguidos a distancia por MP3 y MP4, lo que encaja con un tipo de digitalización centrada sobre todo en materiales textuales, pero con presencia de audio y vídeo. Y hay un dato que afecta directamente a la experiencia de uso: 96 bibliotecas (69 %) indican que ofrecen OCR para búsquedas a texto completo, lo que deja claro que aún hay un margen importante para mejorar acceso y búsqueda en una parte de las colecciones.

Y para entender el tamaño real del reto, conviene mirar el patrimonio descrito, aunque todavía no esté digitalizado. El Catálogo Colectivo del Patrimonio Bibliográfico es una referencia esencial: con datos de 2025, reúne fondos patrimoniales catalogados de 888 bibliotecas o entidades, que suman 3.850.162 ejemplares. Además, permite ver quién concentra ese volumen: las bibliotecas dependientes de la Iglesia reúnen 1.081.913 ejemplares, y el catálogo también refleja el peso de instituciones estatales y de centros de titularidad estatal gestionados por comunidades autónomas. A nivel territorial, la Comunidad de Madrid concentra 1.196.506 ejemplares, un 31 % del total. Y el informe baja a tipologías con una tabla muy interesante: predominan las monografías impresas del siglo XIX y del siglo XX hasta 1958, con presencia relevante de música notada y manuscritos modernos, mientras que cartografía, material gráfico y grabaciones sonoras aparecen con cifras mucho menores. Estos números no son una meta cerrada, son un recordatorio: el trabajo bibliotecario ya sostiene un patrimonio enorme y la digitalización, para estar a la altura, necesita continuidad, colaboración y prioridades compartidas.