Cómo anonimizar un PDF en la administración pública: guía paso a paso
Una guía práctica para anonimizar documentos antes de publicarlos: qué datos buscar, por qué el método manual falla y cómo hacerlo de forma fiable y trazable.
Anonimizar un PDF antes de publicarlo parece sencillo, pero la mayoría de los métodos habituales dejan los datos al descubierto. Esta guía recorre el proceso paso a paso, los errores que debes evitar y cómo hacerlo de forma fiable cuando manejas muchos documentos.
Paso 1: Identifica qué datos hay que proteger
Antes de tocar nada, hay que saber qué buscar. En un documento administrativo lo más común es:
- Identificadores: DNI, NIE, pasaporte, número de la Seguridad Social.
- Datos de contacto: nombre, dirección, teléfono, correo electrónico.
- Datos económicos: IBAN, cuentas, importes asociados a una persona.
- Categorías especiales (Art. 9 RGPD): salud, ideología, datos de menores.
- Elementos que se olvidan: firmas manuscritas y sellos CSV o QR de sede, que pueden permitir recuperar el original.
Paso 2: Decide qué NO ocultar
Anonimizar bien no es tacharlo todo. El artículo 15 de la Ley 19/2013 obliga a ponderar el interés público: el nombre y el puesto de un empleado público en el ejercicio de sus funciones, por lo general, no se ocultan, porque forman parte de la rendición de cuentas. Tacharlo iría contra el propio espíritu de la transparencia.
Paso 3: Elimina el dato (no lo tapes)
Aquí es donde fallan los métodos improvisados. Estos no anonimizan:
- Dibujar un rectángulo negro encima: el texto sigue debajo y se copia.
- Poner el texto en blanco o resaltarlo: igual de recuperable.
- "Pixelar" en una herramienta de imagen sin aplanar el documento.
La anonimización real destruye el contenido del archivo en la zona censurada, de modo que ya no se puede seleccionar ni extraer.
Paso 4: Limpia los metadatos
Un PDF guarda metadatos (autor, software, a veces rutas y datos ocultos). Una anonimización completa los elimina, porque también pueden contener información personal.
Paso 5: Deja constancia
Para poder demostrar que cumpliste, conviene conservar un registro de qué se anonimizó y generar un documento final con un hash de integridad, que prueba qué versión exacta se publicó.
El problema del método manual
Para un documento, con calma, se puede hacer a mano. ¿Pero cientos de actas y expedientes al año? La revisión manual no escala y, sobre todo, falla: un DNI en la página 14, una firma al pie, un anexo escaneado sin revisar. Basta un descuido para tener una brecha.
La atención humana no rinde igual en el documento número uno que en el número cien. Y basta con un fallo.
La alternativa: automatizar con control humano
La forma fiable de anonimizar a escala es combinar detección automática con revisión humana. En Gesgocom, la IA localiza todos los datos personales (también en documentos escaneados, gracias al OCR), el funcionario revisa las propuestas sobre el propio PDF y confirma, y la plataforma genera el documento anonimizado con su certificado de cumplimiento. Todo el procesamiento se hace con IA soberana, sin enviar nada a terceros.
Descubre cómo en nuestra página de Anonimización de Datos o solicita una demo.
También te puede interesar
Por qué tachar con un rectángulo negro no es anonimizar (y puede costarte una sanción)
El recuadro negro sobre un PDF casi nunca borra nada: el texto sigue debajo y se puede copiar. Te explicamos por qué eso es una brecha de datos, qué exige la protección de datos al publicar y cómo anonimizar de verdad.
ConceptosQué es la anonimización de documentos (y en qué se diferencia de tacharlos)
Anonimizar no es tapar: es eliminar los datos personales de un documento de forma irreversible. Te explicamos qué es, qué dice el RGPD y por qué es imprescindible antes de publicar en la administración pública.
Temas relacionados
¿Quieres automatizar tu portal de transparencia?
Contacta con nosotros para una demo personalizada de nuestra plataforma. Te mostramos cómo cumplir con la normativa sin esfuerzo.
Solicitar Demo Gratuita