Por qué tachar con un rectángulo negro no es anonimizar (y puede costarte una sanción)
El recuadro negro sobre un PDF casi nunca borra nada: el texto sigue debajo y se puede copiar. Te explicamos por qué eso es una brecha de datos, qué exige la protección de datos al publicar y cómo anonimizar de verdad.
La escena se repite en miles de administraciones: hay que publicar un acta de pleno, una resolución o un expediente, pero contiene un DNI, el nombre de un vecino o un dato de salud. La solución improvisada llega rápido: se abre el PDF, se dibuja un rectángulo negro encima del dato y se sube al portal. Problema resuelto, ¿verdad?
Casi nunca.
Ese recuadro negro es, en la mayoría de los casos, una capa de pintura sobre un cristal: tapa el dato a la vista, pero el texto sigue intacto debajo. Y cualquiera puede recuperarlo. En este artículo te explicamos por qué tachar no es anonimizar, qué te exige la normativa de protección de datos antes de publicar y cómo hacerlo de verdad.
El rectángulo negro miente
Un PDF tiene dos planos: lo que se ve y lo que contiene. Cuando dibujas una caja negra con el visor de turno, estás añadiendo un objeto gráfico encima del texto, pero no estás borrando ese texto del archivo.
¿El resultado? Recuperar el dato "oculto" es trivial:
- Seleccionar todo el documento (Ctrl+A) y copiarlo a un bloc de notas: el texto de debajo aparece.
- Extraer el texto del PDF con cualquier herramienta gratuita.
- En ocasiones, simplemente mover o borrar el recuadro, porque es un objeto independiente.
Si el dato se puede copiar, no está anonimizado. Está escondido. Y esconder no es proteger.
Lo mismo ocurre con otros atajos habituales: cambiar el color del texto a blanco, poner un resaltado encima o "pixelar" una zona en una herramienta de imagen sin aplanar el documento. Todos dejan el rastro recuperable.
Esto no es un detalle técnico: es una brecha de datos
Publicar un documento del que se pueden extraer datos personales es una divulgación no autorizada de información personal. En términos del Reglamento General de Protección de Datos (RGPD) y de la LOPDGDD (Ley Orgánica 3/2018), eso es una brecha de seguridad.
Y no es teórico. La Agencia Española de Protección de Datos (AEPD) ha tramitado numerosos procedimientos contra entidades del sector público por publicar boletines, actas o resoluciones con datos personales visibles o recuperables. Las consecuencias van desde el apercibimiento hasta la obligación de retirar y rehacer las publicaciones, pasando por el daño reputacional de tener que reconocer públicamente el incidente.
El agravante es que la transparencia obliga a publicar mucho —y de forma proactiva—, así que el volumen de documentos expuestos al error es enorme. Cada acta de pleno, cada listado de subvenciones y cada contrato es una oportunidad de que un dato se escape.
¿Qué hay que proteger y qué no? El criterio del artículo 15
Anonimizar bien no es tachar todo lo que parezca un nombre. La clave está en el artículo 15 de la Ley 19/2013 de Transparencia, que obliga a ponderar el interés público de la información frente a la protección de los datos personales. En la práctica, esto significa distinguir:
El ciudadano (se protege)
Los datos de una persona particular que aparece en un expediente —un solicitante, un tercero afectado, un denunciante— deben anonimizarse. Su nombre, DNI, dirección, teléfono o cuenta bancaria no son de interés público.
El empleado público en ejercicio (normalmente no)
El nombre y el puesto de un cargo o empleado público actuando en el ejercicio de sus funciones forma parte de la rendición de cuentas. Tacharlo iría, de hecho, contra el espíritu de la transparencia.
Las categorías especiales (máxima cautela)
Los datos del artículo 9 del RGPD —salud, ideología, religión, orientación sexual, datos de menores— tienen una protección reforzada. Aquí el criterio es de máxima prudencia.
A esto se suman elementos fáciles de olvidar: firmas manuscritas, y los códigos seguros de verificación (CSV) y QR de sede electrónica, que pueden permitir recuperar el documento original sin censurar y reidentificar a las personas.
Anonimizar de verdad: destruir, no tapar
La anonimización correcta no añade una capa encima: elimina el contenido del archivo. El texto bajo la zona censurada deja de existir, no se puede copiar ni extraer porque ya no está. Además, una anonimización seria:
- Borra los metadatos del documento, que a menudo contienen autores, rutas y datos ocultos.
- Genera un documento nuevo con un hash de integridad, para poder demostrar qué se publicó exactamente.
- Deja trazabilidad: qué se ocultó, quién lo aprobó y cuándo, por si llega una inspección o un requerimiento.
Esa es la diferencia entre "parece tachado" y "está protegido".
Hacerlo a mano no escala
Un documento, con calma, se puede revisar bien a mano. ¿Pero cientos de actas, expedientes y resoluciones al año? Ahí la revisión manual se convierte en horas interminables y, sobre todo, en errores: un DNI en la página 14 que nadie vio, una firma al pie que se quedó, un anexo que se publicó sin tocar.
El problema no es la falta de cuidado del personal, es que la atención humana no rinde igual en el documento número uno que en el cien. Y basta con un fallo para tener una brecha.
Cómo lo resolvemos en Gesgocom
Por eso desarrollamos una plataforma de anonimización documental pensada para la administración pública, que combina automatización y criterio humano:
- Detección con IA soberana: localiza DNI, nombres, teléfonos, cuentas, matrículas, datos del artículo 9, firmas y sellos CSV. Todo el procesamiento se queda en infraestructura propia; los datos nunca se envían a servicios de terceros como ChatGPT o Gemini.
- Revisión humana: la IA propone y el funcionario decide sobre el propio documento, con la última palabra siempre del lado de la persona.
- Censura real e irreversible: se destruye el contenido, se eliminan los metadatos y se calcula un hash de integridad.
- Certificado de cumplimiento: cada documento genera su justificante LOPDGDD/RGPD y queda en la auditoría.
Es, además, el paso natural antes de publicar en el portal de transparencia: primero anonimizas, después publicas. Mismo flujo, mismas garantías.
La transparencia consiste en enseñar lo que es de interés público, no en exponer a las personas. Anonimizar bien es lo que hace posible publicar con tranquilidad.
Si en tu administración todavía se tacha a mano —o con un rectángulo negro— antes de publicar, solicita una demo y te enseñamos cómo anonimizar tus documentos en minutos, con todas las garantías legales.
También te puede interesar
Qué es la anonimización de documentos (y en qué se diferencia de tacharlos)
Anonimizar no es tapar: es eliminar los datos personales de un documento de forma irreversible. Te explicamos qué es, qué dice el RGPD y por qué es imprescindible antes de publicar en la administración pública.
GuíasCómo anonimizar un PDF en la administración pública: guía paso a paso
Una guía práctica para anonimizar documentos antes de publicarlos: qué datos buscar, por qué el método manual falla y cómo hacerlo de forma fiable y trazable.
Temas relacionados
¿Quieres anonimizar tus documentos sin riesgos?
Contacta con nosotros para una demo de nuestra plataforma de anonimización. Te enseñamos a eliminar datos personales de tus documentos en minutos, con todas las garantías legales.
Solicitar Demo Gratuita