Garantía datos sintéticos - Registro
txiki.aranzubi.eus / « volver al hub
Documento público de transparencia. Justifica tecnicamente que la base de datos publicada en txiki.aranzubi.eus esta compuesta exclusivamente por datos ficticios generados de forma aleatoria, y que no contiene ningun dato personal real de ninguna persona física ni de ninguna entidad identificable.
1. Que es esta demo
Aplicación web de demostración comercial del producto TXIKI (sistema de consulta de registros históricos de entrada y salida municipal). Permite a clientes potenciales evaluar la herramienta navegando por una base de datos completamente sintética del municipio ficticio Aranzubi.
2. Identidad del municipio (ficticia)
- Nombre: Aranzubi (no existe)
- Codigo INE: '900' (no asignado)
- Codigo postal: 48999 (no corresponde a ningun CP real)
3. Volumetria sintética
| Tabla | Filas demo |
|---|---|
| registros (entradas + salidas) | 800 (600 E + 200 S) |
| agenda (contactos) | 500 (172 con IBAN) |
| cajas archivo | 3 |
| archivo (asignaciones) | 150 |
| configuración | 2 |
Cobertura cronológica: más de dos décadas (fechas aleatorias).
4. Patron "666" en NIFs y CIFs (garantía visual)
Para hacer visible y trivial de detectar el carácter sintético de los identificadores, todos los DNIs y CIFs de la demo siguen un patron fijo: los 3 digitos anteriores a la letra/DC son siempre "666".
- DNIs (personas): formato
XXXXX666L(5 digitos + 666 fijo + letra mod 23). Ejemplos:11607666A,41266666C,83147666K. - CIFs (organismos): formato
LXXXX666Dcon L = P/Q/V (entidad pública), 4 digitos aleatorios + 666 fijo + DC.
Por que esto refuerza la anonimidad:
- Identificabilidad inmediata: cualquier persona puede comparar al instante con su DNI real; salvo que su DNI termine precisamente en "666" antes de la letra (probabilidad 1 entre 1.000), la pertenencia al conjunto demo es trivial de descartar.
- Espacio reducido 1.000x: de 10^8 a 9×10^4 (90.000 combinaciones posibles).
- Verificable:
SELECT COUNT(*) FROM registros WHERE substr(dni,6,3) != '666'debe devolver 0. - Validez sintactica preservada: los NIFs/CIFs siguen pasando todos los validadores oficiales (la letra/DC se calcula sobre el número completo).
5. Otros valores generados
- Nombres: 60 masculinos + 60 femeninos vascos comunes.
- Apellidos: sublista curada de apellidos vascos sintéticos.
- Direcciones: 38 calles ficticias (mitologia vasca) + portal/piso/puerta aleatorios. CP siempre 48999, poblacion siempre ARANZUBI.
- Telefonos: 40% prefijo '94' + 7 digitos; 60% movil '6' + 8 digitos.
- Asuntos (campo libre): 60 plantillas escritas a mano sin nombres ni direcciones reales, con sustituciones de marcadores controlados.
- Otrotexto: 8 plantillas genericas ("Pendiente respuesta", "Tramitado", etc.).
- Nombrecasa: 10 caserios demo inventados (ARANZUBI BASERRIA, OLENTZERO ETXEA, etc.).
- Departamentos: 12 codigos bilingües '01'-'12'.
- Organismos: 32 entidades demo, todas con sufijo "DEMO" (DIPUTACION FORAL DEMO, GOBIERNO VASCO DEMO, etc.).
- IBANs: entidad 8001-8004 (no asignadas por Banco de España). Validos sintacticamente, no operativos. Bancos: BANCA ARANZUBI DEMO, DEMO CAPITAL BANK, EUSKO DEMO ENTITATEA, DEMO RURAL CAJA.
6. Auditoría automatizada
Auditoría interna con 17 verificaciones de integridad y carácter sintético:
| # | Check | Resultado |
|---|---|---|
| 1 | Volumetria por tabla | OK |
| 2 | DNIs unicos y formato NIF válido | OK (519 unicos) |
| 3-4 | Tuplas (apellido1, apellido2, nombre, fecha) unicas | OK |
| 5 | Top 30 apellidos: solo del diccionario sintético | OK |
| 6 | Direcciones siempre en callejero ficticio Aranzubi | OK |
| 7 | CPs subset {'48999'} | OK |
| 8 | Poblaciones: solo ARANZUBI + organismos DEMO | OK |
| 10 | Telefonos en rango sintético controlado | OK |
| 11 | IBANs subset entidades 8001-8004 (no asignadas) | OK |
| 12-14 | Texto, otrotexto, nombrecasa: solo plantillas sintéticas | OK |
| 16 | FK archivo -> registros y archivo -> cajas | 0 huerfanos |
| 17 | Cadena salidas -> entradas (numreg_origen) | 0 huerfanas |
Resultado consolidado: 17/17 checks OK, 0 ALERTs.
7. Garantías adicionales
7.1 Sin coincidencia con personas reales
- DNIs: 10^8 números × 23 letras = 2.3×10^9 combinaciones; demo genera 800. Probabilidad de colision con cualquier DNI real del orden de 10^-6 por DNI; el patron 666 reduce el espacio efectivo 1.000 veces.
- Personas (nombre + 2 apellidos): 60 nombres × ~145 apellidos × ~145 apellidos = más de un millón de tuplas posibles para las 500 personas demo, todas combinaciones distintas.
- Asuntos: 60 plantillas × ~100 sustituciones por plantilla = 6.000 frases unicas posibles. Sin nombres ni direcciones reales.
7.2 Datos no derivados
Los datos demo se generan desde cero mediante muestreo aleatorio sobre diccionarios estaticos curados. No hay ninguna transformacion (cifrado, hash, anonimizacion, k-anonimato) sobre datos reales pre-existentes. La base sintética no es una versión anonimizada de ninguna otra base de datos.
8. Cumplimiento normativo
Al no contener datos personales reales, la demo:
- No esta sujeta al RGPD (UE 2016/679, art. 4.1; Considerando 26).
- No requiere consentimiento.
- No requiere fichero declarado ante la AEPD.
- No transfiere datos personales a internet.
Documento válido para presentar ante clientes potenciales, reguladores, auditorías internas o externas. Contacto: info@uko.eus. Última actualizacion: 1 de mayo de 2026.
