Garantia datos sinteticos - Contabilidad
konta.aranzubi.eus / « volver al hub
Documento publico de transparencia. Justifica tecnicamente que la base de datos publicada en konta.aranzubi.eus esta compuesta exclusivamente por datos ficticios generados de forma aleatoria, y que no contiene ningun dato personal real de ningun proveedor, persona fisica, factura, mandamiento o cuenta bancaria identificable.
1. Que es esta demo
Aplicacion web de demostracion comercial del producto KONTA (sistema de consulta de contabilidad publica historica municipal). Cubre 21 ejercicios fiscales (1994-2014) distribuidos entre dos sistemas contables: el primero (1994-2000, pesetas) y el segundo (2001-2014, euros).
2. Datos publicos por ley vs. PII a sintetizar
KONTA opera sobre informacion contable municipal cuya publicidad esta obligada por:
- Ley 19/2013 de transparencia, acceso a la informacion publica y buen gobierno (arts. 6, 7 y 8).
- Ley 7/1985 reguladora de las Bases del Regimen Local.
- Real Decreto 500/1990 y Orden HAP/1781/2013 (estructura presupuestaria y plan general de cuentas publicas locales).
En consecuencia, los importes presupuestarios y de ejecucion son datos publicos, sinteticos en la demo (distribuciones lognormales plausibles). Las clasificaciones funcional y economica (codigos MINHAP/PGC) son codigos oficiales del BOE y se incorporan como catalogo oficial reusable. Todo lo demas (identidad de terceros, IBANs, numeros de factura/cheque, descripciones) es PII y se sintetiza desde cero.
3. Volumetria sintetica
71 tablas, ~23.000 filas sinteticas. BD konta_demo.db ~3.8 MB.
| Tabla | Filas |
|---|---|
| ejercicios | 21 |
| terceros | 150 |
| cuentas_bancarias | 80 |
| operaciones | 2.500 |
| diario_gastos | 2.500 |
| diario_ingresos | 1.500 |
| mandamientos | 3.000 |
| pagos_detalle | 2.500 |
| operaciones_pago | 1.500 |
| gastos_por_tercero | 1.000 |
| resumen_terceros | 800 |
| movimientos_nopres | 1.200 |
| mayor_diario | 948 |
| clasificaciones (publicas BOE) | 3.474 |
| Resto tablas auxiliares (~50) | vacias o <500 |
4. Patron "666" en NIFs y CIFs (garantia visual)
Para hacer visible y trivial de detectar el caracter sintetico de los identificadores, todos los NIFs/CIFs de los 150 terceros siguen un patron fijo: los 3 digitos anteriores a la letra/DC son siempre "666".
- NIFs personas (37): formato
XXXXX666L(ej.:11607666A,41266666C). - CIFs empresas (90): formato
LXXXX666Dcon L en {A,B,C,D,E,F,G,H,U} (ej.:H31846660,F3041666C). - CIFs organismos publicos (23): formato
LXXXX666Dcon L en {P,Q,V}, DC siempre letra.
Por que esto refuerza la anonimidad:
- Identificabilidad inmediata: cualquier persona/empresa puede comparar al instante con su NIF/CIF real.
- Espacio reducido 1.000x: de 10^8 a 9×10^4 para NIFs.
- Verificable:
SELECT COUNT(*) FROM terceros WHERE substr(nif,6,3) != '666'debe devolver 0. - Validez sintactica preservada: los NIFs/CIFs siguen pasando todos los validadores oficiales.
5. Generacion de identidades sinteticas
- 150 terceros: 60% empresas, 25% personas fisicas, 15% organismos publicos demo.
- Empresas (90): 211 razones sociales ficticias con sufijo "DEMO" (ARANZUBI BERRIAK DEMO, EUSKAL TXIKI DEMO, etc.). CIF formato A/B/C/D/E/F/G/H/U + 7 digitos terminados en 666 + DC.
- Personas (37): nombres+apellidos de diccionarios sinteticos curados (60 nombres + 103 apellidos validos). NIF 8 digitos terminados en 666 + letra.
- Organismos publicos (23): 32 entidades demo todas con sufijo "DEMO" (DIPUTACION FORAL DEMO, GOBIERNO VASCO DEMO, etc.). CIF P/Q/V.
- Todos con direccion en el callejero ficticio Aranzubi (mitologia vasca), CP 48999, poblacion ARANZUBI.
6. IBANs sinteticos
- Estructura ISO 13616 valida (mod 97 + mod 11 espanol calculados correctamente). Pasan validadores estructurales.
- Codigos de entidad bancaria 8001, 8002, 8003, 8004: no asignados por el Banco de Espana en su Registro de Entidades de Credito. No son cuentas operativas en ningun banco real.
- Nombres de entidades inventados con sufijo DEMO: BANCA ARANZUBI DEMO, DEMO CAPITAL BANK, EUSKO DEMO ENTITATEA, DEMO RURAL CAJA.
7. Importes y cadena ejecutiva
- Distribuciones lognormales plausibles por capitulo presupuestario (cap. 1 personal: log-normal centrado en 50K-200K; cap. 6 inversiones: 100K-1.5M; etc.).
- Conversion PTA/EUR correcta: ejercicios 1994-2001 en pesetas (importe × 166.386), 2002-2014 en euros.
- Cadena ejecutiva coherente: credito_inicial + modificaciones = credito_definitivo; credito_definitivo > autorizaciones > disposiciones > obligaciones > pagos.
8. Numeros de identificacion y descripciones
- num_factura: formato
F<anio><5 digitos>, generados aleatoriamente, unicos. - num_cheque: formato
<anio><5 digitos>, unicos. - num_recibo: 8 digitos aleatorios, unicos.
- Descripciones de operaciones: 87 plantillas estrictas escritas a mano sin nombres ni direcciones reales. Sustituciones con marcadores
{mes},{anio},{numero}. Todo el contenido es literario sintetico.
9. Auditoria automatizada
Auditoria interna con 17 verificaciones de integridad y caracter sintetico:
| # | Check | Resultado |
|---|---|---|
| 1 | Volumetria por las 71 tablas | OK |
| 2 | NIFs/CIFs terceros con formato y DC valido, unicos | OK (150 unicos) |
| 3 | Nombres solo del diccionario sintetico, propagados coherentemente | OK |
| 4 | IBANs unicos y con DC mod 97 + mod 11 valido | OK |
| 5 | Codigos entidad subset {8001-8004} (no asignados por Banco de Espana) | OK |
| 6-8 | num_factura, num_cheque, num_recibo: formato correcto, unicos | OK (2.500 + 2.500 + N) |
| 9 | Descripciones operaciones: solo plantillas sinteticas | OK |
| 10-11 | Telefonos en rango sintetico; direcciones en callejero ficticio | OK |
| 12 | CPs subset {'48999'} | OK |
| 13-14 | Sin strings identificadores de cliente real; sistemas contables coherentes | OK |
| 15 | Importes top 10 por anio: distribucion lognormal sintetica | OK (sin patrones derivados) |
| 16 | Tabla clasificaciones whitelist publica MINHAP/PGC del BOE | OK (3.474 codigos oficiales) |
| 17 | FK operaciones -> terceros y resumen_terceros -> terceros | 0 huerfanos |
Resultado consolidado: 17/17 checks OK, 0 ALERTs.
El check 16 documenta la unica coincidencia esperada: la
tabla clasificaciones contiene los 3.474
codigos oficiales del MINHAP/PGC publicados en el BOE,
datos publicos de uso libre que no constituyen informacion
personal sino documentacion tecnica.
10. Garantias adicionales
10.1 Sin coincidencia con personas/entidades reales
- NIF personas: 10^8 × 23 = 2.3×10^9 combinaciones; demo genera 37 personas. Patron 666 reduce el espacio efectivo 1.000 veces.
- CIF empresas: 9 letras prefijo × 10^7 numeros × 11 DCs = ~10^9 combinaciones; demo genera 90, todas con razon social marcada DEMO.
- IBAN: 4 entidades demo × 9.999 sucursales × 10^10 cuentas = 4×10^14 combinaciones; las entidades 8001-8004 no estan asignadas operativamente.
10.2 Datos no derivados
Los datos demo se generan desde cero mediante muestreo
aleatorio sobre diccionarios estaticos curados.
No hay ninguna transformacion (cifrado, hash,
anonimizacion, k-anonimato) sobre datos reales
pre-existentes. La unica entrada externa al
generador es la tabla clasificaciones
(codigos MINHAP/PGC del BOE), datos publicos por ley.
11. Cumplimiento normativo
- No esta sujeta al RGPD (UE 2016/679, art. 4.1; Considerando 26).
- No requiere consentimiento de ninguna persona fisica.
- No requiere fichero declarado ante la AEPD.
- No transfiere datos personales a internet.
- Cumple con la Ley 19/2013 de Transparencia al ofrecer un modelo de visualizacion equivalente al que cualquier ayuntamiento puede publicar.
Documento valido para presentar ante clientes potenciales, reguladores (AEPD, organismos vascos de proteccion de datos, Camara de Cuentas, Tribunal Vasco de Cuentas Publicas), auditorias internas o externas. Contacto: info@uko.eus. Ultima actualizacion: 1 de mayo de 2026.
