Filtraciones en hojas de cálculo públicas: copias ocultas de tu información
Las filtraciones de datos en hojas de cálculo públicas suelen provenir de enlaces de exportación, copias de seguridad antiguas y réplicas. Aprende dónde aparecen y cómo comprobarlas rápido.

Por qué es fácil pasar por alto este problema
Una hoja de cálculo puede sentirse privada aunque no lo sea. La gente comparte una pestaña con un compañero, envía un enlace de solo visualización o publica un archivo por un corto tiempo y asume que el riesgo terminó ahí. Pero si cualquiera con el enlace puede abrirlo, o si los motores de búsqueda y las herramientas de scraping pueden alcanzarlo, los datos ya se han movido más lejos de lo que la mayoría cree.
Por eso estas filtraciones son fáciles de pasar por alto. El archivo sigue pareciendo ordinario. Está en una herramienta conocida, detrás de un botón de compartir que parece inofensivo, con filas y columnas que parecen menos expuestas que una publicación pública en un sitio web.
El problema es simple: las hojas se propagan. Un archivo compartido puede convertirse en varias copias rápidamente, y esas copias no siempre desaparecen cuando arreglas el original.
Un ejemplo pequeño muestra cómo ocurre esto. Un club publica una hoja para inscripciones con nombres, correos y teléfonos para que los voluntarios cambien turnos. Más tarde, el propietario cambia la configuración a privada. Eso da la sensación de que el problema terminó, pero puede que solo cierre una puerta.
Alguien puede ya haber descargado un CSV o una copia en Excel. Un servidor puede haber guardado una copia de seguridad en una carpeta pública. Otro sitio puede haber creado una réplica, que es simplemente una versión duplicada que muestra las mismas filas en otro lugar. Si siquiera una de esas copias sigue abierta, la información sigue expuesta.
Los enlaces de exportación son una razón por la que esto pasa desapercibido. La hoja principal puede quedar bloqueada mientras que un enlace de descarga antiguo sigue funcionando. Las copias de seguridad en directorios son otra. Los equipos suelen guardar archivos en carpetas web compartidas, y versiones antiguas pueden permanecer ahí meses con nombres tan simples que nadie los nota.
Las réplicas son aún más difíciles de detectar porque pueden no parecer para nada el archivo original. Los datos pueden aparecer en una página simple, dentro de una tabla searchable o en un archivo archivado por scraping. Para una persona eso puede parecer oscuro. Para un corredor de datos, parece ordenado y fácil de recopilar.
Esa parte importa. Una hoja de cálculo no es solo legible. Está organizada. Una fila puede entregar un perfil completo en segundos: nombre, puesto, ciudad, correo, teléfono, quizá incluso notas. Eso hace que el scraping sea barato y rápido.
Así que el riesgo suele esconderse a plena vista. La hoja original puede parecer temporal u olvidable. Las copias son lo que convierte un intercambio rápido en una filtración duradera.
De dónde vienen las copias públicas
La mayoría de las filtraciones de hojas no empiezan con un hack. Empiezan con un atajo normal que permanece abierto más tiempo del que nadie pretendía.
Una forma común es el enlace de compartición directa. Alguien pone una hoja en "cualquiera con el enlace" para que un cliente, proveedor o compañero la abra rápido. Meses después, el trabajo está hecho, pero el enlace sigue funcionando. Si ese enlace se pega en un hilo de correo, chat, ticket de soporte o página pública, la hoja puede llegar mucho más lejos que la audiencia original.
Los enlaces de exportación crean un problema similar. Una hoja puede tener una exportación CSV o XLSX en vivo para que otra herramienta obtenga los datos. Eso suena inofensivo cuando el archivo solo contiene números de inventario o fechas de eventos. Se vuelve problemático cuando la misma hoja también tiene nombres, números de teléfono, direcciones o notas en columnas ocultas. La URL de exportación puede seguir entregando una copia limpia, legible por máquina y fácil de scrapear.
Las carpetas de copias de seguridad son otra fuente silenciosa. Los equipos suelen guardar exportaciones de hojas en directorios web compartidos, carpetas antiguas de staging o buckets en la nube abiertos por conveniencia. Nadie lo nota porque la hoja principal ya no es pública. La copia de seguridad sigue ahí, a menudo con un nombre simple como contacts.csv o users-2023.xlsx.
Luego están los sitios espejo. Algunos servicios copian hojas públicas para mostrar tablas en una página web, republican conjuntos de datos abiertos o mantienen un clon sincronizado para búsqueda y ordenación. Una vez que eso ocurre, la hoja deja de estar en un solo lugar. Incluso si el propietario bloquea el documento después, la versión replicada puede seguir en línea porque vive en otro servidor.
Las copias en caché hacen que la limpieza sea más difícil. Motores de búsqueda, herramientas de vista previa y caches de entrega de contenido pueden conservar una versión anterior de la hoja después de editarse o cambiar el acceso. Así que una fila eliminada el martes puede seguir visible en una instantánea en caché el viernes.
Por eso estas filtraciones perduran. Una hoja viva puede convertirse en varias copias con muy poco esfuerzo:
- el enlace de compartición original
- uno o más archivos de exportación
- una copia de seguridad en una carpeta pública
- una copia replicada en otro sitio
- una versión antigua en caché
Esa cadena es exactamente lo que buscan los corredores de datos. Las hojas están ordenadas, etiquetadas y son fáciles de procesar. Un solo archivo expuesto puede entregar nombres completos, correos, cargos, ciudades y notas en una sola pasada.
Qué pueden extraer los brokers de una hoja
Una hoja pública no necesita parecer sensible para ser útil a un corredor de datos. Si tiene nombres, correos, teléfonos o direcciones, eso basta para empezar un perfil. Una exportación expuesta puede convertir una simple lista de contactos en algo copiado, ordenado y vendido.
El material obvio es fácil de detectar. Una lista de personal, un padrón escolar, una hoja de inscripción de voluntarios o una hoja de clientes puede mostrar nombres completos junto a cargos, nombres de clases, nombres de equipos o departamentos. Eso ayuda a un corredor a conectar a una persona con un lugar de trabajo, campus, equipo deportivo o grupo local.
Campos menos evidentes pueden ser igual de reveladores. Notas de pedido pueden mencionar números de apartamento, códigos de portón, horarios de entrega o quién vive en la dirección. Detalles de citas pueden mostrar cuándo alguien suele estar fuera de casa, a dónde va por servicios o qué oficina visita. Respuestas de formularios a menudo incluyen contactos de emergencia, necesidades dietéticas, cumpleaños y otros detalles personales que la gente nunca pensó que serían públicos.
Los detalles pequeños suman
Una fila puede parecer aburrida. Veinte filas pueden contar una historia muy clara.
Un corredor podría combinar un nombre y correo personal, un teléfono y código postal, un colegio o empleador y notas sobre pedidos, citas o solicitudes de soporte. Eso suele ser suficiente para emparejar a la persona con otros registros ya en circulación.
Por ejemplo, una hoja que liste "Maya Patel," un número móvil, un cargo laboral y una nota que diga dejar entregas con la conserjería después de las 6 p.m. Ninguno de esos campos parece dramático por sí solo. Juntos, indican dónde trabaja Maya, cuándo es probable que esté allí y cómo enlazar este registro con otras bases de datos.
Por eso estas filtraciones son tan resbaladizas. El peligro no son solo las columnas obvias. Es el patrón que aparece cuando varias columnas ordinarias están lado a lado.
Incluso las listas de equipos pueden crear riesgo. Si una hoja muestra nombres de padres, nombres de estudiantes, contactos de entrenadores y notas de recogida, traza relaciones reales entre personas. Si muestra clientes, fechas de servicio y notas de direcciones, puede revelar rutinas. Los corredores de datos no necesitan secretos. Solo necesitan suficientes piezas para hacer una coincidencia confiable.
Una vez hecha esa coincidencia, la hoja se convierte en una fuente más que alimenta el mercado más amplio de datos personales.
Cómo comprobar si una hoja está expuesta
Empieza con la prueba más simple. Busca el título exacto de la hoja entre comillas y luego busca algunos nombres de columnas poco comunes del archivo. Una hoja copiada a menudo mantiene los mismos encabezados incluso cuando alguien cambia el título.
Esto funciona porque las filtraciones rara vez se quedan en un solo lugar. El archivo original puede haber desaparecido, pero una exportación, copia de seguridad o réplica puede seguir abierta.
Una comprobación rápida funciona mejor si piensas como quien copia datos, no como quien creó la hoja. Pregúntate dónde podría existir una versión pública fuera del archivo principal.
Busca en los lugares que la gente olvida:
- unidades compartidas antiguas y carpetas de equipo
- directorios de archivo o copias de seguridad
- archivos exportados guardados como CSV o XLSX
- hojas copiadas con las mismas columnas pero otro nombre
- carpetas llamadas "old", "backup" o "final-copy"
Luego, prueba las rutas comunes de exportación. Si una hoja se compartió públicamente en algún momento, puede haber versiones descargables en formato CSV o XLSX incluso si ya no se usan. En la práctica, estos archivos son más fáciles para los scrapers porque los datos están limpios y listos para ordenar.
No te quedes con una sola versión. Busca el título de la hoja, luego prueba con algunas frases exactas de la primera fila, un nombre de empresa poco común o un dominio de correo menos común de la hoja. Eso suele encontrar réplicas y archivos copiados más rápido que búsquedas generales.
Un ejemplo pequeño: una hoja de contactos llamada "Inscripciones evento de primavera" puede no aparecer ya. Pero una copia llamada "event-list-export.csv" en una carpeta pública antigua puede seguirmostrando los mismos renglones y las mismas cabeceras: name, email, phone, city.
Antes de cambiar la configuración de compartición, registra lo que encuentres. Guarda el nombre del archivo, dónde apareció, qué formato usaba y cuándo lo encontraste. Las capturas de pantalla ayudan. Si hay varias copias, anota cuál parece la fuente y cuáles parecen raspadas o duplicadas.
Ese paso parece lento, pero ahorra tiempo después. Una vez que cambien los permisos, algunas copias desaparecen de la vista y pierdes un mapa claro de dónde se dispersaron los datos. Si detalles personales ya están moviéndose entre réplicas y bases de datos de brokers, un registro claro te da un mejor punto de partida para las acciones de retirada.
Cómo una hoja simple se convierte en una filtración
Un caso muy normal comienza con una hoja de inscripción de voluntarios. Un grupo escolar, una ONG local o un evento de barrio quiere una forma fácil de que la gente elija turnos, así que alguien crea una hoja y la comparte en "cualquiera con el enlace." La hoja puede tener solo unas columnas: nombre, correo, teléfono y turno preferido.
Eso no parece arriesgado al principio. Es solo una hoja para un evento de fin de semana. Pero así es como empiezan muchas filtraciones: un archivo pequeño se trata como una herramienta inofensiva, no como un documento público.
La propagación suele ocurrir en pasos pequeños y aburridos:
- Un organizador descarga la hoja como CSV para uso offline.
- Ese archivo se sube a una carpeta de copias de seguridad o directorio web antiguo.
- Un espejo, herramienta de archivo o scraper lo encuentra y guarda una copia.
- Un scraper de brokers de datos lee el CSV porque es fácil de procesar.
Nada de esto requiere un hack dramático. El archivo fue público una vez, y las copias son baratas.
Ahora adelanta unos meses. El organizador bloquea la hoja original, quita el acceso público o la elimina. En su lado, el problema parece resuelto. Si abre el enlace antiguo, ya no funciona.
Pero las copias pueden seguir ahí. El CSV en una copia de seguridad puede seguir cargándose. Una réplica puede mantener una versión antigua. Alguien que descargó el archivo antes puede haberlo puesto en otra carpeta compartida sin pensarlo mucho. Un enlace público puede convertirse discretamente en varios.
Aquí es donde el daño crece. Un broker no necesita la historia completa detrás de la hoja. Un nombre, correo, teléfono, pueblo y una nota como "disponible por las tardes" basta para relacionar a una persona con otros registros. Eso puede alimentar spam, llamadas de estafa y la construcción de perfiles.
Lo frustrante es que el propietario original a menudo no tiene idea de que la propagación ocurrió. Recuerdan haber compartido una hoja. No saben de los enlaces de exportación, copias de seguridad de directorios o réplicas que mantuvieron los datos vivos.
Errores que mantienen datos en línea
El error más grande es pensar "compartir apagado" significa "borrado". No es así. Una hoja puede dejar de ser visible en la app principal mientras que exportaciones antiguas, copias publicadas o versiones replicadas siguen en algún lugar público.
Por eso estas filtraciones duran más de lo que la gente espera. El archivo original se bloquea, pero la copia que era más fácil de scrapear permanece abierta.
Un ejemplo común es el problema del enlace de exportación. Alguien comparte un CSV o XLSX, luego cierra el acceso a la hoja en sí. El equipo asume que está resuelto. Mientras tanto, esa copia de exportación puede seguir funcionando y puede que ya la hayan guardado motores de búsqueda, scrapers o cualquiera que la abrió antes.
Otro error es eliminar filas y quedarse ahí. Si la hoja tenía una carpeta de backups, un archivo automático o una réplica antigua, los datos eliminados pueden seguir viviendo en esos lugares. Esto ocurre mucho con listas de contactos, formularios de ingreso y hojas de inscripción de eventos. Quitas los números del vivo, pero la copia de ayer sigue con todas las filas.
Las hojas de prueba también causan problemas. La gente suele usar teléfonos reales o correos reales al probar fórmulas, importaciones o diseños móviles. Parece inofensivo porque la hoja es "temporal." En la práctica, los archivos temporales se quedan. Se duplican, renombran y se olvidan.
Los títulos descriptivos facilitan que se encuentren las filtraciones. Un nombre de archivo como "Client mobile numbers March" o "Staff address backup" le dice a un scraper exactamente qué está viendo. Incluso si el archivo fue público solo un tiempo corto, un título poco revelador da más pistas.
Mover un archivo es otro falso arreglo. Una hoja movida a una carpeta privada, archivo o cuenta diferente puede seguir pública si sus permisos antiguos se mantienen. Lo mismo pasa con enlaces de exportación compartidos fuera del equipo. La ubicación cambió. El acceso no.
Una limpieza simple debería revisar más que la hoja visible: exportaciones antiguas, carpetas de backups, versiones copiadas o replicadas, hojas de prueba con datos reales y archivos publicados con nombres reveladores.
Imagina un equipo pequeño que comparte una lista de voluntarios y luego borra los nombres y mueve la hoja a una carpeta de archivo. Meses después, un broker encuentra una copia exportada antigua en un directorio público de backups. El equipo sí quitó los datos de la hoja principal. Simplemente no quitaron las copias.
Ese es el patrón detrás de la mayoría de estas filtraciones. La gente limpia el archivo que recuerda, no las copias que olvidó.
Comprobaciones rápidas antes de compartir una hoja
Una hoja puede parecer inofensiva hasta que una configuración equivocada la convierte en una copia pública. Eso ocurre más seguido de lo que la gente piensa, sobre todo con entregas apresuradas, carpetas antiguas y enlaces que se pasan por chat.
Una revisión rápida toma dos minutos y puede ahorrar mucha limpieza después. Antes de compartir una hoja, revisa el archivo en sí, la carpeta que lo rodea y el enlace exacto que piensas enviar.
Usa una rutina corta:
- Revisa el ajuste de compartición antes de enviar nada. Si la hoja dice "cualquiera con el enlace", detente y pregúntate si es realmente necesario ese acceso.
- Elimina columnas que no necesites. Teléfonos, direcciones, notas e identificadores internos suelen permanecer en una hoja mucho después de dejar de ser útiles.
- Pon títulos genéricos a las hojas temporales. Un nombre como "Client lead list - March" revela más que "Working sheet 3."
- Establece una fecha de revisión en la carpeta o proyecto para que las exportaciones antiguas y backups olvidados se revisen.
- Abre el enlace en una ventana de navegador privada y mira qué aparece sin tu sesión normal.
Esa última comprobación descubre más de lo que la gente espera. Una hoja puede parecer bloqueada mientras estás conectado, pero una ventana privada muestra lo que vería un extraño. Si el archivo se abre, se previsualiza, se descarga o expone una URL de exportación, trátalo como público.
También ayuda pensar en lo que alguien puede inferir por pequeños detalles. Una simple hoja de contactos con nombres, ciudades, cargos y fechas puede bastar para el scraping de brokers. Incluso si quitaste campos personales obvios, una réplica o una versión en caché puede mantener versiones antiguas vivas.
Un hábito muy útil: crea una "copia para compartir" en lugar de enviar el archivo de trabajo. Conserva solo las filas y columnas que la otra persona necesita. Ese pequeño paso reduce la posibilidad de mandar pestañas ocultas, comentarios, fórmulas o datos antiguos a un lado.
Si compartes hojas con frecuencia, pon un recordatorio mensual para revisar carpetas antiguas y borrar exportaciones que ya no necesites. La mayoría de las filtraciones no vienen de un error dramático. Vienen de restos aburridos que nadie revisó.
Qué hacer si tus datos ya están fuera
Una vez que una hoja ha sido copiada, empieza por contener el problema. Para cuando persigues las copias, detén la fuente. Si el archivo original sigue público, cada día extra da más tiempo a crawlers, réplicas y brokers para copiarlo.
Empieza por la hoja misma. Cambia la compartición a privada, quita el acceso de "cualquiera con el enlace" y revoca permisos antiguos que ya no necesites. Si el archivo estaba publicado en la web, desactiva esa opción también. Muchas filtraciones siguen vivas porque la hoja principal se bloquea mientras un feed de exportación antiguo sigue funcionando.
Luego revisa los archivos que la gente olvida:
- enlaces de exportación CSV, XLSX o PDF
- carpetas de respaldo en un servidor público o directorio en la nube
- archivos copiados en unidades compartidas o carpetas de proyectos antiguas
- réplicas que convirtieron filas en una página web
Borra lo que controles de inmediato. Si un archivo está en un servidor del equipo, pide a quien gestione el hosting o las copias que quite el acceso público, no solo que oculte la carpeta. Un archivo aún puede recuperarse si alguien ya tiene la ruta directa.
Para copias que no controlas, envía una petición de retirada breve al anfitrión. Incluye la página o archivo exacto, qué datos personales están expuestos y por qué debe retirarse. Las peticiones cortas y directas suelen funcionar mejor que largas amenazas legales.
Una filtración pequeña puede propagarse rápido. Si una hoja con nombres, correos y teléfonos se exporta como CSV y queda en una copia pública un fin de semana, eso puede ser suficiente para que un scraper la copie, un espejo la vuelva a publicar y un broker la añada a un perfil.
Después de la primera limpieza, sigue vigilando. Busca direcciones de correo únicas, nombres de archivo o cadenas de texto raras de la hoja. Revisa de nuevo en las semanas siguientes, especialmente si una herramienta automática de backup, sincronización o reporte podría publicar los mismos datos otra vez.
Si tus datos ya llegaron a sitios de brokers, las retiradas manuales se vuelven tediosas. Remove.dev se enfoca en esa limpieza encontrando y eliminando datos personales en más de 500 brokers y luego monitorizando reaparecimientos, lo que ayuda cuando el mismo registro vuelve a salir después de que la hoja original desapareció.
Preguntas Frecuentes
How can a spreadsheet leak if I only shared it by link?
Porque el enlace puede llegar mucho más lejos que la primera persona a la que se lo enviaste. Si alguien lo abre, puede descargar una copia, pegar el enlace en otro chat o guardarlo en un ticket, copia de seguridad o carpeta compartida.
Are CSV or Excel export links more risky than the sheet itself?
Por lo general sí. Las URL de exportación suelen ofrecer un archivo CSV o XLSX limpio que los scrapers pueden leer con facilidad, y esas direcciones pueden seguir funcionando después de que la hoja principal se bloquee.
What is a sheet mirror?
Una réplica de hoja es una copia de tu hoja mostrada en otro lugar, a menudo como una tabla o una página web simple. Si el original fue público aunque solo fuera por poco tiempo, otro sitio o herramienta puede mantener esa copia en línea después de que cambies el archivo fuente.
What kind of personal data can brokers pull from one sheet?
Incluso columnas aparentemente inocuas sirven. Un nombre, correo, teléfono, ciudad, empleador o una nota sobre entregas, turnos o citas puede ayudar a un corredor a relacionarte con otros registros y construir un perfil más completo.
How do I check whether a sheet is still exposed?
Empieza buscando el título exacto de la hoja entre comillas y luego prueba con nombres de columnas poco comunes, frases raras o un dominio de correo inusual de la hoja. También revisa carpetas antiguas, directorios de copias de seguridad y cualquier archivo de exportación que aún pueda ser público.
Does turning off sharing fix the problem?
No. Bloquear el archivo principal solo cierra una versión. Exportaciones antiguas, copias de seguridad, páginas en caché y réplicas pueden seguir públicas a menos que también elimines esas copias.
Can deleted rows still show up somewhere else?
Sí. Las filas eliminadas pueden seguir existiendo en copias de seguridad, instantáneas en caché, exportaciones antiguas o réplicas. Quitar datos de la hoja activa es un buen primer paso, pero no borra versiones anteriores.
What should I do first if I find my data in a public spreadsheet?
Primero cierra la fuente quitando el acceso público y desactivando cualquier feed publicado o de exportación. Luego guarda pruebas de lo que encontraste, borra las copias que controlas y envía peticiones de retirada breves para las copias alojadas fuera de tu control.
How do I stop this from happening again?
Haz una copia para compartir en lugar de enviar el archivo de trabajo. Mantén solo las filas y columnas que la otra persona necesita, usa un nombre de archivo genérico y prueba el enlace en una ventana privada antes de enviarlo.
Can Remove.dev help if my spreadsheet data has already spread to broker sites?
Si los datos ya llegaron a sitios de brokers, un servicio de eliminación puede ahorrar mucho tiempo. Remove.dev localiza y elimina datos personales de más de 500 brokers, vigila re-listados y la mayoría de las retiradas se completan en 7–14 días.