Herramienta gratuita de descubrimiento de datos confidenciales de código abierto
Angry Data Scanner es una herramienta de descubrimiento de datos confidenciales que utiliza la coincidencia de patrones para descubrir automáticamente datos confidenciales almacenados en carpetas, páginas web, S3 y bases de datos. Ayuda a las organizaciones a identificar dónde se almacenan datos confidenciales, como información de identificación personal (PII) y propiedad intelectual. La herramienta proporciona visibilidad sobre dónde se almacenan sus datos confidenciales.
- Los datos confidenciales (PII, tarjetas de pago, etc.) se pueden descubrir con 2 clics
- No se requieren derechos de administrador para ejecutar Angry Data Scanner
- No se requiere instalación de software adicional
- Funciona en Linux, Mac y Windows
Datos confidenciales descubiertos
El escáner detecta los siguientes tipos de datos:
Datos personales (números)
| Tipo de datos | País | Ejemplo |
|---|---|---|
| Número de teléfono | RU | +7 926 123456 |
| Número de pasaporte | RU | 4505 857555 |
| Número de contribuyente | RU | 123456789012 |
| Número de coche | RU | A120AA23 |
| SNILS | RU | 123-456-789 00 |
| OMS | RU | 1234567890123456 |
Datos personales (texto)
| Tipo de datos | País | Ejemplo |
|---|---|---|
| Nombre completo | RU | Иван Иванович Иванов |
| Nombre completo | US | Work in progress |
| Dirección | RU | Москва, ул. Ленина, д. 1 |
| Dirección | US | Work in progress |
| Correo electrónico | International | captainbull@gmail.com |
| Login | - | username, user123 |
| Contraseña | - | password123, secret |
| Información valiosa | - | Custom keywords search |
Secreto bancario
| Tipo de datos | Ejemplo |
|---|---|
| Número de tarjeta de pago | 4400 5678 1234 5678 |
| CVV | 123, 1234 |
| Número de cuenta | 40 817 810 099 910 000 000 |
| Número de billetera de criptomonedas | Work in progress |
| Códigos de recuperación de criptomonedas | Work in progress |
Activos de TI
| Tipo de datos | Ejemplo |
|---|---|
| Archivos de código fuente | Encuentra archivos con código fuente. El código fuente debe colocarse en el repositorio git. Si el código fuente simplemente se encuentra en algún lugar de los archivos, esto podría ser un problema de seguridad. |
| Contraseñas | Encuentra archivos con contraseñas, secretos, claves API |
| Certificados TLS | Encuentra carpetas con la mayor cantidad de certificados TLS |
| Datos sintéticos | Work in progress. Idea general si se identifica que los datos son sintéticos. Por ejemplo, un Excel se genera a través de Faker. |
| Modelos de IA | Work in progress. Encuentra modelos de IA integrados en archivos. El objetivo es identificar la IA oculta en su infraestructura. |
Red e infraestructura
| Tipo de datos | Ejemplo |
|---|---|
| IPv4 | 192.168.1.1 |
| IPv6 | 2001:db8::1 |
| Dominios bloqueados | example.ru |
Firmas personalizadas
| Tipo de datos | Ejemplo |
|---|---|
| Patrones definidos por el usuario | Patrones personalizados |
Tipos de archivos admitidos
El escáner admite los siguientes formatos de archivo:
| Tipo de archivo | Formato de archivo |
|---|---|
| MS Office (tables) | .xlsx .xls |
| MS Office (text) | .docx .doc |
| MS Office (presentation) | .pptx .potx .ppsx .pptm .ppt .pps .pot |
| Open Office (tables) | .ods |
| Open Office (text) | .odt |
| Open Office (presentation) | .odp .otp |
| Adobe | .pdf |
| Archives | .zip .rar |
| Plain text | .txt .csv .xml .json .log |
Fuentes de datos admitidas
El escáner pretende ser una herramienta universal para escanear todo. Actualmente, el escáner puede conectarse a los siguientes recursos:
| Connector | Descripción |
|---|---|
| Network Folder/Directory | Scans files on remote directory like Windows environment |
| HDD/SDD | Scan local hard drive |
| S3 | Scan files in S3 |
| HTTP/HTTPS | Scans web site content |
| Database | Work in progress |
Casos de uso
Compartimos algunos casos de uso prácticos sobre cómo se utiliza Angry Data Scanner en el mundo real.
- El equipo de Leak Hunting necesita escanear una carpeta de red y asegurarse de que no contenga un código fuente.
- Un empleado escanea el recurso de archivos de la red y elimina archivos que contienen números de tarjetas para garantizar el cumplimiento de los requisitos de PCI DSS.
- Un empleado bancario escanea el recurso de archivos de la red para asegurarse de que no contenga datos personales de clientes VIP.
- Un jefe escanea un recurso de archivos del equipo de ventas para que no tengan contactos de clientes en una carpeta compartida.
- Las autoridades deben descubrir rastros de criptomonedas en una computadora portátil
- Un responsable de ciberseguridad debe validar que la base de datos no contiene datos personales.
Funciones clave
- Clasificación: el escáner coloca los archivos de alto valor (con la mayoría de PII, etc.) en primer lugar en la lista
- Ver historial de escaneo
- Descargar los resultados de un escaneo en archivos SCV
- Puede hacer clic derecho en una carpeta y ejecutar un escáner para descubrir datos confidenciales en una carpeta.
- El escáner se puede ejecutar a través de la línea de comando
- Puedes programar un escaneo
- Puede detener el proceso de escaneo si se cumplen los criterios
- Puede mover archivos con datos confidenciales a una carpeta específica
- Puede configurar varios núcleos de CPU utilizados para escanear
Modo consola
AngryData también se puede iniciar en modo consola, lo cual es conveniente para la automatización y ejecución de tareas sin una interfaz gráfica.
Requisitos del sistema
Windows, Linux 400MB HDD 4GB RAM 1.3Ghz CPU
Descargar
| Windows | Setup x64 portable x64 |
| Linux | DEB X64 portable x64 |
| MacOS | macOS X64 macOS ARM64 |