Skip to content

packetdima/big-data-scanner

Repository files navigation

Big Data Scanner - кроссплатформенный сканер, выявляющих ценные данные (далее сканер). Сканер запускается на локальной машине и не требует для установки прав администратора. Сканер не вносит никаких изменений в проверяемые файлы. Для сканирования требуется доступ только для чтения. Проект - open-source и поддерживается образовательными коллективами.

Форматы файлов

Сканер поддерживает следующие форматы файлов:

Типа файлов Форматы файлов
MS Office (таблицы) .xlsx .xls
MS Office (текст) .docx .doc
MS Office (презентации) .pptx .potx .ppsx .pptm .ppt .pps .pot
Open Office (таблицы) .ods
Open Office (текст) .odt
Open Office (презентации) .odp .otp
Adobe .pdf
Архивы .zip .rar
Tекстовые .txt .csv .xml .json .log

Типы данных

Сканер выявляет следующие типы данных:

Типы данных, которые выявляет сканер Микроданные, внутри типа данных
Персональные данные (текст) ФИО, адрес, e-mail
Персональные данные (цифры) паспорт, телефон, машина, СНИЛС, ОМС
Банковская тайна номер счета
Данные платежных карт номер карты, CVV/CVV2
IP-адреса IPv4, IPv6
Собственные сигнатуры Возможно написать собственные сигнатуры поиска
TLS-сертификаты Детектор залежелей TLS-сертификатов в папках
Пароли в разработке
Исходных код Поиск файлов с исходным кодом
AI-модели, cпрятанные в файлах в разработке
Синтетические данные в разработке

Коннекторы

Предполагается, что сканер является универсальным средством для сканирования всего. В настоящее время сканер может подключатся к следующим ресурсам:

Коннектор Описание
Файловые каталоги Сканирует сетевые папки CIFS / NFS
HDD/SDD Сканирует локальные жесткие диски
S3 Сканирует дерево каталогов S3
HTTP/HTTPS Сканирует веб-страницы
СУБД в разработке

Системные требования

Поддержка ОС: Windows, Linux (Astra, Ubuntu)

Системные требования: 400MB HDD 4GB RAM 1.3Ghz CPU

About

Поиск чувствительных данных в тексте

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages