Big Data Scanner - кроссплатформенный сканер, выявляющих ценные данные (далее сканер). Сканер запускается на локальной машине и не требует для установки прав администратора. Сканер не вносит никаких изменений в проверяемые файлы. Для сканирования требуется доступ только для чтения. Проект - open-source и поддерживается образовательными коллективами.
Сканер поддерживает следующие форматы файлов:
Типа файлов | Форматы файлов |
---|---|
MS Office (таблицы) | .xlsx .xls |
MS Office (текст) | .docx .doc |
MS Office (презентации) | .pptx .potx .ppsx .pptm .ppt .pps .pot |
Open Office (таблицы) | .ods |
Open Office (текст) | .odt |
Open Office (презентации) | .odp .otp |
Adobe | .pdf |
Архивы | .zip .rar |
Tекстовые | .txt .csv .xml .json .log |
Сканер выявляет следующие типы данных:
Типы данных, которые выявляет сканер | Микроданные, внутри типа данных |
---|---|
Персональные данные (текст) | ФИО , адрес , e-mail |
Персональные данные (цифры) | паспорт , телефон , машина , СНИЛС , ОМС |
Банковская тайна | номер счета |
Данные платежных карт | номер карты , CVV/CVV2 |
IP-адреса | IPv4 , IPv6 |
Собственные сигнатуры | Возможно написать собственные сигнатуры поиска |
TLS-сертификаты | Детектор залежелей TLS-сертификатов в папках |
Пароли | в разработке |
Исходных код | Поиск файлов с исходным кодом |
AI-модели, cпрятанные в файлах | в разработке |
Синтетические данные | в разработке |
Предполагается, что сканер является универсальным средством для сканирования всего. В настоящее время сканер может подключатся к следующим ресурсам:
Коннектор | Описание |
---|---|
Файловые каталоги | Сканирует сетевые папки CIFS / NFS |
HDD/SDD | Сканирует локальные жесткие диски |
S3 | Сканирует дерево каталогов S3 |
HTTP/HTTPS | Сканирует веб-страницы |
СУБД | в разработке |
Поддержка ОС:
Windows
, Linux (Astra, Ubuntu)
Системные требования:
400MB HDD
4GB RAM
1.3Ghz CPU