一些小功能的实现。
calc_md5.py
:计算文件MD5并将文件名改为对应MD5enable_check.py
:用于求出并删去某两目录的差集ggs.py
:部分重要函数的实现,如求准确率、早停法、混淆矩阵等yara_check.py
:匹配yara规则packer.yar
:部分壳的yara规则
一些神经网络模型的实现。
En_De.py
:编码器-解码器框架,编码器主要为GRU,解码器为带软注意的全连接ODEnet.py
:自己的ODEnet实现SE_ResNet
:自己的SE-net实现,最后没采用my_transfomer.py
:一种transfomer的实现,最后没采用
使用虚拟机做类沙箱操作,用于对PE文件预处理,也就是提取前32*32条指令信息。
run_my_sandbox.py
:主机执行的脚本my_sandbox_script.py
:放在虚拟机中的脚本get_features.py
:对脚本中特征提取步骤的类实现
编写的Pintools。
itrace.cpp
:源码itrace_x86.dll
:32位itrace_x64.dll
:64位
数据集的实现,包含词汇表、序列化词汇表、向量器和torch的数据集实现。
img_datasets.py
:机器码数据集的单独实现ins_datasets.py
:反汇编指令数据集的单独实现datasets.py
:两种数据集的整合
对从沙箱中提取的信息进行预处理。
settings.py
:一些参数的设置get_csv.py
:预处理的脚本preprocess.py
:对脚本中预处理步骤的类实现
实验中模型参数、向量器和各种作图的存储位置。
在实现过程中被淘汰的脚本。
模块流程图。
img_train.py
:机器码模型的单独训练脚本ins_train.py
:反汇编指令模型的单独训练脚本main_train.py
:模型整合的训练脚本main_train.ipynb
:谷歌Colaboratory训练的IPython notebookpresentation.ipynb
:系统演示的IPython notebook