将pyinstaller打包后的exe还原成py / 防止还原 1. 将exe文件解压 2 获取pyc文件 3 反编译pyc文件 4 复杂的脚本 5 防止还原

1. 将exe文件解压

好多教程或者说明文档,都说这个过程是反编译,在我看来是两个过程,1. 解压,2.反编译,其实,pyinstaller的原理:
把python解析器、脚本以及被打包脚本依赖的其他脚本(三方库)和需要的windows dll文件等等 打包成一个可执行的文件,这个文件可以不依赖python环境直接在wondows机器上执行起来。

既然是打包起来的,第一步就需要把包拆开(解压),看看里边具体是什么,下载拆包工具:pyinstxtractor.py:https://sourceforge.net/projects/pyinstallerextractor/
然后执行拆包命令:

pyinstxtractor.py  test.exe

会得到一个文件夹 “可执行文件名称test.exe_extracted”的文件夹


2 获取pyc文件

在上述获取到的文件夹中找到 “test” 文件,这个文件不能直接作为pyc文件反编译,这是因为pyc文件以特定的头字节(magic head,包含Python的版本号和时间戳),pyinstxtractor虽然反编译出了test的文件的内容,但没有给它加上pyc文件的头字节,因此 需要先将缺失的字节补充回来,才能编译成功。根据网上大神介绍,与“test”同目录下的“struct”文件的头字节是pyc文件的一种,将“test”的头自己补充完成后,在重命名pyc文件,即可开始反编译


以16进制的文件形式打开两个文件,我用的是notepad++,装了16进制查看文件的插件HEX-Editor,直接修改test,然后保存,重命名成pyc格式的文件


另外一个方法就是使用python对二进制文件处理,增加头文件

structPath = 'struct'
programPath = 'test'
f=open(structPath, 'rb')#打开struct文件
f2=open(programPath, 'rb')#打开待反编文件
w_all=f2.read()#先读取待反编文件原来的内容
f2.seek(0)#读取完之后从头开始
w=f.read(16).hex()#再读取16个字节用于比较
w2=f2.read(16).hex()#struct也读取16个用于比较
print(w,w2,sep='\n')#打印出来让我们看见
add=input('Please input the codes you need to write:')#然后问你要在开头写入什么
add=bytes.fromhex(add)#把普通字符串转换为bytes格式,并不是encode,而是fromhex(),把字符串看成是十六进制编码
f2.close()#关闭
f2=open(programPath+'.pyc', 'wb')#创建pyc待反编文件
f2.write(add+w_all)#把加入的字节和原来的字节合并写入文件
f.close()
f2.close()
print('Done.')

3 反编译pyc文件

安装uncompyle6,(有的文档介绍说是uncompyle2,其实安装的时候会默认安装uncompyle6)

pip install uncompyle6

反编译

uncompyle6 test.pyc > compyleTest.py

======================================================

4 复杂的脚本

现实情况中不会有这么简单的脚本,往往都是相互引用,按照上述步骤只是反编译出来了入口exe,至于引用的其他编写的文件中的代码是看不到的,比如 getValue()这个是看不到源码的,


此时去解压的文件中test.exe_extracted中进入PYZ-00.pyz_extracted,这个里边全部是引用三方或者自己编写代码用到的库文件,根据import找到需要编译的pyc文件,再次反编译得到另外想到的源码文件,

但是 但是 请注意
虽然PYZ-00.pyz_extracted中的文件格式都是pyc文件,但是直接试用上述方法反编译 会出现异常,导致异常的原因还是 pyc文件的头信息,中的python版本不匹配当前机器安装的python版本导致问题,因此修改pyc文件中头信息(magic head)中的版本即可再次编译。

获取到编译后的Helper.py文件


5 防止还原

综上所述,编译过的pyc二进制文件可以还原成py文件,那么在不做处理的时候直接使用pyinstaller的时候py文件会被编译成pyc文件存在pycache文件中,然后将自己编写的pyc和引用到的三方库pyc打包到exe中,

打包的过程绕过pyc,或者找其他的方式代替pyc,经过查找可以将py文件编译为动态链接库,打包的时候使用动态链接库,这样破解难度将大大增加。其中,在python里,pyd格式即动态链接库,pyinstaller打包时 优先级pyd > py, pyd文件是由 Cython首先把python源码翻译成了 .c文件,这个过程基本不可逆,然后vs再把这个.c文件编译成了pyd文件。所以 源码失踪了,只剩下汇编语言。

步骤如下

  1. 安装cython: pip install Cython
    然后在工程中创建一个build_pyd.py 文件,目的是生成对应文件的pyd文件
from distutils.core import setup
from Cython.Build import cythonize

setup(
    name='any words.....',
    ext_modules=cythonize(["one.py", "two.py", ]),
)

触发脚本执行,生成pyd

python build_pyd.py build_ext --inplace

生成的pyd在同级目录的同名目录下 如图:

  1. 做完前期操作之后 开始打包,打包方式不变,除了程序的入口py文件可以被反编译,其他自己开发的文件解压之后都是pyd文件,两种情况的对比


注意 注意 注意
出错的一个点,自己的部分代码/三方库没有打包进去
调整现有代码结构,增加一个py文件 只作为程序入口,同时这个文件中引入整个程序用到的三方库,目的是打包的时候给三方库打包进去。

下面图片中 就是缺少 import了自己编写的库 ,把import加上,重新打包就可以了


参考:
https://www.vanfon.net/html/1499.html
https://www.jb51.net/article/184725.htm

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章