如何反编译(手机如何反编译apk)

2022-07-23 80酷酷网 80kuku.com

1、前言

APP客户端作为直接和用户接触的媒介，是公司是非常重要的信息资产。但由于系统本身的一些风险和破解工具的泛滥，使得破解移动应用变得易如反掌。移动应用安全性成为了大家都在的焦点。并在此基础上探讨如何做相关的安全测试。

本篇将要介绍是反编译的技术手段以及反反编译的一些基本策略。

2、反编译

未经保护的移动应用有许多弱点可被轻易攻击。比如注入恶意软件，窃取知识产权，破解内购、二次打包，盗取敏感数据等等。而这些操作的前提都是要进行反编译。

这里我用Android系统的apk安装包作为例子，展开来介绍下。

2.1 常用的反编译工具

Android系统因其比较开放，且主要代码由java编写，所以相应的反编译工具比较多。例如apktool、jeb、jdJUI、jadx、MT管理器等等。iOS端则有IDA、Hopper之类的软件。

2.2 反编译效果

未经安全处理应用的java层反编译效果，代码及逻辑清晰可见，毫无秘密。

如何反编译(手机如何反编译apk)(图1)

未经安全处理的native二进制文件反编译效果，代码逻辑及执行流程清晰明了。

如何反编译(手机如何反编译apk)(图2)

通过上面的图可以看到，无论是java层代码还是c层代码，如果不加以适当的防护，都可以被反编译工具轻易的读取信息。

2.3 修改代码插桩

经过反编译后，我们实际上拿到的对应java层的代码其实是smali代码。它是用于Dalvik（Android虚拟机）的反汇编程序实现的。

如何反编译(手机如何反编译apk)(图3)

通过修改smali代码，我们可以实现所有java层代码的功能。包括打印日志、跟踪堆栈、植入弹窗、注入恶意代码等等。然后重新打包就可以生成伪造的恶意apk安装包，然后利用破解等方式引诱不知情的用户下载，从而进行攻击或其他目的。

3、反反编译的基本策略

从上面的分析可以看到，不做防护的代码就如裸泳，一旦遇到各种反编译工具，立刻就会显出原形。

不过还是有一些手段可以用来给应用做安全防护的，例如代码混淆、应用加固等。

3.1 代码混淆

混淆机制，在应用中做混淆不仅可以减小安装包的大小，也可以增加逆向分析的难度。现在的混淆机制一般有两种，代码混淆和资源混淆。这里暂时只对代码混淆进行展开分析。

3.1.1 Java层代码混淆

混淆过的代码，在反编译后看到的代码类名、方法名以及代码格式都与正常的代码不太像。因为名称不规范，给逆向和逻辑的分析增大困难。

如何反编译(手机如何反编译apk)(图4)

在普通的混淆的基础上，还可以定制高级版的混淆。这些都可以让逆向分析难度上升。

如何反编译(手机如何反编译apk)(图5)

如何反编译(手机如何反编译apk)(图6)

3.1.2 native代码混淆

关于c/c 代码的混淆，就非常有必要了解一下OLLVM混淆。在2.2章节中，可以看到即便是c/c 代码打包成的二进制动态库文件，如果不进行防护，在强大的反编译软件下依然跪的彻底。

OLLVM(Obfuscator-LLVM)是旨在提供一套开源的针对LLVM的代码混淆工具，以增加对逆向工程的难度。它是基于LLVM实现的，LLVM是一个编译器框架，并且得益于LLVM的设计，OLLVM适用LLVM支持的所有语言（C, C , Objective-C, Ada 和 Fortran）和目标平台（x86, x86-64, PowerPC, PowerPC-64, ARM, Thumb, SPARC, Alpha, CellSPU, MIPS, MSP430, SystemZ, 和 XCore）。

如何反编译(手机如何反编译apk)(图7)

通过上图可以看到，经过ollvm的so库，其流程和代码都被一定程度的混淆了，让静态分析的难度大大增加。

但是，代码混淆本身只是对源代码进行一定的变形，并且一些特定的类是不能被混淆的。所以通过这些入口，破解者仍然可以通过工具进行分析，只是难度增加了。而且，根据混淆的特点，可以写出特定的反混淆脚本来修正。

3.2 应用加固

经过上面的分析可以了解到，现阶段反编译工作相对较容易，虽然有各种混淆功能，但是总体上属于治标不治本。随着攻防的对抗升级，各个大厂纷纷推出了自己的应用加固方案，例如梆梆、加固保、乐固等等。

下图展示了一个加固后的应用反编译情况，原始代码均被隐藏了，只展示壳应用的部分代码。壳的解密代码则全部被放进了native层中，这样可以提高应用被破解逆向的难度。

如何反编译(手机如何反编译apk)(图8)

不过值得注意的是，给应用套一层壳后，会存在部分兼容性问题，这都要“归功”于Android系统及机型的多样性。

3.3 其他方案

核心代码由c/c 层面实现。经过编译的c/c 代码会生成一个ELF格式文件。想要分析这种格式的文件，要比分析java难度大得多，而且会牵扯到大量汇编语言知识点。而且ELF文件本身也可以被“修改”、“加固”，例如抹去section信息等，同时又不影响其加载过程。通过这些手段，可以让静态分析的难度大大的提升。

还有一些其他的方案，如dex加固、动态加载等等。它们背后的原理其实都是一样的，对关键代码、文件进行修改、隐藏，只有在应用运行的时候才开始解密并执行。

4、安全性测试

基于这些反编译工具特点及反反编译的策略，我们就可以组织与其对应的反编译安全测试。

1、应用是否能够被常用的反编译工具识别，并且得到核心代码。

2、应用是否对代码进行了混淆，是否可以轻易还原逻辑。

3、应用是否采用了加固措施。