[原创]关于最近脱壳的笔记还请各位大佬指教

发表于: 2024-5-13 01:22 13652

[原创]关于最近脱壳的笔记还请各位大佬指教

mb_hdptcgkk 活跃值

2024-5-13 01:22

13652

学习脱壳笔记如有问题还请各位大佬指正

近期整理的脱壳笔记有点多
笔记地址
788K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6E0j5h3c8C8K9h3&6Y4x3e0M7%4i4K6u0r3P5Y4A6B7i4K6g2X3L8h3c8Q4x3V1k6T1L8r3!0T1i4K6u0r3L8h3q4A6L8W2)9J5c8W2)9J5y4f1f1&6i4K6t1#2z5o6m8Q4x3U0f1^5y4W2)9J5y4f1f1#2i4K6t1#2z5e0m8Q4x3U0f1&6x3g2)9J5c8W2)9J5y4f1f1^5i4K6t1#2z5o6c8Q4x3U0g2n7x3g2)9J5y4f1f1#2i4K6t1#2b7e0y4Q4x3U0g2n7x3#2)9J5k6h3#2V1

视频地址
整体壳
155K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2T1K9h3I4A6j5X3W2D9K9g2)9J5k6h3y4G2L8g2)9J5c8Y4k6A6k6r3g2G2i4K6u0r3b7W2j5I4K9g2Z5@1x3U0q4W2y4#2S2K6i4K6u0r3i4K6y4r3M7%4m8E0i4K6g2X3K9h3c8Q4y4h3k6X3M7X3!0E0i4K6y4p5x3K6x3K6i4K6u0W2z5e0V1&6i4K6u0W2x3q4)9J5k6e0l9`.
类加载器
f7cK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2T1K9h3I4A6j5X3W2D9K9g2)9J5k6h3y4G2L8g2)9J5c8Y4k6A6k6r3g2G2i4K6u0r3b7W2j5I4P5f1j5@1L8e0q4z5y4%4y4T1i4K6u0r3i4K6y4r3M7%4m8E0i4K6g2X3K9h3c8Q4y4h3k6X3M7X3!0E0i4K6y4p5x3K6x3K6i4K6u0W2y4K6R3^5i4K6t1$3j5h3#2H3i4K6y4n7N6X3c8Q4y4h3k6K6L8%4g2J5j5$3g2Q4x3@1c8V1x3e0l9$3y4K6x3%4x3r3c8U0j5e0g2T1z5e0m8X3z5r3q4U0k6X3k6T1j5K6p5@1x3o6V1$3z5r3j5I4z5l9`.`.

抽取壳还原
4b4K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6%4N6%4N6Q4x3X3g2T1K9h3I4A6j5X3W2D9K9g2)9J5k6h3y4G2L8g2)9J5c8Y4k6A6k6r3g2G2i4K6u0r3b7W2j5I4N6g2b7@1x3U0q4&6y4@1c8x3i4K6u0r3i4K6y4r3M7%4m8E0i4K6g2X3K9h3c8Q4y4h3k6X3M7X3!0E0i4K6y4p5x3K6x3K6i4K6u0W2y4K6R3^5i4K6t1$3j5h3#2H3i4K6y4n7N6X3c8Q4y4h3k6K6L8%4g2J5j5$3g2Q4x3@1c8V1x3e0l9$3y4K6x3%4x3r3c8U0j5e0g2T1z5e0m8X3z5r3q4U0k6X3k6T1j5K6p5@1x3o6V1$3z5r3j5I4z5l9`.`.

整体壳

加壳流程
1.原始dex加密
2.记录dex还原信息
3.壳dex尾部追加加密的dex
4.追加dex还原信息（加密dex偏移量等还原信息）
5.追加还原信息长度（末尾4字节）
6.filesize：dex原来长度+dex加密字节长度+dex还原信息长度+4字节（还原信息长度）
6.计算signature（除了标识头，checksum其余的hash值）
7.计算checksum（除了标识头，checksum外所有）
8.重新打包

实现还原：

末尾4字节
得到还原信息
得到dex字节列表进行加密
dexclassloader进行加载替换结束

被保护apk+脱壳dex 合并生成新的dex 重新签名打包apk

图片描述

打包后的结构

图片描述

工具脱壳

简述

通用脱壳工具好使，遇到反脱壳的检测手段稍微上点难度就用不了。

dexdump，blackdex，fart

找包packagae

dumpsys window windows | grep mCurrentFocus

adb shell dumpsys window windows | grep mCurrentFocus

mCurrentFocus=Window{e415d0f u0 com.chaoxing.mobile/com.chaoxing.mobile.main.ui.MainTabActivity}

图片描述

frida-dexdump脱壳

核心原理：暴力搜索
git地址：https://github.com/hluwa/frida-dexdump?tab=readme-ov-file
公众号地址：https://mp.weixin.qq.com/s/n2XHGhshTmvt2FhxyFfoMA
 
frida-dexdump -U -n com.chaoxing.mobile -o ./xuexitong -d --sleep 5
 
-o 输出目录
-d 深度搜索
--sleep 等待？s开始脱壳
 
结果：扫描出来一堆没用的dex文件

-n运行

图片描述

显示all done说明结束
 
然后整体编译刚脱壳出来的文件
jadx -d <输出目录路径> *.dex
jadx -d output *.dex
 
如果hook时间不合适 如下图

图片描述

-f运行

图片描述

反编译失败

图片描述

blackdex 32位，64位apk脱壳

blackdex地址 3d1K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6o6L8$3c8A6L8X3N6s2j5i4W2Q4x3V1k6n7L8r3q4U0K9@1c8W2P5q4)9J5c8Y4u0W2L8r3g2S2M7$3g2K6

图片描述

选择要被脱壳的应用

图片描述

blackdex脱壳成功了

开始抓包（分析三个变化参数 inf_enc明显是个hash串，token没有变化过）

分析笔记页面多刷新几次观察参数变化

图片描述

找到笔记接口

图片描述

找inf_enc参数

这是一个变化参数因为同接口刷新几次以后发现-time，inf_enc变化

搜索inf_enc发现上文在拼接一个stringbuilder函数

图片描述

inf_enc rpc的hook点

图片描述

inf_enc只是一个md5码而已

图片描述

以后深入探讨学习一下blackdex的源代码

图片描述

深入探讨文章地址
 
https://blog.niunaijun.top/index.php/tag/BlackDex/

classloader探讨

职责：类加载器的职责是寻找和加载类

类加载器的种类

图片描述

根据用途划分

系统加载器
- C++写的
- 支撑虚拟机运行
- 无法被java引用
扩展类加载器
- 加载标准类库ext部分
应用程序加载器
- inmemorydexclassloader 内存捞dex文件
- pathclassloader
- dexclassloader
用户自定义加载器

双亲委派

从下面往上找截止顶部结束
从上向下加载到底部或者加载成功结束，否则classnotfound error

目的

执行一次
避免核心类库被替换

类加载器的层次结构

图片描述

高评率使用的加载器（gpt答案）

图片描述

通义千问答案

图片描述

简单说不同加载其有不同职责,职责若干加载器若干!

开发者角度

引导类加载器（BootClassLoader C++），扩展加载器，应用程序加载器（统称原生的系统类加载器）

主要还是因为了解不够的情况下分不太清

用户类自定义类加载器

jdk下系统类加载器

图片描述

注意：类加载器的层次关系不代表是类加载器的继承关系如下图

图片描述

第一层

classloader 抽象定义

secure classloader 继承+安全权限定义

urlclassloader 通过url路径从jar文件和文件夹加载类和资源

图片描述

art角度下的classloader

注意：

开发代码上区别不大，但是jdk下的类加载与art下类加载并不同
图片描述

art，jdk都是虚拟机并遵守了jvm设计上的一些规范 art完全兼容支持 jvm 这也是java可以在sdk环境运行的主要原因

art下开发者角度

系统类加载器
用户自定义类加载器

都是引导类加载器解释如下

图片描述

总结1 art中引导类加载类是java类可以java代码引用并且实现classloader抽象类
总结2 jdk中 bootstrap 加载jdk核心类库 c++实现无java引用也实现classloader抽象类
classloader是顶层规范的抽象类约束加载器继承者的行为

介绍art下的系统类加载器

注意：真实情况下的类加载器数不胜数

bootclassloader（核心类库），pathclassloader（扩展），dexclassloader（app程序）

dexclassloader继承basedexclassloader

可加载dex相关文件
图片描述

pathclassloader继承baseclassloader

加载系统类和应用程序类

图片描述

MainActivity的每一次层classloader验证

图片描述

运行结果显示dexpathclassloader->bootclassloader

图片描述

继承关系

图片描述

加载类介绍

图片描述

引导类加载器如何被创建

zygote进程

main方法是zygoteinit的入口

调用zygoteinit的preload

zygote的preloadClasses（初始化时候预加载常用类）

罗列部分类名

图片描述

结论就是预加载越多（通用）后期app启动就会越快

图片描述

结论

art下的BootClassLoader用于在zygote的初始化阶段创建用于预加载类的加载

总结

图片描述

classloader案例（分析）

BootClassLoader （因为包名不可见所以无法引用）

DexClassLoader

        // 假设 dex 文件位于应用的 files 目录下，名为 "classes2.dex"
        File dexFile = new File("/data/local/tmp/classes.dex");
 
        try {
            // 使用 PathClassLoader 加载 dex 文件
//            PathClassLoader pathClassLoader = new PathClassLoader(dexFile.getAbsolutePath(), getClassLoader());
 
            // 使用 DexFile 来获取 dex 文件中的类
            DexFile dex = new DexFile(dexFile);
            Enumeration<String> entries = dex.entries();
 
            // 遍历 dex 文件中的类
            while (entries.hasMoreElements()) {
                String className = entries.nextElement();
                Log.d("dex-test", className);
                // 你可以在这里进行类的进一步操作，例如实例化或调用方法
            }
        } catch (IOException e) {
            e.printStackTrace();
        }

PathClassLoader

1	`PathClassLoader pathClassLoader =` `new` `PathClassLoader("/data/local/tmp/classes.dex");`

输出
图片描述

InmemoryClassLoader

编译原理前奏知识补充

图片描述

前端
- 词法分析，语法分析，语义分析
优化器
- 中间代码重写
后端
- 中间代码向机器语言的翻译

（逆向分析）art虚拟机中只涉及优化器和后端

编译模式迭代过程（jit just-in-time，aot ahead-of-time）

jit
随后aot
jit+aot

elf文件格式

so文件就是elf（理解elf最好的方式就是写一个解析工具解析一下so文件）

可用readelf工具解析elf

readelf -h xxso 查看头部信息
readelf -S xxxso 查看so section 头信息
readelf -l xxxso 查看so得段头信息
readelf -a xxxso 查看elf全部内容

elf头部定义得伪代码
#include <cstdint>
 
// ELF文件头部结构体
struct ElfHeader {
    uint8_t magic[4];                  // Magic Number
    uint8_t file_type;                 // 文件类型
    uint8_t machine_type;              // 机器类型
    uint8_t version;                   // 版本号
    uint64_t entry_point_addr;         // 入口地址
    uint64_t program_header_offset;    // 程序头表偏移
    uint64_t section_header_offset;    // 节头表偏移
    uint32_t flags;                    // 标志
    uint16_t header_size;              // 头部大小
    uint16_t program_header_entry_size;// 程序头表条目大小
    uint16_t num_program_headers;      // 程序头表条目数量
    uint16_t section_header_entry_size;// 节头表条目大小
    uint16_t num_section_headers;      // 节头表条目数量
    uint16_t string_table_index;       // 字符串表索引
};
 
// 定义ELF文件头部的魔术数字
const uint8_t ELF_MAGIC[4] = {0x7F, 'E', 'L', 'F'};
 
// 根据实际情况定义其他常量和结构体

头部信息解释

Magic Number: ELF文件的开始处包含一个特殊的魔术数字，用于标识文件的格式。在32位ELF文件中，这个数字是0x7F, 'E', 'L', 'F'的组合；在64位ELF文件中，这个数字是0x7F, 'E', 'L', 'F', '2'的组合。
文件类型（File Type）: 指示文件的类型，如可执行文件、目标文件、共享目标文件等。
机器类型（Machine Type）: 指示文件目标体系结构的类型，如x86、ARM、MIPS等。
版本号（Version）: 指示ELF格式的版本号。
入口地址（Entry Point Address）: 可执行文件的入口点地址，即程序开始执行的地址。
程序头表偏移（Program Header Table Offset）: 指示程序头表的偏移量，程序头表包含了有关可执行文件的段信息。
节头表偏移（Section Header Table Offset）: 指示节头表的偏移量，节头表包含了有关文件中各个节（sections）的信息。
标志（Flags）: 包含了一些标志位，用于指示一些特殊的属性，比如是否包含重定位信息等。
头部大小（Header Size）: 指示ELF头部的大小。
程序头表条目大小（Program Header Table Entry Size）: 指示每个程序头表条目的大小。
程序头表条目数量（Number of Program Header Table Entries）: 指示程序头表中的条目数量。
节头表条目大小（Section Header Table Entry Size）: 指示每个节头表条目的大小。
节头表条目数量（Number of Section Header Table Entries）: 指示节头表中的条目数量。
字符串表索引（String Table Index）: 指示节头表中字符串表的索引，用于存储字符串信息，比如节名等。

安卓打包

图片描述

dex文件格式

图片描述

dex头部信息描述

图片描述

string_ids 索引所有字符串
type_ids 储存所有类型（类类型，基本类型）
proto_ids 函数原型
fields_id 类变量

classdef 数据结构

存放类信息，相比dex文件更复杂，因为有数据指向了data区

class_idx: 一个指向类型描述符列表（type_ids）的索引，指示类的类型。
access_flags: 类的访问标志，指示类的访问权限和特性，例如 public, private, final 等。
superclass_idx: 一个指向类型描述符列表（type_ids）的索引，指示父类的类型。
interfaces_off: 指向接口列表的偏移量，列出了该类实现的所有接口。
source_file_idx: 指向源文件名的索引，指示该类的源文件名（如果有的话）。
annotations_off: 指向注解列表的偏移量，列出了与该类关联的所有注解。
class_data_off: 指向类数据项的偏移量，其中包含了该类的字段和方法的详细信息。
static_values_off: 指向静态变量值列表的偏移量，列出了该类的所有静态变量的初始值。

codeitem 定义

registers_size: 该方法使用的寄存器数量。
ins_size: 方法的输入参数数量。
outs_size: 方法的输出参数数量。
tries_size: 异常处理器列表的大小。
debug_info_off: 调试信息的偏移量，指向方法的调试信息。
insns_size: 方法的指令数量。
insns: 方法的指令数组，包含方法的所有指令。

blackdex原理

总结：

虚拟化技术让app进程运行，加固壳自解密

前置原理

安卓虚拟化技术
dex加载原理
dexfile结构
安卓hook

基于blackbox开发的

简单说在blackdex app中安装一个安卓系统，在这个安卓系统中安装需要脱壳的app，然后基于dexfile结构体和加载原理脱壳进行代码还原
图片描述

dex加载进内存

application通过loadedapk#makeapplication完成

fart脱壳 -理解hanbing大佬系列文章

fart系列1 拨云见日

（明文阶段）获取dex起点和尺寸
两个脱壳点 dexfileparser（dex明文字节流解析），openmemory参数包含dex开始位置和大小（解密明文写入内存）
fart的脱壳核心就是明文dex的起点和尺寸

图片描述

java中脱壳，可以通过类关联到其所在的dex，class->classloader->getDex->getbytes
- 类关联到classloader
- classloader关联到dex对象
- dex对象中字节流就是dex明文

art下关键字快速定位

找到海量c++脱壳点
- 直接查找搜 "dexfile"
- 间接查找能够间接获取art得dexfile，如artMethod得到dexfile
彩蛋部分提供的脱壳原理基于Android ART（Android RunTime）环境的特定运行机制，特别是其对DEX（Dalvik Executable）文件的处理方式。以下是彩蛋部分脱壳原理的详细解读：

1. ART编译机制与脱壳

dex2oat：将编译的dex文件（编译代码的中间表示形式）编译成art虚拟机可以直接执行的oat机器码

编译粒度： oat编译是函数粒度的编译，但有一部分函数不会被预编译，而是动态编译执行。

脱壳机会：壳会干扰dex2oat的编译过程，即使预编译的代码也不一定会执行，那么结论就是还是倾向于动态编译执行，这就是脱壳机会，拿到dex句柄或者指针，从而获得dex尺寸和偏移量。

图片描述

fart系列2 FART正餐前甜点

整体流程

重点1 类加载

上图右下角 art下类加载流程经历了 loadclass ---> loadclassmember（一个脱壳点） ->linkcode的过程（逻辑推理就是代码执行过程中需要什么就提前加载什么到自己的作用域，如指令，类，方法等）

重点2 抽取壳子的思路（code_off和insns的smali数组）

图片描述

insns_size代表smali数组长度

insns代表smali数组通常两个字节数组

抽取壳子的主要下手思路（占坑型或重构型策略，）

把codeitem中insns的smali数组全部nop掉
code_off链接到代码，破坏虚拟机加载好的codeitem区域，建立新的codeitem 区域，代码执行之前修改code_off指向正确的codeitem的地址区域（用户指定地址下的codeitem区域）

总结就是：

直接，间接有dexfile引用的地方都可以整一个dump点，进行整体dex的脱壳

Android ART环境中的一种通用、简单且高效的内存中DEX脱壳方法。这种方法利用了ART类加载执行流程中的关键类ArtMethod及其相关函数，通过Hook技术（如Xposed或Frida）实现对加固应用的脱壳。以下是该方法的概述和实现细节：

fart系列3 FART：ART环境下基于主动调用的自动化脱壳方案

app启动流程

图片描述

ActivityThread.main()是App进程的入口，负责启动主消息循环和初始化关键组件。
handleBindApplication方法在接收到系统bindApplication请求时被调用，完成应用的真正启动过程。
在这一过程中，首先创建LoadedApk、ContextImpl和Instrumentation对象，然后创建并初始化Application对象。
Application的attachBaseContext和onCreate方法是App代码执行的最早入口，它们分别负责与应用上下文关联和执行全局初始化逻辑。这也是加固工具常选择在此处进行干预（如代码脱壳、安全检查、权限控制等）的原因。

oncreate和attachBaseContext

图片描述

加壳原理与运行流程：

加壳入口：
- 加壳技术利用Application类的attachBaseContext和onCreate方法作为切入点，因为它们是App启动时最先获得执行权限的函数。在这些方法中，壳程序执行加密DEX文件的解密操作。
加载解密后的DEX：
- 解密完成后，壳使用自定义的ClassLoader在内存中加载解密后的DEX文件。这种自定义ClassLoader通常绕过标准的类加载机制，直接加载内存中的DEX数据，避免在磁盘上留下未加密的痕迹。
修复类加载环境：
- 为了使应用能够正常加载并调用解密后的DEX中的类和方法，壳通过Java反射技术修复关键变量，特别是ClassLoader。如果不修正ClassLoader，双亲委派机制会导致系统无法找到解密DEX中的类，引发ClassNotFoundException，导致应用崩溃。
获取解密DEX：
- 一旦壳通过反射设置好了正确的ClassLoader，攻击者可以通过一系列反射操作获取到当前应用所加载的解密后的内存中DEX文件，实现对加密内容的提取。

对抗与反制：

指令抽取型壳：
- 针对整体加密的DEX容易被内存Dump并还原原始DEX的问题，加固厂商发展出指令抽取型壳技术。这种壳只在函数执行前才解密对应方法的指令区域，使得即使Dump内存中的DEX，也无法获取到关键方法的原始指令，增加了脱壳难度。
FUPK3工具：
- 作为应对指令抽取型壳的脱壳工具，FUPK3采用欺骗策略。它主动调用DEX中的各个函数，触发壳在方法执行前的解密操作，从而暴露解密后的指令区域。通过这种方法，FUPK3能够完成对指令抽取型壳的脱壳，提取出原本加密的方法体。

图片描述

将dex文件和bin文件拼接搞定的抽取壳的smali代码

整体壳dump+主动调用

脱壳总结

dexfile结构体完整dump
主动调用每一个方法，实现对codeitem得dump
通过主动dump下来的codeitem对dex被抽取方法进行修复

dumpDexfile

APP中的Application类中的attachBaseContext和onCreate函数是app中最先执行的方法。壳都是通过替换APP的Application类并自己实现这两个函数，并在这两个函数中实现dex的解密加载，hook系统中Class和method加载执行流程中的关键函数，最后通过反射完成关键变量如最终的Classloader，Application等的替换从而完成执行权的交付。、

dumpMethodCode

activityThread中的performLaunchActivity 函数作为时机，获取最终classloader，还有一个好处该函数与最终的application都在activityThread类中

图片描述

通过classloader得到mcookie （so层dexfile的句柄）在framework添加两个函数提供调用 dumpDexFile，dumpMethodCode

dumpDexFile 保存dex文件
dumpMethodCode 保存codeitem

调用art的invoke完成方法的主动调用

在invoke中判断如果是我们自己的调用使用dump 然后返回从而完成对壳的欺骗

对java层传来的method结构体进行类型转换，转成native的ArtMethod对象，接下来调用artMethod的myfartinvoke实现，并完成方法体的dump，

artMethod的invoke我们在第一个参数Thread传递null标志作为主动调用的标识，

（art原理将的不是很好因为没有手动去做实验所以并不知道里面的坑，移植fart编译rom镜像之后再给大家汇报成果）

fart脱一代壳二代壳实验

刷fart8 的镜像

网页上就能搜到（02fK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6*7K9s2g2S2L8X3I4S2L8W2)9J5k6i4A6Z5K9h3S2#2i4K6u0W2j5$3!0E0i4K6u0r3M7q4)9J5c8U0f1%4x3K6f1%4y4K6t1K6x3g2!0q4c8W2!0n7b7#2)9^5z5b7`.`.

找pixel ，pixel xl2，nexus5三种机型的fart镜像（百度就有）

刷机文章链接

75eK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6T1L8r3!0Y4i4K6u0W2j5%4y4V1L8W2)9J5k6h3&6W2N6q4)9J5c8X3u0D9j5h3y4C8j5X3I4S2j5$3E0T1L8r3q4U0K9K6t1J5x3#2)9J5c8X3q4J5N6r3W2U0L8r3g2Q4x3V1k6V1k6i4c8S2K9h3I4K6i4K6u0r3x3e0x3%4x3K6b7I4z5e0j5$3i4K6y4r3M7%4m8E0i4K6y4p5x3e0l9H3x3g2)9J5k6e0t1H3x3e0c8Q4x3X3f1K6x3o6l9I4i4K6u0W2y4e0f1H3x3b7`.`.

镜像成功以后装需要的app，在/sdcard/xxxx下面找自己需要脱的代码包
图片描述

脱壳以后的代码

图片描述

对dex进行反编译

图片描述

切换到smali视角
图片描述

可以得到类的信息和函数的smali信息说明dex的整体是抽取下来了，问题是代码全部是nop 怎么办

这里就需要做第二件事情了，被抽取smali的还原。

这里运行hanbing大佬写的fart python脚本还原
图片描述

可以还原但是有一个问题，python2版本太老了，并且smali代码看着不习惯

因为找到了github的第二个项目 dexrepair，luoyesiqiu写的还原dex文件的抽取代码的项目

e7eK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6D9N6h3!0&6k6i4y4A6M7h3W2#2i4K6u0r3c8r3g2^5f1X3g2H3j5h3W2J5

结论：

出发点是好的，但是由于fart脚本的迭代，导致项目的适用性变差，思路一致，但是还原，解析格式的字节偏移量也需要做一些相应的改动，虽然只是单纯的解析脚本，但是对于不懂dex抽取壳子，codeitem原理的同学来说会有一些吃力。

codeItem原理

再次关于dex文件格式的废话

图片描述

三个区

头部 dex整体概括
索引区域（字符串，类型，原型，类变量，函数，类定义链接到数据区）数据目录
数据区（完全是一大片字节流，全靠索引定位）

classdef 数据结构

图片描述

类id，访问标志，父类id，接口偏移量，源文件id，注解偏移量，类数据偏移量，静态值偏移量等

重点1 class_data_item

class_data_off链接到数据库的class_data_item中（从索引区链接到数据区了）

图片描述

静态变量总数（地址）
类变量数量
类函数数量
虚函数总数
静态变量，类变量数组
静态方法，类方法数组

encodeed_field

描述静态变量，类变量（类变量 id，访问权限标志）

encoded_method

方法id
访问标志
代码偏移量

注意：

描述类变量，静态变量，类方法，静态方法都用的数组！！！！

描述结构体都加了idx_off后缀，因为除了第一个id真的存id以外，后面的所有id都存的是相对于前一个id的差值，这种匪夷所思的设计据说是为了避免id太大造成内存浪费。

重点2 code_off！！终于链接到codeItem了

图片描述

classdef 到class_data_item 到 encode_method的code_off

code_off 就是codeitem的偏移量了

图片描述

针对二代壳 codeItem里面全部是重点，确定一下有什么

虚拟寄存器数量
输入参数总数
输出参数总数
try-catch 块总数
debug-info 调试信息地址（行号，文件名，堆栈等）

！！！！注意以上全部是两字节

insns_size smali指令长度
ushort []insns 真实smali指令数组！！！！！！！！！！！！！！！！！

到此为止后面不分析了（数据够了）

抽取壳就是把insns给抽取掉了

这块借鉴寒冰大佬总结的

抽取壳大多情况两种思路

修改class_data_item里面encoded_method的code_off 偏移量指向正确codeItem才能执行正确代码，原有的codeItem被破坏掉了
将code_item中insns全部抹0

以后造成的结果就是除非执行前还原，否则离线分析，codeitem里面的代码永远都是坏的

如何还原2代壳代码

dexrepair里面代码没什么，就是解析，定义和dex文件一定的数据结构（解析需要的就行），然后计算偏移量

适配 dexrepair 中对应fart的偏移量
图片描述

解析地址是对的，但是函数没正确还原出来（就是dexRepair和fart版本没对应上）

经过按照上述原理修正偏移量和部分适配逻辑以后执行的代码在010editor中去验证

修复之前除了大面积的 00 00 00 00

图片描述

修复以后

图片描述

jadx反编译验证(二代抽取壳抽取的smali代码)

图片描述

抽取壳代码还原以后

图片描述

到此二代壳就还原完毕了

补充信息

反调试，反脱壳有时候脱壳前需要解决的问题，特征屏蔽。在脱壳之前加一个证书几乎无解

目前能把二代壳还原可以更大程度解决一些问题

现状

脱壳脱不下来（脱壳闪退运行了但是壳脱不下来）
加hook有反调试（反调试找不到地方）
抓包有证书双向校验（不知道证书在哪里）

改aosp 自编译系统镜像破局

java2c，so加固，so抽取，ollvm混淆（99%+的垃圾代码），vmp 正在研究

rpc ，objection，frida-trace，frida-talker ，等基于frida的上层工具去进行辅助

总结到目前全是java层的内容居多

so层脱壳还原反混淆核心代码定位
抓不到包问题 tcp udp通杀方案 3f0K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6Y4K9i4c8Z5N6h3u0Q4x3X3g2U0L8$3#2Q4x3V1k6Y4L8$3A6#2k6g2)9J5c8X3g2U0j5i4m8@1N6i4u0W2
反调试（注入闪退）反脱壳设备检测对抗

壳厂商特征

娜迦
libchaosvmp.so , libddog.solibfdog.so

爱加密
libexec.so, libexecmain.so，ijiami.dat

梆梆
libsecexe.so, libsecmain.so,libSecShell.so

梆梆企业版
libDexHelper.so , libDexHelper-x86.so

360
libprotectClass.so, libjiagu.so
libjiagu.so, libjiagu_art.so
libjiagu.so, libjiagu_x86.so

通付盾
libegis.so，libNSaferOnly.so

网秦
libnqshield.so

百度
libbaiduprotect.so

阿里聚安全
aliprotect.dat，libsgmain.so，libsgsecuritybody.so

腾讯
libtup.so, libexec.so，libshell.so
mix.dex
lib/armeabi/mix.dex ,lib/armeabi/mixz.dex

腾讯御安全
libtosprotection.armeabi.so，
libtosprotection.armeabi-v7a.so，
libtosprotection.x86.so

网易易盾
libnesec.so

APKProtect
libAPKProtect.so

几维安全
libkwscmm.so, libkwscr.so, libkwslinker.so

顶像科技
libx3g.so

商业壳逆向案例

特征：

assets下有ijiami文件夹 xxxxx.dat中隐藏so文件
在脱壳代码中找到了，libexec，libmainexec

确定是爱加密的壳

反调试思路为了不阻塞app主进程一般都是异步检测
hook create_pthread 进行绕过解决frida反调试问题
frida可以注入后dump出libexec的so文件（源文件加密 dump运行时明文）用sofix进行还原可以在ida中正常打开
刷fart8 到手机脱壳
使用dexrepair进行二代壳还原
加上双向证书绕过的代码
进入正常分析流程
数据可能会加密通过r0capture 抓包，但是最上层的堆栈都是线程的run方法因为通过hook Thread 的构造函数关联到r0capture的打印堆栈，即可将加密的数据代码与流量堆栈快速关联起来
objection，frida-trace，frida-stalker辅助定位代码，strace，readelf等辅助分析so文件

传播安全知识、拓宽行业人脉——看雪讲师团队等你加入！

最后于 2024-5-13 01:50 被mb_hdptcgkk编辑，原因：修复图片

#脱壳反混淆 #基础理论

收藏・76

免费・20

支持

赞赏记录

参与人

雪币

留言

时间

烬奇小云

你的帖子非常有用，感谢分享！

6天前

mb_vanjeoof

谢谢你的细致分析，受益匪浅！

2025-10-22 16:58

道友请留步

感谢你的积极参与，期待更多精彩内容！

2025-7-3 10:44

LQ6H

这个讨论对我很有帮助，谢谢！

2025-6-29 20:27

mb_bcgnztsa

这个讨论对我很有帮助，谢谢！

2025-6-15 21:19

东方玻璃

+10

感谢你分享这么好的资源！

2025-5-29 00:50

genliese

感谢你的贡献，论坛因你而更加精彩！

2024-11-22 17:06

sinker_

期待更多优质内容的分享，论坛有你更精彩！

2024-9-29 02:49

chased

感谢你的积极参与，期待更多精彩内容！

2024-8-30 10:48

WoodenmanDu

你的帖子非常有用，感谢分享！

2024-8-20 22:35

wx_墨_198

你的帖子非常有用，感谢分享！

2024-5-31 10:10

老小白

为你点赞~

2024-5-25 17:33

MLL123456

为你点赞~

2024-5-24 15:55

shishichen

为你点赞~

2024-5-24 11:25

mb_wpitiize

为你点赞~

2024-5-14 14:11

Ram98

为你点赞~

2024-5-14 09:58

令狐双

为你点赞~

2024-5-13 13:52

你瞒我瞒

为你点赞~

2024-5-13 09:03

bambooeric

为你点赞~

2024-5-13 09:00

huangjw

为你点赞~

2024-5-13 07:35

最新回复 (10)
sunsjw 雪币： 10022 活跃值： (6819) 能力值： ( LV4，RANK：50 ) 在线值：发帖 48 回帖 1310 粉丝 18 关注私信	sunsjw 1 2 楼受益匪浅，感谢了。 2024-5-13 09:02 0
月清晖雪币： 72 活跃值： (694) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 102 粉丝 2 关注私信	月清晖 3 楼感谢楼主分享，挺实用的。 2024-5-13 14:57 0
C0rax 雪币： 1057 活跃值： (668) 能力值： ( LV4，RANK：40 ) 在线值：发帖 2 回帖 12 粉丝 19 关注私信	C0rax 1 4 楼牛逼啊 2024-5-13 16:23 0
daxia200N 雪币： 713 活跃值： (1932) 能力值： ( LV9，RANK：250 ) 在线值：发帖 40 回帖 581 粉丝 7 关注私信	daxia200N 6 5 楼总结的不错 2024-5-24 11:21 0
mb_ldbucrik 雪币： 7 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 522 粉丝 6 关注私信	mb_ldbucrik 6 楼请问用fart脱壳扫描到某一个classloader加载class就闪退，怎么处理呢 2024-12-19 20:33 0
medmi 雪币： 718 活跃值： (15) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	medmi 7 楼双腿不自觉跪下来了 2025-3-27 21:18 0
呼吸24K纯氧雪币： 29 活跃值： (1385) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 66 粉丝 2 关注私信	呼吸24K纯氧 8 楼非常不错 2025-3-28 09:14 0
fengyunabc 雪币： 4702 活跃值： (5257) 能力值： ( LV4，RANK：50 ) 在线值：发帖 11 回帖 582 粉丝 27 关注私信	fengyunabc 1 9 楼感谢分享。 2025-3-28 10:51 0
calleng 雪币： 45 活跃值： (3886) 能力值： ( LV2，RANK：10 ) 在线值：发帖 43 回帖 146 粉丝 73 关注私信	calleng 10 楼楼上,的楼主很强悍, 看雪高研班的头几章都被你,吃的干干净净..... 五体投地佩服的长文, 理解没有半点毛病, 拿来当课件绰绰有余阿. 2025-6-28 12:23 0
mb_gawhfbtl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_gawhfbtl 11 楼大佬，有完整的学习流程或者相关教程吗 2025-10-22 15:49 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

mb_hdptcgkk

发帖

回帖

RANK

关注

私信

他的文章

关于我们

联系我们

企业服务

看雪公众号

最新回复 (10)
sunsjw 雪币： 10022 活跃值： (6819) 能力值： ( LV4，RANK：50 ) 在线值：发帖 48 回帖 1310 粉丝 18 关注私信	sunsjw 1 2 楼受益匪浅，感谢了。 2024-5-13 09:02 0
月清晖雪币： 72 活跃值： (694) 能力值： ( LV2，RANK：10 ) 在线值：发帖 2 回帖 102 粉丝 2 关注私信	月清晖 3 楼感谢楼主分享，挺实用的。 2024-5-13 14:57 0
C0rax 雪币： 1057 活跃值： (668) 能力值： ( LV4，RANK：40 ) 在线值：发帖 2 回帖 12 粉丝 19 关注私信	C0rax 1 4 楼牛逼啊 2024-5-13 16:23 0
daxia200N 雪币： 713 活跃值： (1932) 能力值： ( LV9，RANK：250 ) 在线值：发帖 40 回帖 581 粉丝 7 关注私信	daxia200N 6 5 楼总结的不错 2024-5-24 11:21 0
mb_ldbucrik 雪币： 7 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 522 粉丝 6 关注私信	mb_ldbucrik 6 楼请问用fart脱壳扫描到某一个classloader加载class就闪退，怎么处理呢 2024-12-19 20:33 0
medmi 雪币： 718 活跃值： (15) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 3 粉丝 0 关注私信	medmi 7 楼双腿不自觉跪下来了 2025-3-27 21:18 0
呼吸24K纯氧雪币： 29 活跃值： (1385) 能力值： ( LV2，RANK：10 ) 在线值：发帖 0 回帖 66 粉丝 2 关注私信	呼吸24K纯氧 8 楼非常不错 2025-3-28 09:14 0
fengyunabc 雪币： 4702 活跃值： (5257) 能力值： ( LV4，RANK：50 ) 在线值：发帖 11 回帖 582 粉丝 27 关注私信	fengyunabc 1 9 楼感谢分享。 2025-3-28 10:51 0
calleng 雪币： 45 活跃值： (3886) 能力值： ( LV2，RANK：10 ) 在线值：发帖 43 回帖 146 粉丝 73 关注私信	calleng 10 楼楼上,的楼主很强悍, 看雪高研班的头几章都被你,吃的干干净净..... 五体投地佩服的长文, 理解没有半点毛病, 拿来当课件绰绰有余阿. 2025-6-28 12:23 0
mb_gawhfbtl 雪币： 0 能力值： ( LV1，RANK：0 ) 在线值：发帖 0 回帖 2 粉丝 0 关注私信	mb_gawhfbtl 11 楼大佬，有完整的学习流程或者相关教程吗 2025-10-22 15:49 0
	游客登录 \| 注册方可回帖回帖表情雪币赚取及消费高级回复

[原创]关于最近脱壳的笔记 还请各位大佬指教

学习脱壳笔记 如有问题还请各位大佬指正

整体壳

工具脱壳

找包packagae

frida-dexdump脱壳

-n运行

-f运行

反编译失败

blackdex 32位，64位apk脱壳

选择要被脱壳的应用

blackdex脱壳成功了

找到笔记接口

找inf_enc参数

inf_enc rpc的hook点

inf_enc只是一个md5码而已

以后深入探讨学习一下blackdex的源代码

classloader探讨

类加载器的种类

类加载器的层次结构

高评率使用的加载器（gpt答案）

通义千问答案

开发者角度

jdk下 系统类加载器

art角度下的classloader

art下开发者角度

介绍art下的系统类加载器

MainActivity的每一次层classloader验证

运行结果显示dexpathclassloader->bootclassloader

继承关系

引导类加载器如何被创建

classloader案例（分析）

BootClassLoader （因为包名不可见 所以无法引用）

DexClassLoader

PathClassLoader

InmemoryClassLoader

编译原理前奏知识补充

elf文件格式

dex文件格式

dex头部信息描述

classdef 数据结构

codeitem 定义

blackdex原理

fart脱壳 -理解hanbing大佬系列文章

fart系列1 拨云见日

art下关键字快速定位

fart系列2 FART正餐前甜点

重点1 类加载

重点2 抽取壳子的思路（code_off和insns的smali数组）

fart系列3 FART：ART环境下基于主动调用的自动化脱壳方案

app启动流程

oncreate和attachBaseContext

脱壳总结

dumpDexfile

fart脱一代壳 二代壳实验

刷fart8 的镜像

codeItem原理

再次关于dex文件格式的废话

classdef 数据结构

重点1 class_data_item

重点2 code_off！！终于链接到codeItem了

如何还原2代壳代码

到此二代壳 就还原完毕了

补充信息

壳厂商特征

商业壳逆向案例

[原创]关于最近脱壳的笔记还请各位大佬指教

学习脱壳笔记如有问题还请各位大佬指正

jdk下系统类加载器

BootClassLoader （因为包名不可见所以无法引用）

fart脱一代壳二代壳实验

到此二代壳就还原完毕了