首页
社区
课程
招聘
[原创]基于FastAPI实现的Frida-RPC工具-Arida解析
发表于: 2020-10-13 23:27 5085

[原创]基于FastAPI实现的Frida-RPC工具-Arida解析

2020-10-13 23:27
5085

在这里插入图片描述

 

大家好,本期主题是开源框架的分享,所以今天会给大家分享下最近我接触的一款工具。

本文首发于《安全客 - 有思想的安全新媒体》,也是以本人身份lateautumn4lin原创发布的,原文链接:https://www.anquanke.com/post/id/218915

 

这次介绍的是一款基于FastAPI实现的Frida-RPC工具-Arida(Github地址),我是这个工具的独立开发者,想跟大家介绍下这款工具的开发构想以及它的使用方式。

 

在这里插入图片描述

1 开发设想

  工具往往来源于日常工作,当工作中出现了“重复、重复、又重复”的环节时,一款能够节约时间、提高工作效率的工具便顺应诞生了。我的日常工作会涉及逆向分析APP协议,目前使用的工具一般都是Frida,有时候为了验证分析结果,都会采用Hook的方式调用方法并通过自带RPC的方法暴露出接口来,因为日常分析的APP数量比较多,所以碰到了一系列的问题促使我想给自己开发一套工具提升工作效率。

 

在这里插入图片描述

1.1 工作中遇到的问题

1.1.1 多APP多个Frida-Js文件

  刚刚开始在工作中频繁使用Frida工具的同学一定会发现每次逆向分析APP的时候都需要写不同的JavaScript文件,时间一长,如何维护这么多文件?如何针对不同的APP启动对应的JavaScript文件?每个文件的重复代码如何抽取出来? 这些都是关于Frida-Js文件管理的问题。

1.1.2 写好的Js方法要构造对应的API方法

  这个问题怎么理解呢?大家知道Frida JavaScript Function的暴露方法是这样的

1
2
3
4
5
rpc.exports = {
  decryptData: decrypt_data,
  generateUrl: generate_url,
  encryptData: encrypt_data
}

  使用rpc.exports对应的Map来指定暴露方法和对应的函数,但是这样的话也只是利用了JavaScriptexports关键字使方法暴露出来使其他脚本能够调用。那怎么能够做成Http接口呢?可以直接利用NodeJsHttp框架,例如Express,不过我们使用最多的一般都是Python,例如FlaskDjango这样的框架,用过框架的人都知道我们需要针对每个API写对一个的方法,例如这样

1
2
3
@app.route("/test")
def test():
    return "hello"

  结合这种方式,我们调用Frida-RPC的方式就是这样

1
2
3
4
5
@app.route('/sign')
def sign_test():
    sign = request.args['sign']
    res = script.exports.sign(sign)
    return res

  我们需要针对每个JavaScript方法写对应的Python方法并且要直接调用的参数,这导致的问题就是累积的方法越多,我们的整体项目就越庞大,但是其中很多部分的代码都是重复的简单的调用代码。

1.1.3 协作问题

  同样是个很麻烦的问题,当你很费劲的完成以上的所有操作并且部署好服务之后,其他人要使用你的这些API,你是否能提供一个完整的API文档?难道还是需要一个个接口去写相应的文档?

 

在这里插入图片描述

1.2 工具需要解决哪些痛点

  针对以上的这些问题,我们需要一款高效率的工具能够帮助我们屏蔽这些工作中的细节问题,让我们能够更专注于去逆向分析APP中的调用流程。所以,我们需要一款工具能够完成以下这些功能:

  • 管理JavaScript文件,具备APP-文件的映射关系

  • 自动针对现有的JavaScript方法生成相应的API方法

  • 自动生成Open API文档

在这里插入图片描述

1.3 Arida工具

  当“想开发一个工具”的想法产生的时候,就风风火火的搞起来了,大概花了两个小时的时间,完成了一个简单的工具,也就是这次提到的Arida这个工具,名称来源于FridaAPI这两个词,简单拼接成的,具备的功能也是如上文提到的一样。

1.3.1 具体工作流程

  工作流程如下:

 

 

  主要分为四步:

  • 第一步:利用JavaScript AST树获取到exportsMap中的函数名称以及对应的函数的参数个数,以便于后续的构造PydanticModel

  • 第二步:生成Pydantic动态模型便于FastAPIAPI Doc的生成。

  • 第三步:结合模型以及获取到的JavaScript的方法名和参数个数产生新的Python方法

  • 第四步:注册各个APP相对应的路由,最后注册到全局路由中。

在这里插入图片描述

2 源码解读

  之前大致讲了Arida的整个工作流程,下面主要讲解下各个部分的实现。

 

在这里插入图片描述

2.1 Frida JavaScript脚本函数信息导出

  一般的Frida-Js脚本的是这样的

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
var result = null;
function get_sign(body) {
  Java.perform(function () {
    try {
      var ksecurity = Java.use('com.drcuiyutao.lib.api.APIUtils');
      result = ksecurity.updateBodyString(body)
      console.log("myfunc result: " + result);
    } catch (e) {
      console.log(e)
    }
  });
  return result;
}
 
 
rpc.exports = {
  getSign: get_sign,
}

  我们需要获得的信息是导出函数名以及导出函数对应的内部函数的参数个数,考虑过使用正则来做,不过正则方法显得笨重,所以从JavaScript AST树入手,能够更好的解析到我们需要的信息。

 

  解析的脚本如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
const babel = require('@babel/core')
var exports = new Map();
var functions = new Map();
var result = new Map();
function parse(code) {
  let visitor = {
    // 处理exports节点,获取导出函数对应表
    ExpressionStatement(path) {
      let params = path.node.expression.right;
      try {
        params = params.properties
        for (let i = 0; i < params.length; i++) {
          exports.set(params[i].value.name, params[i].key.name)
        }
      } catch {
 
      }
    },
    // 处理function,获取函数名以及对应参数
    FunctionDeclaration(path) {
      let params = path.node;
      var lst = new Array();
      for (let i = 0; i < params.params.length; i++) {
        lst.push(params.params[i].name)
      }
      functions.set(params.id.name, lst)
    }
  }
  babel.transform(code, {
    plugins: [
      {
        visitor
      }
    ]
  })
  exports.forEach(function (value, key, map) {
    result.set(value, functions.get(key))
  })
  return Object.fromEntries(result);
}

  主要解析了functionexports两个节点,最终返回Map

 

在这里插入图片描述

2.2 FastAPI API接口模型动态生成

  上一步得到了JavaScriptMap数据,大概是这样

1
2
3
{
    "getSign":3
}

  接下来,需要利用这个信息来动态生成接口模型,之所以要生成接口模型,是因为在FastAPI这个框架当中,Post接口使用的是PydanticBaseModel,使用BaseModel的原因也是因为一方面要生成对外的接口文档,另一方面要对参数做类型校验,动态生成的代码如下:

1
2
3
from pydantic import create_model
params_dict = {"a":""}
Model = create_model(model_name, **params_dict)

  引入Pydanticcreate_model,参数是各个方法参数的类型,例如是String类型就直接是"",是int类型就直接是0

 

在这里插入图片描述

2.3 基于Python AST动态生成Python方法

  到了最后一步,有了模型以及JavaScriptMap数据我们就可以动态生成Python方法了,由于一般的API方法都是一样的,如下:

1
2
3
4
def sign_test():
    sign = request.args['sign']
    res = script.exports.sign(sign)
    return res

  我们这需要动态生成以上这种格式就好了,可以采取两种方案

  • 第一种:闭包的方法-函数返回函数,比如

    1
    2
    3
    4
    def outer():
      def inner():
          return "hello"
      return inner
  • 第二种:使用Python AST树生成Python字节码,利用types.FunctionDef来生成,代码如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    function_ast = FunctionDef(
          lineno=2,
          col_offset=0,
          name=func_name,
          args=arguments(
              args=[
                  arg(
                      lineno=2,
                      col_offset=17,
                      arg='item',
                      annotation=Name(lineno=2, col_offset=23,
                                      id=model_name, ctx=Load()),
                  ),
              ],
              vararg=None,
              kwonlyargs=[],
              kw_defaults=[],
              kwarg=None,
              defaults=[],
              posonlyargs=[]
          ),
          body=[
              # Expr(
              #     lineno=3,
              #     col_offset=4,
              #     value=Call(
              #         lineno=3,
              #         col_offset=4,
              #         func=Name(lineno=3, col_offset=4,
              #                   id='print', ctx=Load()),
              #         args=[
              #             Call(
              #                 lineno=3,
              #                 col_offset=10,
              #                 func=Name(lineno=3, col_offset=10,
              #                           id='dict', ctx=Load()),
              #                 args=[Name(lineno=3, col_offset=15,
              #                            id='item', ctx=Load())],
              #                 keywords=[],
              #             ),
              #         ],
              #         keywords=[],
              #     ),
              # ),
              Assign(
                  lineno=3,
                  col_offset=4,
                  targets=[Name(lineno=3, col_offset=4,
                                id='res', ctx=Store())],
                  value=Call(
                      lineno=3,
                      col_offset=10,
                      func=Attribute(
                          lineno=3,
                          col_offset=10,
                          value=Attribute(
                              lineno=3,
                              col_offset=10,
                              value=Name(lineno=3, col_offset=10,
                                         id='script', ctx=Load()),
                              attr='exports',
                              ctx=Load(),
                          ),
                          attr=func_name,
                          ctx=Load(),
                      ),
                      args=[
                          Starred(
                              lineno=4,
                              col_offset=38,
                              value=Call(
                                  lineno=4,
                                  col_offset=39,
                                  func=Attribute(
                                      lineno=4,
                                      col_offset=39,
                                      value=Call(
                                          lineno=4,
                                          col_offset=39,
                                          func=Name(
                                              lineno=4, col_offset=39, id='dict', ctx=Load()),
                                          args=[
                                              Name(lineno=4, col_offset=44, id='item', ctx=Load())],
                                          keywords=[],
                                      ),
                                      attr='values',
                                      ctx=Load(),
                                  ),
                                  args=[],
                                  keywords=[],
                              ),
                              ctx=Load(),
                          ),
                      ],
                      keywords=[],
                  ),
              ),
              Return(
                  lineno=4,
                  col_offset=4,
                  value=Name(lineno=4, col_offset=11, id='res', ctx=Load()),
              ),
          ],
          decorator_list=[],
          returns=None,
      )

      先动态生成对应方法的Python AST树

    1
    2
    3
    4
    module_ast = Module(body=[function_ast], type_ignores=[])
    module_code = compile(module_ast, "<>", "exec")
    function_code = [
    c for c in module_code.co_consts if isinstance(c, types.CodeType)][0]

      生成对应Python AST树字节码

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    function = types.FunctionType(
          function_code,
          {
              "script": script,
              model_name: model,
              "print": print,
              "dict": dict
          }
      )
    function.__annotations__ = {"item": model}

      利用字节码生成新的方法,由于在生成新方法的时候会丢失原字节码的注解,也就是__annotations__这个属性,因此需要在生成新方法之后手动补充。

在这里插入图片描述

3 使用方式

  下面讲下Arida具体的使用方式,项目中已经包含了两个简单的例子,在Apps目录下面,配置信息在config.py文件中。

 

在这里插入图片描述

3.1 两步构建新项目

  如何构建新项目呢?只需要两步就可以了,按照如下所示的步骤:

  1. 第一步:添加配置信息,文件地址是config.py
1
2
3
4
5
6
7
8
9
10
11
12
INJECTION_APPS = [
    {
        "name": "我的测试1",
        "path": "yuxueyuan",
        "package_name": "com.drcuiyutao.babyhealth"
    },
    {
        "name": "我的测试2",
        "path": "kuaiduizuoye",
        "package_name": "com.kuaiduizuoye.scan"
    }
]

  如代码中所示,需要在INJECTION_APPS列表中添加具体APP的信息,主要是三个字段:

  • name:影响的是FastAPI Doc中的分组名称,没有具体的实际意义,可以理解成对看接口文档的人的体验度的提升。

  • path:根据这个字段的值在Apps文件夹中匹配到对应的JavaScript文件。

  • package_name:需要注入的包名

  添加好之后就完成了第一步。

  1. 第二步:开发对应APP的Frida-Js脚本

在这里插入图片描述

3.2 企业级多APP签名API暴露

  因为在日常工作中,我们往往会同时去逆向分析多个APP,所以同时暴露多个APP的API接口测试也是必不可少的,Arida支持同时启动多个APP并注入相应的JavaScript脚本,只需按上面的步骤完成每个APP项目的开发,启动的时候会自动注入相应的APP,同时,在查看文档的时候也会如图所示:

在这里插入图片描述

4 注意点

在这里插入图片描述

4.1 参数类型标记

  由于JavaScript不能指定方法的参数的类型,导致读取到的JavaScript的方法只能是参数个数,不能获取参数的类型,因此生成的Pydantic模型的时候只能统一类型为字符类型,如果想要自定义参数的类型,可以在main.py文件中的function_params_hints来进行配置:

1
2
3
function_params_hints = {
    "encryptData": [0, 0, 0, 0, "", 0, 0, 0, 0, 0, 0]
}

  通过这样来生成合适的参数模型,这样在使用者使用接口的时候由参数模型根据模型中的参数对应的类型来进行类型转化。

 

在这里插入图片描述

 

在这里插入图片描述
在这里插入图片描述


[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

收藏
免费 0
支持
分享
最新回复 (8)
雪    币: 1867
活跃值: (4098)
能力值: ( LV6,RANK:90 )
在线值:
发帖
回帖
粉丝
2
不用做二级path,不同渠道打平到参数列表中。或者ng层写个路由改写规则。

如果所有渠道调用的参数能够通过一个统一接口描述,那么这个统一接口就是自注释的,然后这样就不需要渠道路由级别的文档存在,反而减少了理解成本
2020-10-14 10:29
0
雪    币: 482
活跃值: (1007)
能力值: ( LV3,RANK:20 )
在线值:
发帖
回帖
粉丝
3
virjar 不用做二级path,不同渠道打平到参数列表中。或者ng层写个路由改写规则。 如果所有渠道调用的参数能够通过一个统一接口描述,那么这个统一接口就是自注释的,然后这样就不需要渠道路由级别的文档存在, ...

碰到大佬了,现在公司使用的接口暴露方式就是基于你的sekiro框架改造的。渠道打平在面对大批量渠道的情况下确实减少理解成本以及能够很好的进行渠道管理,之后会把渠道路由降到参数中去,会参考sekiro暴露更多的渠道管理相关的接口。

最后于 2020-10-14 13:59 被Lateautumn4编辑 ,原因:
2020-10-14 13:58
0
雪    币: 1867
活跃值: (4098)
能力值: ( LV6,RANK:90 )
在线值:
发帖
回帖
粉丝
4
Lateautumn4 virjar 不用做二级path,不同渠道打平到参数列表中。或者ng层写个路由改写规则。 如果所有渠道调用的参数能够通过一个统一接口描述,那么这个统一接口就 ...
  有没有兴趣一起搞个sekiro的frida版本。基于Frida的socket编程,直接实现sekiro的二进制协议。这样fridaRPC不再需要内网穿透。同时FridaRPC脚本内置到手机里面,不需要USB通信,完成Frida服务化的脱离主机暴露RPC。FridaRPC分析脚本丝滑迁移到生产环境
2020-10-14 23:30
0
雪    币: 2258
活跃值: (4647)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
5
virjar [em_20][em_27] 有没有兴趣一起搞个sekiro的frida版本。基于Frida的socket编程,直接实现sekiro的二进制协议。这样fridaRPC不再需要内网穿透。同时Frida ...
妙啊妙啊
2020-10-14 23:36
0
雪    币: 1867
活跃值: (4098)
能力值: ( LV6,RANK:90 )
在线值:
发帖
回帖
粉丝
6
小黄鸭爱学习 妙啊妙啊
ᥬ[捂脸] ᭄
2020-10-15 10:08
0
雪    币: 482
活跃值: (1007)
能力值: ( LV3,RANK:20 )
在线值:
发帖
回帖
粉丝
7
virjar [em_20][em_27] 有没有兴趣一起搞个sekiro的frida版本。基于Frida的socket编程,直接实现sekiro的二进制协议。这样fridaRPC不再需要内网穿透。同时Frida ...
哈哈,可以啊,大佬我可以理解成在和sekiro一样,在启动rpc脚本的时候向sekiro服务端注册handler吗?我记得之前看过一个项目:https://github.com/langgithub/SekiroPython是类似这样的吗?
2020-10-15 10:20
0
雪    币: 1867
活跃值: (4098)
能力值: ( LV6,RANK:90 )
在线值:
发帖
回帖
粉丝
8
有点类似,不过最好用js api做一个,API可以封装得优雅一些
2020-10-15 16:01
0
雪    币: 2258
活跃值: (4647)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
9

重启项目好像又没事了

最后于 2020-10-16 16:06 被小黄鸭爱学习编辑 ,原因:
2020-10-16 15:43
0
游客
登录 | 注册 方可回帖
返回
// // 统计代码