首页
社区
课程
招聘
[原创]为Frida编写一个Java代码提示及自动补全插件
发表于: 2020-3-31 03:47 10410

[原创]为Frida编写一个Java代码提示及自动补全插件

2020-3-31 03:47
10410

https://github.com/tacesrever/frida-tsplugin

利用了TypeScript Language Server的可扩展性, 参考 Writing-a-Language-Service-Plugin

调试TypeScript语法树 https://ast.carlosroso.com/

我并未深度测试这个插件, 在使用的过程中你有可能会遇到自动完成信息不准确, 卡顿, 死循环, tsserver崩溃等问题,
欢迎评论或者提issue, 也欢迎有闲心的老哥提出pr改进.

如果你安装了Frida, 不管你熟不熟悉nodejs的生态, 肯定已经安装好了npm (

你需要在你编写注入js文件的目录下运行
(可以不事先创建package.json, 只是会出现一条警告)

npm install @types/frida-gum
之后使用附带TypeScript代码完成功能的编辑器(比如vscode)打开js文件即可.

git clone https://github.com/tacesrever/frida-tsplugin

在使用时
cd frida-tsplugin
frida -U -l agent/tsplugin.js target
adb forward tcp:28042 tcp:28042

以将frida-tsplugin/agent/tsplugin.js注入进目标app中并进行端口转发.
该脚本会开放一个http服务, 来让插件可以远程获取Java类的信息.

若有修改监听地址或为早期版本的frida编译等需求, 可以使用frida-compile自行编译agent/tsplugin.ts并注入输出文件.

在你的项目下创建一个tsconfig.json,
内容参考 frida-agent-example/tsconfig.json
之后在compilerOptions中添加一个plugin:

在vscode中, 这些路径都是基于vscode安装目录/resources/app/extensions来进行相对路径查找的, 所以推荐使用绝对路径.

ps. 对于未能追踪到的类型, 可以使用Java.cast来为其做一个声明

tsserver提供了一种插件机制, 让我们可以编写一个插件, 在自动完成触发时检视代码语法树, 并可以编辑自动完成的结果.
在插件创建时会将info: ts.server.PluginCreateInfo传递给我们, info.languageService是原始的languageService, 其中包含了一系列api函数, 比如findReferences(fileName, position)可以让我们得到处于某个位置的变量的所有引用;
同时我们也可以 "hook" 这些函数, 自动完成插件的实现就是基于hook getCompletionsAtPosition.

getCompletionsAtPosition触发时, 我们会得到一个文件名和一个位置作为参数, 这个位置是自动完成触发时用户的输入焦点;
根据文件名, 我们可以调用info.languageService.getNonBoundSourceFile(fileName)得到一个SourceFile, 而这个SourceFile中就包含了当前的TypeScript语法树.

getNonBoundSourceFile 是未公开导出的内部方法, 返回languageService内部经过缓存的SourceFile.

我们可以在这个语法树中找到位于输入焦点位置的结点(通常是字符"."), 并以它的父节点(通常为PropertyAccessExpression)的第一个子节点为出发点, 来寻找它是不是最终来自于Java.use,
该过程参见 frida-tsplugin/src/index.tsfindInfoProviderForExpr 函数.
在寻找节点的Java类型时首先需要判断节点的语法类型; 在TypeScript中定义了400+种语法类型, 然而我们并不需要处理全部的类型, 只需要处理常见类型即可, 剩下的默认返回为undefined表示没有找到.
常见的情况有:

此时someVar的语法类型为Identifier;

此时someVar.someProp的语法类型为PropertyAccessExpression;

此时前缀的语法类型为CallExpression.

等.

可以利用 https://ast.carlosroso.com/ 来查看语法树结构

当遇到

时, 一开始会拿到varB节点, 而它是一个Identifier, 这时可以通过findReferences(fileName, position)函数来查找对varB的最后一个写入引用. findReferences函数会返回一个由{definition, references}组成的数组, 因为一个变量名可能会在多个地方有不同的定义; references是对该定义所对应的变量所有的引用数组.
references的元素具有isWriteAccess属性, 从中也能拿到该引用位于代码中的位置, 我们就可以遍历findReferences的结果, 找到最后一个写入引用的位置, 再根据该位置在语法树中找到赋值表达式, 之后就可以找到并继续追踪赋值表达式的右值.

在这种情况下我们可以从varB追踪到varA.fieldA.value, 而它的类型是PropertyAccessExpression. 借助语法树我们可以看到它的结构是 (varA.fieldA).(value), 将前面的表达式作为一个整体, 后面的值作为name.
在这时我们其实有两种情况, 一种是varA是一个来自于Java的类型, 又或者它是一个js对象. 这时我们对它的区别判断基于前面是否出现过(expr).(name) = ... 表达式, 可以通过findReferences对value所在的位置查找写入引用来判断.
找到了的话则继续追踪赋值表达式的右值
未找到则我们推测它是一个对Java类型的属性获取, 并递归调用追踪并获取前面的(varA.fieldA)的类型信息, 之后在去查找value在类中所对应的类型.
但是根据frida的语法, 我们默认对一些特殊属性名, 比如"value"等的访问直接推测是Java类型并追踪前缀, 因为有可能出现:

在这时对value进行findReferences是可以找到写入引用的, 但是它是一个Java类型.

对于Java函数的调用可能有多种不同的情况:

overload(...sometype)的语义是找到对应参数类型为...sometype的重载函数, 如果没有overload则会根据参数类型自动判断.
那么我们也可以跟随这个逻辑, 在遇到overload函数调用表达式时, 得益于TypeScript语法树信息的完善, 我们可以从函数调用表达式中直接提取字符串参数作为类型描述寻找对应的重载函数. 没有遇到overload而是直接遇到函数调用表达式时需要继续追踪参数符号的类型, 并根据frida可以进行的自动参数转换, 写出对应的常见语法类型转换为Java变量类型的函数.

目前暂时还没有实现对javaClass.method.apply(someInstance, argArray)中参数类型的判断.

当我们最终跟踪到Java.use(classname)时, 我们就可以借助node-java从jar文件中拿到classname对应的类的信息, 回溯属性访问链, 找到起点的类型信息.

还有另外一种Java类型传递的方式:

这时我们可以追踪到this 是一个ThisKeyword, arg1来自于Parameter类型, 之后我们可以根据语法树寻找(someClass.someFunction).implementation = ... 这个表达式, 从而找到左值, 继续追踪(someClass.someFunction)的类型, 再对arg1 或者this的类型进行判断.

为了避免无用的跟踪, 在查找变量的写入引用前, 会先判断变量的定义类型是否为any或者Java.Warpper(@types/frida-gum 中定义的Java.use返回值类型), 如果不是则停止跟踪查找.

对于frida封装的JavaWarpper中内部的一些属性, 可以从 https://github.com/frida/frida-java-bridge/blob/master/lib/class-factory.js 中找到, 类, 成员函数, 成员变量 分别对应 Wrapper.prototype, Function.prototype, Field.prototype.

除了自动完成外, vscode的 typescript-language-features 通过getQuickInfoAtPosition来获取hover时的展示信息, 通过getCompletionEntryDetails来获取当选择某个自动完成项时右侧展示的符号信息, 我们也可以hook这些函数来提供这些信息.

更具体的细节实现可以查看源码.

 
 
 
 
 
 
 
 
{
    "compilerOptions": {
        ...
        ,
        "plugins": [{
            "name": frida-tsplugin文件夹的绝对路径,
            "host"?: 目标设备ip, 默认为"127.0.0.1"
            "port"?: agent脚本的监听端口,默认是28042
            "logfile"?: 日志文件路径
    }]
        }]
    }
}
{
    "compilerOptions": {
        ...
        ,
        "plugins": [{
            "name": frida-tsplugin文件夹的绝对路径,
            "host"?: 目标设备ip, 默认为"127.0.0.1"
            "port"?: agent脚本的监听端口,默认是28042
            "logfile"?: 日志文件路径
    }]
        }]
    }

[培训]内核驱动高级班,冲击BAT一流互联网大厂工作,每周日13:00-18:00直播授课

最后于 2021-3-6 19:43 被tacesrever编辑 ,原因: 代码更新
收藏
免费 1
支持
分享
最新回复 (6)
雪    币: 15003
活跃值: (6213)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
2
划重点。取这么个名字:什么叫JAVA自动完成?
看半天也不知所云。到底是跟踪java还是js?感觉是跟踪js语句?
2020-3-31 08:07
0
雪    币: 3089
活跃值: (2994)
能力值: ( LV12,RANK:367 )
在线值:
发帖
回帖
粉丝
3
名字稍微改了下  
是在跟踪js, 目的是在编写frida注入代码时 提供一个方便的java信息展示及自动补全功能, 省个一丁点来回切换查阅java信息的事, 所以要在js环境下获取java类的信息.  
2020-3-31 08:33
0
雪    币: 5
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
4
测试了,没有实现效果,不知道哪个步骤不对,我已经提交issue在github上,还有看到回复。
2020-4-3 22:43
0
雪    币: 5
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
5


还是不行,看错了,刚刚,尴尬
最后于 2020-4-3 23:09 被wx_李金山编辑 ,原因: 更新
2020-4-3 23:03
0
雪    币: 4752
活跃值: (2923)
能力值: ( LV7,RANK:100 )
在线值:
发帖
回帖
粉丝
6
太强了,这个功能很实用,感谢楼主。
2020-5-10 11:47
0
雪    币: 229
能力值: ( LV1,RANK:0 )
在线值:
发帖
回帖
粉丝
7
用如此复杂的技术和操作,仅仅就为了实现一个编辑辅助功能..这个时代我越来越不懂了....
2020-6-22 01:50
0
游客
登录 | 注册 方可回帖
返回
//