您当前的位置:首页 > 电脑百科 > 软件技术 > 软件技术

一文入门 soot

时间:2022-08-26 10:33:17  来源:  作者:蚁景科技

命令行使用

参考实现:Introduction: Soot as a command line tool

下载地址:
https://soot-build.cs.uni-paderborn.de/public/origin/master/soot/soot-master/

输入以下命令验证一下即可,会有一些提示信息

JAVA -cp sootclasses-trunk-jar-with-dependencies.jar soot.MAIn

Jimple

生成

示例代码

public class ForLoop {
    public static void main(String[] args) {
        int x = 0;
        for(int i = 0; i<10; i++){
            x = x + 1;
        }
    }
}

编译class文件,测试的大概目录如下:

 

命令:

java -cp sootclasses-trunk-jar-with-dependencies.jar soot.Main -cp . -pp -process-dir examples/ForLoop/ -f J

参数的一些解释

  • -cp .:soot有自己的classpath且默认classpath为空,所以使用的时候需要添加一下当前路径
  • -pp:soot的工作需要类型信息、类的完整层次结构,所以需要java.lang.Object,使用该参数可以自动包含所需的jar文件
  • -process-dir:处理的目录
  • -f J:生成Jimple类型的文件,默认在soot.jar的目录下的sootOutput下,也可以用-d指定输出文件夹S:shimpleG:grimple
  • 默认解析class文件,也可以用-src-prec解析指定类型

生成的Jimple文件如下:

public class ForLoop extends java.lang.Object
{

    public void <init>()
    {
        ForLoop r0;

        r0 := @this: ForLoop;

        specialinvoke r0.<java.lang.Object: void <init>()>();

        return;
    }

    public static void main(java.lang.String[])
    {
        java.lang.String[] r0;
        int i1;

        r0 := @parameter0: java.lang.String[];

        i1 = 0;

     label1:
        if i1 >= 10 goto label2;

        i1 = i1 + 1;

        goto label1;

     label2:
        return;
    }
}

基本概念

Soot -- 中间代码Jimple介绍

Day 2 Intermediate Representation

jimple是soot分析用到的中间代码(Intermediate Representation),是有类型的三地址码(typed 3-address code)

先从main方法看:

 

关于这个identity_stmt:

 

另,如果声明的变量有$标记则理解为临时变量(和opcode的内部可重用变量蛮像的)

对于我们这个FoorLoop类,Jimple中的<init>是默认生成的构造函数(源代码没写也会自动加进去),r0会指向this,然后就会调用父类(Object)的构造函数。

 

(invokespecial就是specialinvoke)

public class MethodCall {

    String foo(String para1, String para2) {
        return  para1 + " " + para2;
    }

    public static void main(String[] args) {
        MethodCall mc = new MethodCall();
        String result = mc.foo("hello", "world");
    }
}

它的foo方法的jimple代码如下:

java.lang.String foo(java.lang.String, java.lang.String)
    {
        java.lang.StringBuilder $r0, $r2, $r3, $r5;
        java.lang.String r1, r4, $r6;
        MethodCall r7;

        r7 := @this: MethodCall;

        r1 := @parameter0: java.lang.String;

        r4 := @parameter1: java.lang.String;

        $r0 = new java.lang.StringBuilder;

        specialinvoke $r0.<java.lang.StringBuilder: void <init>()>();

        $r2 = virtualinvoke $r0.<java.lang.StringBuilder: java.lang.StringBuilder Append(java.lang.String)>(r1);

        $r3 = virtualinvoke $r2.<java.lang.StringBuilder: java.lang.StringBuilder append(java.lang.String)>(" ");

        $r5 = virtualinvoke $r3.<java.lang.StringBuilder: java.lang.StringBuilder append(java.lang.String)>(r4);

        $r6 = virtualinvoke $r5.<java.lang.StringBuilder: java.lang.String toString()>();

        return $r6;
    }

CFG

java -cp sootclasses-trunk-jar-with-dependencies.jar soot.tools.CFGViewer -cp . -pp -process-dir examples/ForLoop/

会在sootOutput下生成dot文件,输入以下命令安装graphviz来处理dot文件

apt-get install graphviz
sudo apt-get install graphviz graphviz-doc

生成png

dot -Tpng ForLoopMain.dot -o ForLoop.png

 

IDEA使用

我们先了解一下soot的处理流程

 

Jimple为输入起点,后面的矩形方块内:

  • 第一个字母:s:Shimplej:Jimpleb:Bafg:Grimp
  • 第二个字母:t:transformation(用户定义的处理阶段)o:optimizations(优化)a:attribute generation(属性生成)b:body(方法体创建阶段)
  • 第三个字母p:pack(处理阶段,可见soot的执行被划分成了很多阶段)

突然发现不如一张图来得实在...

 

关于这个全局模式,阶段的组装需要用到

用户可以在转化阶段加入一些自己的分析相关的操作,即在jtp阶段实现。

a easy case

新建一个maven项目导入soot的依赖

<dependency>
    <groupId>org.soot-oss</groupId>
    <artifactId>soot</artifactId>
    <version>4.2.1</version>
</dependency>

初始化配置

@Before
    public void init(){
        soot.G.reset();//re-initializes all of soot
        Options.v().set_src_prec(Options.src_prec_class);//设置处理文件的类型,当然默认也是class文件
        Options.v().set_process_dir(Arrays.asList("target/classes/com/examples"));//处理路径
        Options.v().set_whole_program(true);//开启全局模式
        Options.v().set_prepend_classpath(true);//对应命令行的 -pp
        Options.v().set_output_format(Options.output_format_jimple);//输出jimple文件
        Scene.v().loadNecessaryClasses();//加载所有需要的类
    }

然后就是测试一下:

@Test
    public void test(){
        PackManager.v().runPacks();//运行(要有,不然下面没有输出...坑了好久,加上后运行好慢)
        PackManager.v().writeOutput();//输出jimple到sootOutput目录中
    }

add a transformation

步骤如下:

  1. 实现BodyTransformer或者Sc.NETransformer,其实也就是internalTransform方法实现了转换
  2. 选择阶段(pack),通常是jtp
  3. 写入自己的方法并添加到pack中,运行即可

我们新建一个Transformer

package com.examples;

import soot.Body;
import soot.BodyTransformer;

import java.util.Map;

public class TransformerTest extends BodyTransformer {
    @Override
    protected void internalTransform(Body body, String s, Map<String, String> map) {
        System.out.println(body.getMethod().getName());//输出下程序方法的名字
    }
}

Test里这么写即可:

@Test
    public void test(){
        PackManager.v().getPack("jtp").add(new Transform("jtp.TT", new TransformerTest()));
        for (SootClass appClazz : Scene.v().getApplicationClasses()) {
            for (SootMethod method : appClazz.getMethods()) {
                Body body = method.retrieveActiveBody();
                PackManager.v().getPack("jtp").apply(body);
            }
        }//只分析应用类,运行速度明显快了
    }

这里有几点需要记录一下:

  • jtp是packPhaseName
  • jtp.TT是transformerPhaseName(我们可以随便起的)

 

稍微跟一下上面分析应用类的代码,其中Scene.v().getApplicationClasses()得到所有应用类

 

可以看到body是什么内容,然后直接跟进到apply方法中

 


 

这里猜上面add transformer应该是把jtp.TT名字和我们的transformer绑定在一起,然后根据jtp.TT来找我们的transformer(真的是我猜的,没验证)跟进到apply处,发现找到了

 

最后就到了我们的代码处

 

确实分析起来节省时间,PackManager.v().runPacks()这个都要跑20多s

flow analysis framework

soot自己有个流分析框架,我们要实现的主要流程

  1. 继承自*FlowAnalysis,backword就是BackwardFlowAnalysis<Unit, FlowSet>,forward就是ForwardFlowAnalysis<Unit, FlowSet>
  2. 一些抽象的实现:
  3. 值域的抽象(FlowSet):Soot里有一些默认的,如ArrayPackedSet(其实就是课上提到的bitvector),我们也可以自己实现
  4. copy():其实就是把IN的值给OUT或者OUT给IN (取决于forward或backword)
  5.  
  6. merge():不难理解,就是Transform Function干的事(可以回忆下那两行算法)
  7. flowThrough():是流分析的核心,brain of analysis处理式子(等式右边是表达式)处理从IN到OUT或者OUT到IN到底发生了什么
  8. protected void flowThrough(FlowSet src, Unit u, FlowSet dest)
  9. 我们还需要补充下Soot中Box的概念
  10.  
  11. 用上面(Unit)u的方法即可得到Box了,如u.getUseBoxes(),u.getDefBoxes(),那么也就不难理解Unit是啥了,上图中的s其实也是一个Unit
  12. 我们还要再补充一点点,soot.Local:代表了Jimple中的本地变量
  13. 初始化IN和OUT(边界和每个BB的值):newInitialFlow(),entryInitialFlow()
  14. 实现构造函数,且必须要调用doAnalysis
  15. super(graph); super.doAnalysis()
  16. 查看结果:(就在本类里测试,当然也可以将我们这个类加入jtp当中)
  17. OurAnalysis analysis = new OurAnalysis(graph); analysis.getFlowBefore(s);//Unit s analysis.getFlowAfter(s);

把这些基础的用法都了解,才能在后面更加关注静态分析核心的算法部分(加油)

申明:本文仅供技术交流,请自觉遵守网络安全相关法律法规,切勿利用文章内的相关技术从事非法活动,如因此产生的一切不良后果与文章作者无关 本文原创作者:cyanm0un



Tags:soot   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
一文入门 soot
命令行使用参考实现:Introduction: Soot as a command line tool下载地址: https://soot-build.cs.uni-paderborn.de/public/origin/master/soot/soot-master/输入以下命令验...【详细内容】
2022-08-26  Search: soot  点击:(472)  评论:(0)  加入收藏
▌简易百科推荐
如何在Windows 10中查看电脑的名称?这里提供详细步骤
你想在有多台计算机组成的网络上查找你的计算机吗?一种方法是找到你的电脑名称,然后在网络上匹配该名称。下面是如何在Windows 10中使用图形和命令行方法查看你的计算机名称。...【详细内容】
2024-04-10  驾驭信息纵横科技    Tags:Windows 10   点击:(2)  评论:(0)  加入收藏
移动版 Outlook 解锁新技能,可验证登录 OneDrive 等微软服务
IT之家 4 月 9 日消息,微软公司近日发布新闻稿,宣布用户可以使用 Outlook 手机应用,轻松登录 Teams、OneDrive、Microsoft 365 以及 Windows 等微软账号服务。移动端 Outlook...【详细内容】
2024-04-09    IT之家  Tags:Outlook   点击:(3)  评论:(0)  加入收藏
Win10/Win11和 macOS用户反馈:谷歌云服务“捆绑”系统 DNS 设置
IT之家 4 月 6 日消息,谷歌公司承认旗下的 Google One 订阅服务中存在问题,在 Windows 10、Windows 11 以及 macOS 系统上会更改系统 DNS 设置,变更为 8.8.8.8 地址。Google On...【详细内容】
2024-04-08    IT之家  Tags:Win10   点击:(7)  评论:(0)  加入收藏
电脑卡顿怎么重装系统,快看这篇
电脑卡顿时,重装系统确实是一种可能的解决方案。以下是重装系统的详细步骤:备份重要数据:首先,你需要将电脑中的重要文件和数据备份到外部存储设备(如U盘、移动硬盘或云存储)中,以...【详细内容】
2024-04-04  科技数码前锋    Tags:重装系统   点击:(2)  评论:(0)  加入收藏
如何检查电脑的最近历史记录?这里提供详细步骤
如果你怀疑有人在使用你的计算机,并且你想查看他们在做什么,下面是如何查看是否有访问内容的痕迹。如何检查我的计算机的最近历史记录要检查计算机的最近历史记录,应该从web浏...【详细内容】
2024-03-30  驾驭信息纵横科技    Tags:历史记录   点击:(1)  评论:(0)  加入收藏
关于Windows中AppData的相关知识,看这篇文章就可以了
如果AppData文件夹占用了你电脑上的太多空间,则需要清理AppData文件夹。下面是一些帮助你在Windows计算机上进行AppData清理的方法。什么是AppData文件夹AppData文件夹是保存...【详细内容】
2024-03-30  驾驭信息纵横科技    Tags:AppData   点击:(3)  评论:(0)  加入收藏
微软 Edge 浏览器将迎来“内存限制器”功能,用户可自主控制 Edge 内存占用
IT之家 3 月 28 日消息,微软即将为其 Edge 浏览器带来一项实用新功能,据悉该公司正在测试一项内置的内存限制器,这项功能可以让用户限制 Edge 所占用的内存,防止浏览器超出内存...【详细内容】
2024-03-29    IT之家  Tags:Edge   点击:(15)  评论:(0)  加入收藏
一寸照片的大小如何压缩?四个实测效果很好的方法
一寸照片作为生活中常见的尺寸之一,常用于各类证件照与证明文件的制作。然而,受限于其较为狭小的尺寸,上传及打印过程中很容易出现尺寸超限的情况。所以,这个时候就需要对其体积...【详细内容】
2024-03-18  宠物小阿涛    Tags:压缩   点击:(14)  评论:(0)  加入收藏
手机投屏到电脑/电视的方法
方法一:Win10自带的投影功能1、将手机和电脑连接同一个无线网络。2、选择【开始】>【设置】>【系统】>【投影到此电脑】3、将默认的始终关闭的选项更改为所有位置都可用。4、...【详细内容】
2024-03-18    老吴讲I  Tags:投屏   点击:(16)  评论:(0)  加入收藏
微软商店怎么卸载应用 一分钟快速看懂!
微软商店怎么卸载应用 一分钟快速看懂!微软公司(Microsoft Corporation)是一家全球领先的科技企业,总部位于美国华盛顿州的雷德蒙德。成立于1975年,由比尔&middot;盖茨和保罗&mid...【详细内容】
2024-02-27  婷婷说体育    Tags:微软商店   点击:(38)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条