线上项目出BUG没法调试?推荐这款阿里开源的诊断神器!

    技术2024-11-23  19

    线上项目遇到问题无法调试,线下又无法重现,难道只能加日志再重新发布么?有了这款神器,既可以线上调试,又可以实现热修复,推荐给大家!

    Arthas 简介

    Arthas是Alibaba开源的Java诊断工具,深受开发者喜爱。它采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。

    安装

    为了还原一个真实的线上环境,我们将通过Arthas来对Docker容器中的Java程序进行诊断。

    使用arthas-boot,下载对应jar包,下载地址:https://alibaba.github.io/arthas/arthas-boot.jar

    将我们的Spring Boot应用mall-tiny-arthas使用Docker容器的方式启动起来,打包和运行脚本在项目的src\main\docker目录下;

    将arthas-boot.jar拷贝到我们应用容器的\目录下;

    docker container cp arthas-boot.jar mall-tiny-arthas:/

    进入容器并启动arthas-boot,直接当做jar包启动即可;

    docker exec -it mall-tiny-arthas /bin/bash java -jar arthas-boot.jar

    启动成功后,选择当前需要诊断的Java程序的序列号,这里是1,就可以开始诊断了;

    期间会下载一些所需的文件,完成后控制台打印信息如下,至此Arthas就安装启动完成了。

    常用命令

    我们先来介绍一些Arthas的常用命令,会结合实际应用来讲解,带大家了解下Arthas的使用。

    dashboard

    使用dashboard命令可以显示当前系统的实时数据面板,包括线程信息、JVM内存信息及JVM运行时参数。

    thread

    查看当前线程信息,查看线程的堆栈,可以找出当前最占CPU的线程。

    常用命令:

    # 打印当前最忙的3个线程的堆栈信息 thread -n 3 # 查看ID为1都线程的堆栈信息 thread 1 # 找出当前阻塞其他线程的线程 thread -b # 查看指定状态的线程 thread -state WAITING

    sysprop

    查看当前JVM的系统属性,比如当容器时区与宿主机不一致时,可以使用如下命令查看时区信息。

    sysprop |grep timezone user.timezone                  Asia/Shanghai

    sysenv

    查看JVM的环境属性,比如查看下我们当前启用的是什么环境的Spring Boot配置。

    logger

    使用logger命令可以查看日志信息,并改变日志级别,这个命令非常有用。

    比如我们在生产环境上一般是不会打印DEBUG级别的日志的,当我们在线上排查问题时可以临时开启DEBUG级别的日志,帮助我们排查问题,下面介绍下如何操作。

    我们的应用默认使用的是INFO级别的日志,使用logger命令可以查看;

    使用如下命令改变日志级别为DEBUG,需要使用-c参数指定类加载器的HASH值;

    logger -c 21b8d17c --name ROOT --level debug

    再使用logger命令查看,发现ROOT级别日志已经更改;

    使用docker logs -f mall-tiny-arthas命令查看容器日志,发现已经打印了DEBUG级别的日志;

    查看完日志以后记得要把日志级别再调回INFO级别。

    logger -c 21b8d17c --name ROOT --level info

    sc

    查看JVM已加载的类信息,Search-Class的简写,搜索出所有已经加载到 JVM 中的类信息。

    搜索com.macro.mall包下所有的类;

    sc com.macro.mall.*

    打印类的详细信息,加入-d参数并指定全限定类名;

    sc -d com.macro.mall.tiny.common.api.CommonResult

    打印出类的Field信息,使用-f参数。

    sc -d -f com.macro.mall.tiny.common.api.CommonResult

    sm

    查看已加载类的方法信息,Search-Method的简写,搜索出所有已经加载的类的方法信息。

    查看类中的所有方法;

    sm com.macro.mall.tiny.common.api.CommonResult

    查看指定方法信息,使用-d参数并指定方法名称;

    sm -d com.macro.mall.tiny.common.api.CommonResult getCode

    jad

    反编译已加载类的源码,觉得线上代码和预期不一致,可以反编译看看。

    查看启动类的相关信息,默认会带有ClassLoader信息;

    jad com.macro.mall.tiny.MallTinyApplication

    使用--source-only参数可以只打印类信息。

    jad --source-only com.macro.mall.tiny.MallTinyApplication

    mc

    内存编译器,Memory Compiler的缩写,编译.java文件生成.class。

    redefine

    加载外部的.class文件,覆盖掉 JVM中已经加载的类。

    monitor

    实时监控方法执行信息,可以查看方法执行成功此时、失败次数、平均耗时等信息。

    monitor -c 5 com.macro.mall.tiny.controller.PmsBrandController listBrand

    watch

    方法执行数据观测,可以观察方法执行过程中的参数和返回值。

    使用如下命令观察方法执行参数和返回值,-x表示结果属性遍历深度。

    watch com.macro.mall.tiny.service.impl.PmsBrandServiceImpl listBrand "{params,returnObj}" -x 2

    热更新

    尽管在线上环境热更代码并不是一个很好的行为,但有的时候我们真的很需要热更代码。下面介绍下如何使用jad/mc/redefine来热更新代码。

    首先我们有一个商品详情的接口,当我们传入id<=0时,会抛出IllegalArgumentException;

    /**  * 品牌管理Controller  * Created by macro on 2019/4/19.  */ @Api(tags = "PmsBrandController", description = "商品品牌管理") @Controller @RequestMapping("/brand") public class PmsBrandController {     @Autowired     private PmsBrandService brandService;     private static final Logger LOGGER = LoggerFactory.getLogger(PmsBrandController.class);     @ApiOperation("获取指定id的品牌详情")     @RequestMapping(value = "/{id}", method = RequestMethod.GET)     @ResponseBody     public CommonResult<PmsBrand> brand(@PathVariable("id") Long id) {         if(id<=0){             throw new IllegalArgumentException("id not excepted id:"+id);         }         return CommonResult.success(brandService.getBrand(id));     } }

    调用接口会返回如下信息,调用地址:http://192.168.5.94:8088/brand/0

    {   "timestamp": "2020-06-12T06:20:20.951+0000",   "status": 500,   "error": "Internal Server Error",   "message": "id not excepted id:0",   "path": "/brand/0" }

    我们想对该问题进行修复,如果传入id<=0时,直接返回空数据的CommonResult,代码修改内容如下;

    /**  * 品牌管理Controller  * Created by macro on 2019/4/19.  */ @Api(tags = "PmsBrandController", description = "商品品牌管理") @Controller @RequestMapping("/brand") public class PmsBrandController {     @Autowired     private PmsBrandService brandService;     private static final Logger LOGGER = LoggerFactory.getLogger(PmsBrandController.class);          @ApiOperation("获取指定id的品牌详情")     @RequestMapping(value = "/{id}", method = RequestMethod.GET)     @ResponseBody     public CommonResult<PmsBrand> brand(@PathVariable("id") Long id) {         if(id<=0){ //            throw new IllegalArgumentException("id not excepted id:"+id);             return CommonResult.success(null);         }         return CommonResult.success(brandService.getBrand(id));     } }

    首先我们需要对PmsBrandController类代码进行修改,接着上传到服务器,然后使用如下命令将java文件拷贝到容器的/tmp目录下;

    docker container cp /tmp/PmsBrandController.java mall-tiny-arthas:/tmp/

    之后我们需要查看该类的类加载器的Hash值;

    sc -d *PmsBrandController | grep classLoaderHash

    之后使用内存编译器把改.java文件编译成.class文件,注意需要使用-c指定类加载器;

    mc -c 21b8d17c /tmp/PmsBrandController.java -d /tmp

    最后使用redefine命令加载.class文件,将原来加载的类覆盖掉;

    redefine -c 21b8d17c /tmp/com/macro/mall/tiny/controller/PmsBrandController.class

    我们再次调用接口进行测试,发现已经返回了预期的结果,调用地址:http://192.168.3.101:8088/brand/0

    {   "code": 200,   "message": "操作成功",   "data": null }

    参考资料

    官方文档:https://alibaba.github.io/arthas/

    项目源码地址

    https://github.com/macrozheng/mall-learning/tree/master/mall-tiny-arthas

    推荐阅读

    Spring Boot 把 Maven 干掉了,正式拥抱 Gradle!

    性能优越的轻量级日志收集工具,微软、亚马逊都在用!

    15个Github使用技巧,你肯定有不知道的!

    写了100多篇原创文章,我常用的在线工具网站推荐给大家!

    还在用Swagger生成接口文档?我推荐你试试它.....

    你居然还去服务器上捞日志,搭个日志收集系统难道不香么!

    真惨!连各大编程语言都摆起地摊了,Java摊位真大!

    RabbitMQ实现延迟消息居然如此简单,整个插件就完事了!

    一个不容错过的Spring Cloud实战项目!

    我的Github开源项目,从0到20000 Star!


    欢迎关注,点个在看

    Processed: 0.047, SQL: 9