您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

重大线上事故!三元表达式引发的空指针问题

时间:2023-09-07 13:05:33  来源:微信公众号  作者:飞天小牛肉

属实刺激,刚入职不久就遇到这种史诗级的线上 Bug,首页直接崩溃,陈年老代码爆雷,不管落到最后的底层原因是什么,我感觉主要还是上下游的链路太过复杂,治理难度比较大,牵一发而动全身。

知识回顾

三目运算符大家都很熟悉了:

<表达式1> ? <表达式2> : <表达式3>

我习惯称为三元表达式,需要注意的就是:**一个三元表达式从不会既计算 <表达式 2>,又计算 <表达式 3>**。条件运算符是右结合的,也就是说,从右向左分组计算。例如,a ? b : c ? d : e 将按 a ? b : (c ? d : e) 执行。

再来回顾下自动拆箱和装箱机制,JAVA 通过这种机制使得包装类和基本数据类型之间的转换更加方便:

  • 装箱:将基本数据类型转换成包装类(每个包装类的构造方法都可以接收各自数据类型的变量)
  • 拆箱:从包装类之中取出被包装的基本类型数据(使用包装类的 xxxValue 方法)

下面以 Integer 为例,我们来看看 Java 内置的包装类是如何进行拆装箱的:

Integer obj = new Integer(10);  // 装箱
int temp = obj.intValue();   // 拆箱

这种形式的代码是 JDK 1.5 以前的,JDK 1.5 之后,Java 设计者为了方便开发提供了自动装箱(Autoboxing)与自动拆箱的机制,并且可以直接利用包装类的对象进行数学计算。

还是以 Integer 为例我们来看看自动拆装箱的过程:

Integer obj = 10;   // 自动装箱. 基本数据类型 int -> 包装类 Integer
int temp = obj;   // 自动拆箱. Integer -> int
obj ++; // 直接利用包装类的对象进行数学计算
System.out.println(temp * obj);

基本数据类型到包装类的转换,不需要像上面一样使用构造函数,直接 = 就完事儿;同样的,包装类到基本数据类型的转换,也不需要我们手动调用包装类的 xxxValue 方法了,直接 = 就能完成拆箱。这也是将它们称之为自动的原因。

图片图片

我们来看看这段代码反编译后的文件,底层到底是什么原理:

Integer obj = Integer.valueOf(10);
int temp = obj.intValue();

可以看见,自动装箱的底层原理其实就是调用了包装类的 valueOf 方法,而自动拆箱的底层同样还是调用了包装类的 intValue() 方法。

图片图片

问题重现

实际的代码业务逻辑比较复杂,这里我们举一个相对简单的一点的例子先来重现下这个问题:

// 设置成true,保证条件表达式的表达式二一定可以执行
boolean flag = true;
//定义一个包装类对象类型的Boolean变量,值为null 
Boolean nullBoolean = null;
// 定义一个基本数据类型的boolean变量
boolean simpleBoolean = false; 

//使用三目运算符并给 x 变量赋值
boolean x = flag ? nullBoolean : simpleBoolean;

以上代码,在运行过程中,会抛出 NPE:

Exception in thread "mAIn" java.lang.NullPointerException

而且,这个和你使用的 JDK 版本是无关的,我在 JDK 6、JDK 8 和 JDK 14 上做了测试,均会抛出 NPE。

尝试对以上代码进行反编译,使用 jad 工具进行反编译后,得到以下代码:

boolean flag = true;
boolean simpleBoolean = false;
Boolean nullBoolean = null;

boolean x = flag ? nullBoolean.booleanValue() : simpleBoolean;

可以看到,反编译后的代码的最后一行,编译器帮我们做了一次自动拆箱(nullBoolean 是包装类,而 x 是基本类型),而 nullBoolean 是 null,这就出现了 null.booleanValue,从而抛出 NPE。

那么,为什么编译器会进行自动拆箱呢?什么情况下需要进行自动拆箱呢?

原理分析

关于为什么编辑器会在代码编译阶段对于三目运算符中的表达式进行自动拆箱,其实在《The Java Language Specification》(后文简称 JLS,是Java 语言规范,是一切 Java 编程的基础参照文档)的第 15.25 章节中是有相关介绍的。我们直接看 Java SE 1.7 JLS 中关于这部分的描述(因为 1.7 的表述更加简洁一些),原文地址 -> https://docs.oracle.com/javase/specs/jls/se7/html/jls-15.html#jls-15.25:

图片图片

看我框出来的两句话:

  1. If the second and third operands have the same type (which may be the null type),then that is the type of the conditional expression. 当第二位和第三位操作数的类型相同时,则三目运算符表达式的结果和这两位操作数的类型相同
  2. If one of the second and third operands is of primitive type T, and the type of the other is the result of Applying boxing conversion (§5.1.7) to T, then the type of the conditional expression is T. 当第二,第三位操作数分别为基本类型和该基本类型对应的包装类型时,那么该表达式的结果的类型要求是基本类型

为了满足以上规定,又避免程序员过度感知这个规则,所以在编译过程中编译器如果发现三目操作符的第二位和第三位操作数的类型分别是基本数据类型(如 boolean)以及该基本类型对应的包装类型(如 Boolean)时,并且需要返回表达式为包装类型,那么就需要对该包装类进行自动拆箱。

理解下这句话,JLS 的规范是如果第二和第三位操作数分别是基本类型和包装类型,那么要求返回值是基本类型。那如果你自己写的代码返回值是包装类型,那么编译器为了满足 JLS 规范,其实是会自动做一个拆箱的

简单总结:只要表达式 1 和表达式 2 的类型有一个是基本类型一个是包装类型,就会做触发类型对齐的拆箱操作。

下面再列举几个例子加深下理解:

boolean flag = true;
boolean simpleBoolean = false;
Boolean objectBoolean = Boolean.FALSE;

当第二位和第三位表达式都是包装类,表达式返回值也为包装类,编译器不需要做拆箱操作

Boolean x1 = flag ? objectBoolean : objectBoolean;

//反编译后代码(不需要做任何特殊操作)
Boolean x1 = flag ? objectBoolean : objectBoolean;

当第二位和第三位表达式都为基本类型时,表达式返回值也为基本类型,编译器不需要做拆箱操作

boolean x2 = flag ? simpleBoolean : simpleBoolean;

//反编译后代码(不需要做任何特殊操作)
boolean x2 = flag ? simpleBoolean : simpleBoolean;

当第二位和第三位表达式中一个为基本类型另一个为包装类型时,表达式返回值为基本类型,编译器需要做拆箱操作:

boolean x3 = flag ? objectBoolean : simpleBoolean;

//反编译后代码(需要对其中的包装类进行拆箱)
boolean x3 = flag ? objectBoolean.booleanValue() : simpleBoolean;

如果你清楚三目运算符的规则,那你就会正确地按照以上方式去定义 x1、x2 和 x3 的类型。

但是,并不是所有人都熟知这个规则,所以在实际应用中,还会出现以下几种定义方式:

boolean x4 = flag ? objectBoolean : objectBoolean;

// 反编译后代码(三元表达式的结果要求是包装类,而 x4 是基本类型,所以编译器需要做拆箱)
boolean x4 = (flag ? objectBoolean : objectBoolean).booleanValue();
 
Boolean x5 = flag ? simpleBoolean : simpleBoolean;

// 反编译后代码(三元表达式的结果要求是基本类型,而 x5 是包装类型,所以编译器需要做装箱)
Boolean x5 = Boolean.valueOf(flag ? simpleBoolean : simpleBoolean);
 
Boolean x6 = flag ? objectBoolean : simpleBoolean;

// 反编译后代码(三元表达式的结果要求是基本类型,而 x5 是包装类型,所以编译器需要做装箱)
Boolean x6 = Boolean.valueOf(flag ? objectBoolean.booleanValue() : simpleBoolean);

所以,日常开发中就有可能出现以上 6 种情况。在以上 6 种情况中,如果是涉及到自动拆箱的,一旦包装类的值为 null,即 null.booleanValue(),就必然会发生 NPE(装箱不会,因为装箱是 Boolean.valueOf(null),这并不会抛 NPE)。

小伙伴们可以把以上的 x3、x4 以及 x6 中的的包装类设置成 null,看看是不是会抛 NPE:

boolean flag = true;
boolean simpleBoolean = false;
Boolean objectBoolean = Boolean.FALSE;
// 将包装类设置为 null
Boolean nullBoolean = null;

boolean x3 = flag ? nullBoolean : simpleBoolean;
boolean x4 = flag ? nullBoolean : objectBoolean;
Boolean x6 = flag ? nullBoolean : simpleBoolean;

以上三种情况,都会在执行时发生 NPE:

  • 其中 x3 和 x6 是三目运算符运算过程中,根据 JLS 的规则确定类型的过程中要做自动拆箱而导致的 NPE。由于使用了三目运算符,并且第二、第三位操作数分别是基本类型和对象。就需要对对象进行拆箱操作,由于该对象为 null,所以在拆箱过程中调用 null.booleanValue() 的时候就报了 NPE。
  • 而 x4 是因为三目运算符运算结束后根据规则他得到的是一个对象类型,但是在给变量赋值过程中进行自动拆箱所导致的 NPE。


Tags:空指针   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
Java空指针检查实在看不下去了——转用Optional真香
前言在Java开发中,空指针是程序员遇到的最多的异常之一(特别是刚接触java开发的),对于对象中的某个属性,有时候我们为了避免程序报空指针错误,而不得不使用较多的if、else来进行逻...【详细内容】
2023-11-14  Search: 空指针  点击:(268)  评论:(0)  加入收藏
使用Optional优雅避免空指针异常
在编程世界中,「空指针异常(NullPointerException)」无疑是我们最常遇到的"罪魁祸首"之一。它像一片隐蔽的地雷,静静地等待着我们不小心地踏入,给我们的代码带来潜在的威胁。这种...【详细内容】
2023-09-26  Search: 空指针  点击:(270)  评论:(0)  加入收藏
重大线上事故!三元表达式引发的空指针问题
属实刺激,刚入职不久就遇到这种史诗级的线上 Bug,首页直接崩溃,陈年老代码爆雷,不管落到最后的底层原因是什么,我感觉主要还是上下游的链路太过复杂,治理难度比较大,牵一发而动全身...【详细内容】
2023-09-07  Search: 空指针  点击:(264)  评论:(0)  加入收藏
Java8特性之Optional:如何干掉空指针?
Optional的作用是什么?他都有哪些方法?阿里规范点名说尽量用Optional来避免空指针,那么什么场景用Optional?本篇文章围绕这三点来进行讲解。目录 一、Optional类的来源 二、Opt...【详细内容】
2022-06-27  Search: 空指针  点击:(234)  评论:(0)  加入收藏
C++空指针使用nullptr代替NULL
C/C++中,为了避免野指针(即指针没有指向任何地址)的出现,声明一个指针后,最好马上对其进行初始化。如果暂时不明确指针指向哪个变量,则可以赋予NULL,如:int* p = NULL;除了NULL之外...【详细内容】
2020-07-29  Search: 空指针  点击:(522)  评论:(0)  加入收藏
Java8新特性之空指针异常的克星Optional类
Java8新特性系列我们已经介绍了Stream、Lambda表达式、DateTime日期时间处理,最后以“NullPointerException” 的克星Optional类的讲解来收尾。背景作为开发人员每天与NullP...【详细内容】
2019-11-29  Search: 空指针  点击:(477)  评论:(0)  加入收藏
▌简易百科推荐
即将过时的 5 种软件开发技能!
作者 | Eran Yahav编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto) 时至今日,AI编码工具已经进化到足够强大了吗?这未必好回答,但从2023 年 Stack Overflow 上的调查数据来看,44%...【详细内容】
2024-04-03    51CTO  Tags:软件开发   点击:(5)  评论:(0)  加入收藏
跳转链接代码怎么写?
在网页开发中,跳转链接是一项常见的功能。然而,对于非技术人员来说,编写跳转链接代码可能会显得有些困难。不用担心!我们可以借助外链平台来简化操作,即使没有编程经验,也能轻松实...【详细内容】
2024-03-27  蓝色天纪    Tags:跳转链接   点击:(12)  评论:(0)  加入收藏
中台亡了,问题到底出在哪里?
曾几何时,中台一度被当做“变革灵药”,嫁接在“前台作战单元”和“后台资源部门”之间,实现企业各业务线的“打通”和全域业务能力集成,提高开发和服务效率。但在中台如火如荼之...【详细内容】
2024-03-27  dbaplus社群    Tags:中台   点击:(8)  评论:(0)  加入收藏
员工写了个比删库更可怕的Bug!
想必大家都听说过删库跑路吧,我之前一直把它当一个段子来看。可万万没想到,就在昨天,我们公司的某位员工,竟然写了一个比删库更可怕的 Bug!给大家分享一下(不是公开处刑),希望朋友们...【详细内容】
2024-03-26  dbaplus社群    Tags:Bug   点击:(5)  评论:(0)  加入收藏
我们一起聊聊什么是正向代理和反向代理
从字面意思上看,代理就是代替处理的意思,一个对象有能力代替另一个对象处理某一件事。代理,这个词在我们的日常生活中也不陌生,比如在购物、旅游等场景中,我们经常会委托别人代替...【详细内容】
2024-03-26  萤火架构  微信公众号  Tags:正向代理   点击:(10)  评论:(0)  加入收藏
看一遍就理解:IO模型详解
前言大家好,我是程序员田螺。今天我们一起来学习IO模型。在本文开始前呢,先问问大家几个问题哈~什么是IO呢?什么是阻塞非阻塞IO?什么是同步异步IO?什么是IO多路复用?select/epoll...【详细内容】
2024-03-26  捡田螺的小男孩  微信公众号  Tags:IO模型   点击:(8)  评论:(0)  加入收藏
为什么都说 HashMap 是线程不安全的?
做Java开发的人,应该都用过 HashMap 这种集合。今天就和大家来聊聊,为什么 HashMap 是线程不安全的。1.HashMap 数据结构简单来说,HashMap 基于哈希表实现。它使用键的哈希码来...【详细内容】
2024-03-22  Java技术指北  微信公众号  Tags:HashMap   点击:(11)  评论:(0)  加入收藏
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai作者:Sebastian Raschka机器之心编译编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大...【详细内容】
2024-03-21  机器之心Pro    Tags:LoRA   点击:(12)  评论:(0)  加入收藏
这样搭建日志中心,传统的ELK就扔了吧!
最近客户有个新需求,就是想查看网站的访问情况。由于网站没有做google的统计和百度的统计,所以访问情况,只能通过日志查看,通过脚本的形式给客户导出也不太实际,给客户写个简单的...【详细内容】
2024-03-20  dbaplus社群    Tags:日志   点击:(4)  评论:(0)  加入收藏
Kubernetes 究竟有没有 LTS?
从一个有趣的问题引出很多人都在关注的 Kubernetes LTS 的问题。有趣的问题2019 年,一个名为 apiserver LoopbackClient Server cert expired after 1 year[1] 的 issue 中提...【详细内容】
2024-03-15  云原生散修  微信公众号  Tags:Kubernetes   点击:(6)  评论:(0)  加入收藏
站内最新
站内热门
站内头条