查看原文
其他

String拼接出现null?网上多数解释竟然是错的,这才是真相

日拱一兵 2023-02-06

Editor's Note

尽信书,不如无书,好多问题最好都是通过自己追踪源码来验证,因为程序不会说谎

The following article is from 程序新视界 Author 二师兄


前言

String类型真是个神奇的存在,动不动就会出现一些迷惑人的错误。今天看到一篇文中提到当String的值为null时,进行字符串相加拼接,会出现把null当做字符串拼接的现象。

比如下面这段代码:

String s = null;
s = s + "hello";
System.out.println(s + " world");

你预期的结果可能是“hello world”,但实际的结果是“nullhello world”,神奇吧。

其实这倒没什么,实践一下就可以看到结果。但当你好奇心作祟,在网上搜为什么时,你看到的答案可能是错的。

我在搜索时,看到访问量上万的文章给出的解释竟然错误的。为了排除一些误导,特意为大家分析一下原因。

错误的原因分析

如果对上述问题进行搜索,你可能看到的答案是:

s + " world" 等价于 s = String.valueOf(s)+"word";

然后附带valueOf方法:

public static String valueOf(Object obj) {
  return (obj == null) ? "null" : obj.toString();
}

你信了吗?如果信了可能真的就错了。下面我们就来分析分析为什么错了。

Java编译器的优化

我们知道,当我们写下面的代码时Java编译器会为我们做一些优化:

String a = "Hello ";
String b = "World";
System.out.println(a + b);

如何优化的?上面这段代码经过编译器优化之后,等价于:

StringBuilder sb = new StringBuilder();
sb.append("Hello ");
sb.append("World");
String result = sb.toString();
System.out.println(result);

也就是说,加号操作会被优化基于StringBuilder的操作,而并不是上面提到的String.valueOf操作。

那么,上面为null的情况也就等价于下面的操作了:

StringBuilder sb = new StringBuilder(null);
sb.append("hello");
sb.append(" world");
String result = sb.toString();
System.out.println(result);

此时,我们再看一下StringBuilder(null)这个构造方法的底层实现,最终调到它的父类AbstractStringBuilder中的append方法:

public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}

对应的appendNull方法实现为:

private AbstractStringBuilder appendNull() {
int c = count;
ensureCapacityInternal(c + 4);
final char[] value = this.value;
value[c++] = 'n';
value[c++] = 'u';
value[c++] = 'l';
value[c++] = 'l';
count = c;
return this;
}

在appendNull方法中就是将null当做字符串“null”来处理了。这也就是为什么会在拼接中出现null的原因。

字节码追踪

针对上述示例,如果你想看编译器是如何处理的,可以通过javap -c 命令来查看对应字节码: 

通过字节码可以看出,基本上与上面的分析的一致。所以说,尽信书不如无书。

拓展问题

解决了上述问题,再来看看,如果我们单纯的就打印null是怎么输出的?

String s = null;
System.out.println(s);

执行上述程序,控制台打印null,这个null是哪儿来的呢?直接看println的底层实现:

public void print(String s) {
if (s == null) {
s = "null";
}
write(s);
}

最终调用到了print方法,如果为null,则打印null字符串。

支持,还没有出现最初的valueOf方法,那么valueOf方法在什么场景下会用到呢?在对象为Object类型时:

Object s = null;
String s1 = String.valueOf(s);
System.out.println(s1);

也就是说在明确调用valueOf方法时,此时s1的值直接是null字符串。

再拓展一下,针对一些基础类型的包装类,比如Integer、Double等:

Integer i = null;
System.out.println(i);

上述代码的处理又不太一样,println方法实现如下:

public void println(Object x) {
String s = String.valueOf(x);
synchronized (this) {
print(s);
newLine();
}
}

也就是说先对对应的Object对象调用valueOf,回到上面的示例,如果Object为null,该方法返回null字符串,后续打印机直接为null。

小结

字符串拼接是很常见的问题,一不小心会出现将null给拼接上的情况。而这状况的出现又牵扯到Java编译器的优化,是不是很有意思?而且正如最开始所述,当我们在网络上搜索资料时也要辨证的去看待答案的准确性。


一篇文章说清楚——主从延迟,面试怎么回答也告诉你

2021-05-14

起飞,会了这4个 Intellij IDEA 调试魔法,阅读源码都简单了

2021-05-13

20张图助你了解JVM运行时数据区,干净又卫生

2021-05-13

IntelliJ IDEA 老司机,还没用过 Stream Trace 功能?

2021-05-12

涨姿势,Java为什么不建议我们使用 Unsafe 类?

2021-05-08


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存