你好,我是朱涛。这节加餐,我们来聊聊空安全思维。

空(null),是很多编程语言中都有的设计,不同的语言中名字也都不太一样,比如Java和Kotlin里叫null,在Swift里叫做nil,而Objective-C当中,根据情况的不同还细分了NULL、nil、Nil等等。

如果你有Java的经验,那你一定不会对NullPointerException(NPE,代码中常见的逻辑错误)感到陌生。null会引起NPE,但是在很多场景下,你却不得不使用它。因为null用起来实在是太方便了。比如说,前面第4讲里,我提到的计算器程序当中的calculate()方法,它的返回值就是可为空的,当我们的输入不合法的时候,calculate()就会返回null。

一般来说,我们会习惯性地用null来解决以下这些场景的问题:

虽然这些场景,我们不借助null也可以漂亮地解决,但null其实才是最方便的解决方案。因为总的来说,null代表了一切不正常的值。如果没有了null,我们编程的时候将会面临很多困难。

所以,null对于我们开发者来说,是一把双刃剑,我们既需要借助它提供的便利,还需要避开它引出的问题。这是一种取舍,我们要在null的利与弊当中找到一个平衡点。而且,这里的平衡点,在不同的场景中是不一样的。

那么,怎么才能把握好null的平衡点呢?这就体现出空安全思维的重要性了。

Java的空安全思维

在正式研究Kotlin的空安全思维之前,我们先来看看Java是否能给我们带来一些灵感。

在Java当中,其实也有一些手段来规避NPE,最常见的手段,当然就是判空,这是防御式编程的一种体现,应用范围也很广泛。

另外一种手段是@Nullable、@NotNull之类的注解,开发者可以使用这样的注解来告诉IDE哪些变量是可能为空的,哪些是不可能为空的,IDE会借助这些注解信息来帮我们规避NPE。

不过,注解这样的方式,实际效果并不好,主要有两个原因:一方面是注解很难在代码中大面积使用,这全依赖于开发者的习惯,很难在大型团队中推行,即使推行了也会影响开发效率;另一方面,即使在工程当中大面积推行可空注解,也无法完全解决NPE的问题。

想象一下,虽然我们可以在函数的参数以及返回值上面都标注可空性,但无法为每一个变量、每一种类型,都标注这些可空信息。因此,可空注解这样的方式,必然是会留下很多死角的。

还有一种手段,是Java 1.8当中引入的Optional,这种手段的核心思路就是封装数据,不再直接使用null。举个例子,从前我们直接使用String类,使用Optional以后,我们就得改成 Optional<String>。如果我们要判断值是否为空,就用optional.isPresent()。

但Optional有几个缺点:

由此可见,Java解决NPE的三种思路都无法令人满意。

那么,现在假设你自己就是Kotlin语言的设计者,在Java的三种思路的基础上,你能想到什么更好的思路吗?

前面我们曾提到了,使用@NotNull之类的注解,是存在死角的,因为我们无法为每一个变量、每一个类型都加上可空注解。一方面是注解的Target存在限制,另一方面是开发效率也会急剧下降。

所以,我们需要的其实是一种简洁,且能为每一种类型都标明可空性的方式。这样一来,我们自然而然就能想到一个更好的方案,那就是:从类型系统下手

Kotlin的空安全思维

Kotlin虽然是与Java兼容的,但是它的类型系统与Java却有很大的不同。在Java当中,我们用String代表字符串类型。而在Kotlin当中,同样是字符串类型,它却有三种表示方法。

这有点像是电影里的分身术,Java当中的一个概念,在Kotlin当中分化出了三种概念。

Kotlin的可空(String?)、不可空(String),我们在第1讲就已经介绍过了。Kotlin这样的类型系统,让开发者必须明确规定每一个变量类型是否可能为空,通过这样的方式,Kotlin编译器就能帮我们规避NPE了。

可以说,在不与Kotlin以外的环境进行交互的情况下,仅仅只是纯Kotlin开发当中,Kotlin编译器已经可以帮我们消灭NPE了。不过,现代商业化的软件当中,全栈使用Kotlin是不现实的,这也就意味着,我们将不得不与其他语言环境打交道,其中最常见的就是Java。

Kotlin、Java混合编程的空安全

在Java当中,是不存在可空类型这个概念的。因此,在Kotlin当中,我们把Java未知可空性的类型叫做平台类型,比如:String!。所有Java当中的不确定可空性的类型,在Kotlin看来都是平台类型,用“!”来表示。

让我们来看一个实际的例子:

// Java 代码

public class NullJava {
    public static String getMsg(String s) {
        return s + "Kotlin";
    }

    @Nullable
    public static String getNullableString(@Nullable String s) {
        return s + "Kotlin";
    }

    @NotNull
    public static String getNotNullString(@NotNull String s) {
        return "Hello World.";
    }
}

上面的代码中,我们一共定义了三个Java方法,第一个getMsg()我们直接返回了一个字符串,但是没有用可空注解标注;第二个方法getNullableString()则使用了@Nullable修饰了,代表它的参数和返回值是可能为空的;第三个方法getNotNullString()则是用的@NotNull修饰的,代表它的参数和返回值是不可能为空的。

而以上三个Java方法在Kotlin调用的时候,就出现以下几种情况:

// Kotlin代码

fun testPlatformType() {
    val nullableMsg: String? = NullJava.getNullableString(null)
    val notNullMsg: String = NullJava.getNotNullString("Hey,")

    val platformMsg1: String? = NullJava.getMsg(null)
    val platformMsg2: String = NullJava.getMsg("Hello")
}

也就是,由于Java当中的getNullableString()是由@Nullable修饰的,因此Kotlin编译器会自动将其识别为可空类型“String?”;而getNotNullString()是由@NotNull修饰的,因此Kotlin编译器会自动将其识别为不可空类型“String”。

最后,是getMsg(),由于这个Java方法没有任何可空注解,因此,它在Kotlin代码中会被认为是平台类型“String!”。

图片

对于平台类型,Kotlin会认为,它既能被当作可空类型“String?”,也可以被当作不可空类型“String”。Kotlin没有强制开发者,而是将选择权交给了开发者。所以我们开发者,就需要在这中间寻找平衡点。

我们不能将平台类型一概认为是不可空的,因为这会引发NPE;我们也不能一概认为平台类型是可空的,因为这会导致我们的代码出现过多的空安全检查。

在这里,结合我个人的一些实践经验来看,对于Kotlin与Java混合编程的情况,这几个建议你可以参考一下:

至此,我们就能总结出Kotlin空安全的第一条准则:警惕Kotlin以外的数据类型。

语言角度上看,Kotlin不仅只是和Java交互,它还可以与其他语言交互,而如果其他语言没有可空的类型系统,那么我们就一定要警惕起来。

另外,从环境角度上看,Kotlin还可以与其他外界环境交互,比如发起网络请求、解析网络请求、读取数据库,等等。这些外界的环境当中的数据,往往也是没有可空类型系统的,这时候我们更要警惕。

举个例子:很多Kotlin开发者会在JSON解析的时候,遇到NPE的问题,这也是一个相当棘手的问题,这个问题我们会在后面的实战项目中进一步分析。

聊完了Kotlin与外界交互的空安全准则后,我们再来看看纯Kotlin开发的准则。

纯Kotlin的空安全

正常情况下,我们使用纯Kotlin开发,编译器已经可以帮助解决大部分的空安全问题了。不过,纯Kotlin开发,仍然有三大准则需要严格遵守。接下来,我们就通过两个实际场景,来具体学习下这三个准则。

在前面,我们曾经学习过Kotlin的空安全调用语法“?.”,其实,Kotlin还提供了一个非空安全的调用语法“!!.”。这样的语法,我们也叫做非空断言。让我们来看个具体的例子:

fun testNPE(msg: String?) {
//            非空断言
//              ↓
    val i = msg!!.length
}

fun main() {
    NullExample.testNPE(null)
}

正常情况下,如果我们要调用“String?”类型的成员,需要使用空安全调用,而这里我们使用非空断言,强行调用了它的成员。毫无疑问,上面的代码就会产生空指针异常。

看到这里,相信你马上就能总结出第二条空安全准则了:绝不使用非空断言“!!.”

看到这条准则,也许很多人都会觉得:这不是废话吗?谁会喜欢用非空断言呢?但是啊,在我过去的几年经验当中,确实见到过不少Kotlin断言相关的代码,它们大致有两个原因。

第一个原因,是当我们借助IDE的“Convert Java File To Kotlin File”的时候,这个工具会自动帮我们生成带有非空断言的代码。而我们在转换完代码以后,却没有review,进而将非空断言带到了生产环境当中。

就以下面这段代码为例:

// Java 代码

public class JavaConvertExample {
    private String name = null;

    void init() {
        name = "";
    }

    void test(){
        if (name != null) {
            int count = name.length();
        }
    }
}

这段代码是非常典型的Java代码,其中我们也已经使用了if来判断name是否为空,然后再调用它的length。

那么,如果我们借助IDE的转换工具,它会变成什么样呢?

class JavaConvertExample {
    private var name: String? = null
    fun init() {
        name = ""
    }

    fun foo() {
        name = null;
    }

    fun test() {
        if (name != null) {
//                        非空断言
//                           ↓
            val count = name!!.length
        }
    }
}

可以看到转成Kotlin代码以后,我们test()方法当中出现了非空断言

你也许会好奇,Kotlin不是支持Smart Cast吗?既然我们已经在if当中判断了name不等于空,那么,它不是会被Smart Cast成为一个非空类型吗?毕竟,我们经常能写出这样的代码:

val name: String? = getLocalName()
if (name != null) {
//   判断非空后,被转换成非空类型了
//      ↓
    name.length
}

那么,回到我们上面的例子当中,如果我们将转换出来的非空断言语法删除掉,会发生什么?

图片

可见,当我们删除掉非空断言以后,IDE报错了,大致意思是,在这种场景下,Smart Cast是不可能发生的。为什么呢?我们判空以后的代码明明就很安全了啊!为什么不能自动转换成非空类型?

这就是很多Kotlin开发者使用非空断言的第二个原因,在某些场景下,Smart Cast失效了,即使我们判空了,也免不了还是要继续使用非空断言

注意了,这种情况下,并不是IDE出现了Bug。它在这种情况下不支持Smart Cast是有原因的。我给你举个例子:

class JavaConvertExample {
    private var name: String? = null
    fun init() {
        name = ""
    }

    fun foo() {
        name = null;
    }

    fun test() {
        if (name != null) {
            // 几百行代码
            foo()
            //几百行代码
            val count = name!!.length
        }
    }
}

当我们的程序逻辑变得复杂的时候,在判空后,我们可能又会不小心改变name的值,比如上面的foo()函数,这时候我们的非空断言就会产生NPE。这也是Kotlin编译器无法帮我们做Smart Cast的原因。

那么,在这种情况下,我们到底该如何避免使用非空断言呢?主要有这么几种方法。

第一种,避免直接访问成员变量或者全局变量,将其改为传参的形式:

//    改为函数参数
//        ↓
fun test(name: String?) {
    if (name != null) {
//             函数参数支持Smart Cast
//                      ↓
        val count = name.length
    }
}

在Kotlin当中,函数的参数是不可变的,因此,当我们将外部的成员变量或者全局变量以函数参数的形式传进来以后,它可以用于Smart Cast了。

第二种,避免使用可变变量var,改为val不可变变量:

class JavaConvertExample {
//       不可变变量
//           ↓
    private val name: String? = null

    fun test() {
        if (name != null) {
//               不可变变量支持Smart Cast
//                          ↓
            val count = name.length
        }
    }
}

这种方式很好理解,既然引发问题的根本原因是可变性导致的,我们直接将其改为不可变的即可。从这里,我们也可以看到“空安全”与“不可变性”之间的关联。

第三种,借助临时的不可变变量:

class JavaConvertExample {
    private var name: String? = null

    fun test() {
//        不可变变量
//            ↓
        val _name = name
        if (_name != null) {
            // 在if当中,只使用_name这个临时变量
            val count = _name.length
        }
    }
}

以上代码,本质上还是借助了不可变性。这种方式看起来有点丑陋,但如果稍微封装一下也是有用的,比如接下来要用到的let。

第四种,是借助Kotlin提供的标准函数let:

class JavaConvertExample {
    private var name: String? = null

    fun test() {
//                      标准函数
//                         ↓
        val count = name?.let { it.length }
    }
}

这种方式和第三种方式,从本质上来讲是相似的,但是我们通过let可以更加优雅地来实现同样的需求。

第五种,是借助Kotlin提供的lateinit关键字:

class JavaConvertExample {
//         稍后初始化             不可空
//            ↓                   ↓
    private lateinit var name: String

    fun init() {
        name = "Tom"
    }

    fun test() {
        if (this::name.isInitialized) {
            val count = name.length
        } else {
            println("Please call init() first!")
        }
    }
}

fun main() {
    val example = JavaConvertExample()
    example.init()
    example.test()
}

如果你足够细心,你会发现这种思路其实是完全抛弃可空性的。我们直接用lateinit var定义了不可能为空的String类型,然后,当我们要用到这个变量的时候,再去判断这个变量是否已经完成了初始化。

由于它的类型是不可能为空的,因此我们初始化的时候,必须传入一个非空的值,这就能保证:只要name初始化了,它的值就一定不为空。在这种情况下,我们就将判空问题变成了一个判断是否初始化的问题。

第六种,使用by lazy委托:

class JavaConvertExample {
//         不可变        非空   懒加载委托
//           ↓           ↓        ↓
    private val name: String by lazy { init() }
    
    fun init() = "Tom"
    
    fun test() {
        val count = name.length
    }
}

可以看到,我们将name这个变量改为了不可变的非空属性,并且,借助Kotlin的懒加载委托来完成初始化。借助这种方式,我们可以尽可能地延迟初始化,同时,也消灭了可变性、可空性。

到这里,相信你就可以总结出第三条准则了:尽可能使用非空类型

下面我们再来看看另一个场景。

在学习泛型的时候,我曾经介绍过:我们可以用字母(比如T)来代表某种未知的类型,以此来提升程序的灵活性。比如,我们很容易就能写出下面这样的代码:

// 泛型定义处              泛型使用处
//   ↓                      ↓
fun <T> saveSomething(data: T) {
    val set = sortedSetOf<T>() // Java TreeSet
    set.add(data)
}

fun main() {
//                 泛型实参自动推导为String
//                        ↓
    saveSomething("Hello world!")
}

这段代码没有实际应用价值,它代表的是一种代码模式。我们重点来看看saveSomething()这个方法,请问你能找出它的问题在哪吗?说实话,如果不是实际踩过坑,我们是很难意识到这段代码的问题在何处的。

让我们来看看这段代码是怎么出问题的。

// 泛型定义处              泛型使用处
//   ↓                      ↓
fun <T> saveSomething(data: T) {
    val set = sortedSetOf<T>()
//    空指针异常              
//       ↓
    set.add(data)
}

fun main() {
//               编译通过
//                  ↓
    saveSomething(null)
}

在上面的代码中,虽然我们定义的泛型参数是“T”,函数的参数是“data: T”,看起来data好像是不可为空的,但实际上,我们是可以将null作为参数传进去的。这时候,编译器也不会报错。紧接着,由于TreeSet内部无法存储null,所以我们的代码在“set.add(data)”这里,会产生运行时的空指针异常。

出现这样的问题的原因,其实是因为泛型的参数T给了我们一种错觉,让我们觉得:T是非空的,而“T?”才是可空的。实际上,我们的T是等价于 <T: Any?> 的,因为Any?才是Kotlin的根类型。这也就意味着,泛型的T是可以接收null作为实参的。


fun <T> saveSomething(data: T) {}
//   ↑ 
//  等价              
//   ↓                      
fun <T: Any?> saveSomething(data: T) {}

那么,saveSomething()这个方法,正确的写法应该是怎样的呢?答案其实也很简单:

// 增加泛型的边界限制              
//       ↓                      
fun <T: Any> saveSomething(data: T) {
    val set = sortedSetOf<T>()
    set.add(data)
}

fun main() {
//              编译无法通过
//                  ↓
    saveSomething(null)
}

以上代码中,我们为泛型T 增加了上界“Any”,由于Any是所有非空类型的“根类型”,这样就能保证我们的data一定是非空的。这样一来,当我们尝试往saveSomething()这个方法里传入null的时候,编译器就会报错,让这个问题在编译期就能暴露出来。

看到这里,相信你也可以总结出Kotlin空安全的第四条准则了:明确泛型可空性

小结

学完了这节课,相信现在你对Kotlin的空安全思维就已经有了一个全面的认识。最后,我也再给你总结一下,你需要重点关注Kotlin的空安全思维,主要有四大准则:

其实,Kotlin的空安全思维,也并不是四个准则就可以完全概括的,不过这四个准则可以为我们指明方向,为我们后面的学习打下基础。Kotlin的空安全,其实和Kotlin的每一个特性都息息相关。比如,我们在前面课程里就应用了不变性、lateinit、懒加载委托、泛型边界等特性,来解决空安全问题。

思考题

这节课我介绍了空安全的四大准则,请问你还能想到其他的准则吗?欢迎在评论区分享你的思路。

评论