你好!我是郑晔。

在上一讲中,我们讨论了如何了解一个软件的设计,主要是从三个部分入手:模型、接口和实现。那么,在接下来的三讲中,我将结合几个典型的开源项目,告诉你如何具体地理解一个软件的模型、接口和实现。

今天这一讲,我们就先来谈谈了解设计的第一步:模型。如果拿到一个项目,我们怎么去理解它的模型呢?

我们肯定要先知道项目提供了哪些模型,模型又提供了怎样的能力。这是所有人都知道的事情,我并不准备深入地去探讨。但如果只知道这些,你只是在了解别人设计的结果,这种程度并不足以支撑你后期对模型的维护。

在一个项目中,常常会出现新人随意向模型中添加内容,修改实现,让模型变得难以维护的情况。造成这一现象的原因就在于他们对于模型的理解不到位。

我们都知道,任何模型都是为了解决问题而生的,所以,理解一个模型,需要了解在没有这个模型之前,问题是如何被解决的,这样,你才能知道新的模型究竟提供了怎样的提升。也就是说,理解一个模型的关键在于,要了解这个模型设计的来龙去脉,知道它是如何解决相应的问题。

今天我们以Spring的DI容器为例,来看看怎样理解软件的模型。

耦合的依赖

Spring在Java世界里绝对是大名鼎鼎,如果你今天在做Java开发而不用Spring,那么你大概率会被认为是个另类。

今天很多程序员都把Spring当成一个成熟的框架,很少去仔细分析Spring的设计。但作为一个从0.8版本就开始接触Spring的程序员,我刚好有幸经历了Spring从渺小到壮大的过程,得以体会到Spring给行业带来的巨大思维转变。

如果说Spring这棵参天大树有一个稳健的根基,那其根基就应该是 Spring的DI容器。DI是Dependency Injection的缩写,也就是“依赖注入”。Spring的各个项目都是这个根基上长出的枝芽。

那么,DI容器要解决的问题是什么呢?它解决的是组件创建和组装的问题,但是为什么这是一个需要解决的问题呢?这就需要我们了解一下组件的创建和组装。

在前面的课程中,我讲过,软件设计需要有一个分解的过程,所以,它必然还要面对一个组装的过程,也就是把分解出来的各个组件组装到一起,完成所需要的功能。

为了叙述方便,我采用Java语言来进行后续的描述。

我们从程序员最熟悉的一个查询场景开始。假设我们有一个文章服务(ArticleService)提供根据标题查询文章的功能。当然,数据是需要持久化的,所以,这里还有一个ArticleRepository,用来与持久化数据打交道。

熟悉DDD的同学可能发现了,这个仓库(Repository)的概念来自于DDD。如果你不熟悉也没关系,它就是与持久化数据打交道的一层,和一些人习惯的Mapper或者DAO(Data Access Object)类似,你可以简单地把它理解成访问数据库的代码。

class ArticleService {
  //提供根据标题查询文章的服务
  Article findByTitle(final String title) {
    ...
  }
}

interface ArticleRepository {
  //在持久化存储中,根据标题查询文章
  Article findByTitle(final String title);
}

在ArticleService处理业务的过程中,需要用到ArticleRepository辅助它完成功能,也就是说,ArticleService要依赖于ArticleRepository。这时你该怎么做呢?一个直接的做法就是在 ArticleService中增加一个字段表示ArticleRepository。

class ArticleService {
  private ArticleRepository repository;
  
  public Article findByTitle(final String title) {
    // 做参数校验
    return this.repository.findByTitle(title);
  }
}

目前看起来一切都还好,但是接下来,问题就来了,这个字段怎么初始化呢?程序员一般最直接的反应就是直接创建这个对象。这里选用了一个数据库版本的实现(DBArticleRepository)。

class ArticleService {
  private ArticleRepository repository = new DBArticleRepository();
  
  public Article findByTitle(final String title) {
    // 做参数校验
    return this.repository.findByTitle(title);
  }
}

看上去很好,但实际上DBArticleRepository并不能这样初始化。正如这个实现类的名字所表示的那样,我们这里要用到数据库。但在真实的项目中,由于资源所限,我们一般不会在应用中任意打开数据库连接,而是会选择共享数据库连接。所以,DBArticleRepository需要一个数据库连接(Connection)的参数。在这里,你决定在构造函数里把这个参数传进来。

class ArticlService {
  private ArticleRepository repository;
  
  public ArticlService(final Connection connection) {
    this.repository = new DBArticleRepository(connection);
  }
  
  public Article findByTitle(final String title) {
    // 做参数校验
    return this.repository.findByTitle(title);
  }
}

好,代码写完了,它看上去一切正常。如果你的开发习惯仅仅到此为止,可能你会觉得这还不错。但我们并不打算做一个只写代码的程序员,所以,我们要进入下一个阶段:测试。

一旦开始准备测试,你就会发现,要让ArticleService跑起来,那就得让ArticleRepository也跑起来;要让ArticleRepository跑起来,那就得准备数据库连接。

是不是觉得太麻烦,想放弃测试。但有职业素养的你,决定坚持一下,去准备数据库连接信息。

然后,真正开始写测试时,你才发现,要测试,你还要在数据库里准备各种数据。比如,要测查询,你就得插入一些数据,看查出来的结果和插入的数据是否一致;要测更新,你就得先插入数据,测试跑完,再看数据更新是否正确。

不过,你还是没有放弃,咬着牙准备了一堆数据之后,你突然困惑了:我在干什么?我不是要测试服务吗?做数据准备不是测试仓库的时候应该做的事吗?

那么,问题出在哪儿呢?其实就在你创建对象的那一刻,问题就出现了。

分离的依赖

为什么说从创建对象开始就出问题了呢?

因为当我们创建一个对象时,就必须要有一个具体的实现类,对应到我们这里,就是那个 DBArticleRepository。虽然我们的ArticleService写得很干净,其他部分根本不依赖于 DBArticleRepository,只在构造函数里依赖了,但依赖就是依赖。

与此同时,由于要构造DBArticleRepository的缘故,我们这里还引入了Connection这个类,这个类只与DBArticleRepository的构造有关系,与我们这个ArticleService的业务逻辑一点关系都没有。

所以,你看到了,只是因为引入了一个具体的实现,我们就需要把它周边配套的东西全部引入进来,而这一切与这个类本身的业务逻辑没有任何关系。

这就好像,你原本打算买一套家具,现在却让你必须了解树是怎么种的、怎么伐的、怎么加工的,以及家具是怎么设计、怎么组装的,而你想要的只是一套能够使用的家具而已。

这还只是最简单的场景,在真实的项目中,构建一个对象可能还会牵扯到更多的内容:

所以,即便是最简单的对象创建和组装,也不像看起来那么简单。

既然直接构造存在这么多的问题,那么最简单的办法就是把创建的过程拿出去,只留下与字段关联的过程:

class ArticleService {
  private ArticleRepository repository;
  
  public ArticleService(final ArticleRepository repository) {
    this.repository = repository;
  }
  
  public Article findByTitle(final String title) {
    // 做参数校验
    return this.repository.findByTitle(title);
  }
}

这时候,ArticleService就只依赖ArticleRepository。而测试ArticleService也很简单,只要用一个对象将ArticleRepository的行为模拟出来就可以了。通常这种模拟对象行为的工作用一个现成的程序库就可以完成,这就是那些Mock框架能够帮助你完成的工作。

或许你想问,在之前的代码里,如果我用Mock框架模拟Connection类是不是也可以呢?理论上,的确可以。但是想要让ArticleService的测试通过,就必须打开DBArticleRepository的实现,只有配合着其中的实现,才可能让ArticleService跑起来。显然,你跑远了。

现在,对象的创建已经分离了出去,但还是要要有一个地方完成这个工作,最简单的解决方案自然是,把所有的对象创建和组装在一个地方完成:

...
ArticleRepository repository = new DBArticleRepository(connection);
AriticleService service = new ArticleService(repository);
...

相比于业务逻辑,组装过程并没有什么复杂的部分。一般而言,纯粹是一个又一个对象的创建以及传参的过程,这部分的代码看上去会非常的无聊。

虽然很无聊,但这一部分代码很重要,最好的解决方案就是有一个框架把它解决掉。在Java世界里,这种组装一堆对象的东西一般被称为“容器”,我们也用这个名字。

Container container = new Container();
container.bind(Connection.class).to(connection);
container.bind(ArticleReposistory.class).to(DBArticleRepository.class);
container.bind(ArticleService.class).to(ArticleService.class)

ArticleService service = container.getInstance(ArticleService.class);

至此,一个容器就此诞生。因为它解决的是依赖的问题,把被依赖的对象像药水一样,注入到了目标对象中,所以,它得名“依赖注入”(Dependency Injection,简称 DI)。这个容器也就被称为DI容器了。

至此,我简单地给你介绍了DI容器的来龙去脉。虽然上面这段和Spring DI容器长得并不一样,但其原理是一致的,只是接口的差异而已。

事实上,这种创建和组装对象的方式在当年引发了很大的讨论,直到最后Martin Fowler写了一篇《反转控制容器和依赖注入模式》的文章,才算把大家的讨论做了一个总结,行业里总算是有了一个共识。

那段时间,DI容器也得到了蓬勃的发展,很多开源项目都打造了自己的DI容器,Spring是其中最有名的一个。只不过,Spring并没有就此止步,而是在这样一个小内核上面发展出了更多的东西,这才有了我们今天看到的庞大的Spring王国。

讲到这里,你会想,那这和我们要讨论的“模型”有什么关系呢?

正如我前面所说,很多人习惯性把对象的创建和组装写到了一个类里面,这样造成的结果就是,代码出现了大量的耦合。时至今日,很多项目依然在犯同样的错误。很多项目测试难做,原因就在于此。这也从另外一个侧面佐证了可测试性的作用,我们曾在第3讲中说过:可测试性是衡量设计优劣的一个重要标准。

由此可见,在没有DI容器之前,那是怎样的一个蛮荒时代啊!

有了DI容器之后呢?你的代码就只剩下关联的代码,对象的创建和组装都由DI容器完成了。甚至在不经意间,你有了一个还算不错的设计:至少你做到了面向接口编程,它的实现是可以替换的,它还是可测试的。与之前相比,这是一种截然不同的思考方式,而这恰恰就是DI容器这个模型带给我们的。

而且,一旦有了容器的概念,它还可以不断增强。比如,我们想给所有与数据库相关的代码加上时间监控,只要在容器构造对象时添加处理即可。你可能已经发现了,这就是 AOP(Aspect Oriented Programming,面向切面编程)的处理手法。而这些改动,你的业务代码并无感知。

Spring的流行,对于提升Java世界整体编程的质量是大有助益的。因为它引导的设计方向是一个好的方向,一个普通的Java程序员写出来的程序只要符合Spring引导的方向,那么它的基本质量就是有保障的,远超那个随意写程序的年代。

不过,如果你不能认识到DI容器引导的方向,我们还是无法充分利用它的优势,更糟糕的是,我们也不能太低估一些程序员的破坏力。我还是见过很多程序员即便在用了Spring之后,依然是自己构造对象,静态方法满天飞,把原本一个还可以的设计,打得七零八落。

你看,通过上面的分析,我们知道了,只有理解了模型设计的来龙去脉,清楚认识到它在解决的问题,才能更好地运用这个模型去解决后面遇到的问题。如果你是这个项目的维护者,你才能更好地扩展这个模型,以便适应未来的需求。

总结时刻

今天,我们学习了如何了解设计的第一部分:看模型。理解模型,要知道项目提供了哪些模型,这些模型都提供了怎样的能力。但还有更重要的一步就是,要了解模型设计的来龙去脉。这样,一方面,可以增进了我们对它的了解,但另一方面,也会减少我们对模型的破坏或滥用。

我以Spring的DI容器为例给你讲解了如何理解模型。DI容器的引入有效地解决了对象的创建和组装的问题,让程序员们拥有了一个新的编程模型。

按照这个编程模型去写代码,整体的质量会得到大幅度的提升,也会规避掉之前的许多问题。这也是一个好的模型对项目起到的促进作用。像DI这种设计得非常好的模型,你甚至不觉得自己在用一个特定的模型在编程。

有了对模型的了解,我们已经迈出了理解设计的第一步,下一讲,我们来看看怎样理解接口。

如果今天的内容你只能记住一件事,那请记住:理解模型,要了解模型设计的来龙去脉。

思考题

最后,我想请你思考一个问题,DI容器看上去如此地合情合理,为什么在其他编程语言的开发中,它并没有流行起来呢?欢迎在留言区写下你的思考。

感谢阅读,如果你觉得这一讲的内容对你有帮助的话,也欢迎把它分享给你的朋友。