Option与Null Object模式

在大多数程序语言中,我们都需要与Null打交道,并且纠缠于对它的检查中。一不小心让它给溜出来,就可能像打开潘多拉的盒子一般,给程序世界带来灾难。说起来,在我们人类世界中,Null到底算什么“东西”呢?语义上讲,它就是一场空,即所谓“虚无”。这个世界并没有任何物质可以代表“虚无”,因而它仅存于我们的精神层面。说虚无存在其实是一种悖论,因为存在其实是虚无的反面。若从程序本质上讲,Null代表一种状态,指一个对象(或变量),虽获声明却未真正诞生,甚至可能永远不会诞生。而一旦诞生,Null就被抹去了,回归了正确的状态。

站在OO的角度来讲,既然Everything is object,自然可以将Null同样视为Object——这近似于前面提到的悖论,既然是Null,为何又是Object呢?换言之,在对象世界里,其实没有什么不存在,所谓“不存在”仍然是一种“存在”。这么说容易让人变糊涂,就好像我们搞不清楚“我是谁”。所以,我宁肯采用Martin Fowler的说法,将Null Object视为一种Special Case,即Null其实是一种特例。

视Null为一种特例,即可用OO的特化来表达。当某个对象可能存在Null这种状态时,都可以将这种状态表示为一种特化的类,它不再代表Null,而是代表“什么都不做”。凡是返回Null的地方,都替换为这个Null Object,用以表达这种Null其实仅仅是一种特列。于是乎,我们像抹杀异教徒一般抹去了“虚无”的存在。(当虚无被抹去,是什么样的存在?)

然而,若在程序语言中实现自己的Null Object,固然可以在一定程度上消除对Null的检查,却存在一些约束:

  • 对于String之类的类型,无法定义NullString子类;
  • 每次都需要自己去定义子类来表示Null;
  • 必须约束团队不能返回Null;

Google的Guava框架为了解决这一问题,引入了Optional:

public abstract class Optional<T> implements Serializable {
  public static <T> Optional<T> absent() {
    return (Optional<T>) Absent.INSTANCE;
  }
  public static <T> Optional<T> of(T reference) {
    return new Present<T>(checkNotNull(reference));
  }
  public static <T> Optional<T> fromNullable(@Nullable T nullableReference) {
    return (nullableReference == null)
        ? Optional.<T>absent()
        : new Present<T>(nullableReference);
  }
  public abstract boolean isPresent();
  public abstract T get();
  public abstract T or(T defaultValue);
  public abstract <V> Optional<V> transform(Function<? super T, V> function);
}

于是,我们可以这样来使用Optional:

public final Optional<E> first() {
    Iterator<E> iterator = iterable.iterator();
    return iterator.hasNext()
        ? Optional.of(iterator.next())
        : Optional.<E>absent();
  }

first()方法返回的是一个Optional类型。这是Guava中操作集合的一个方法。当我们要获得第一个元素时,可以调用该方法:

List<Person> persons = newArrayList();
String name = from(persons).first().transform(new Function<Person, String>() {
        @Override
        public String apply(Person input) {
            return input.getName();
        }
    }).or("not found");
assertThat(name, is("not found"));

不知是巧合,还是一种借鉴,Java 8同样定义了Optional用以处理这种情况。前面的代码在Java 8下可以改写为:

List<Person> persons = newArrayList();
        String name = persons.stream().findFirst().map(p -> p.getName()).orElse("not found");
        assertThat(name, is("not found"));

其实在Scala的早期版本,已经提供了Option[T]类型。前面的代码若用scala编写,就变成:

case class Person(name: String, age: Int)
val persons = List[Person]()
persons.headOption.map(p => p.name).getOrElse("not found")

这样的设计方式,还是Null Object模式吗?让我们回到Null的本原状态,思考为什么会产生Null?首先,Null代表一种异常状态,即在某种未可知的情形下,可能返回Null;正常情况下,返回的则是非Null的对象。Null与非Null,代表一种未知与不确定性。哈姆雷特纠结于“To be, or not to be, this is a question”,但在程序世界里,可以抽象为一个集合来表达这种非此即彼的状况。

从函数式编程的角度来讲,我们可以将这样的集合设计为一个Monad。根据DSL in Action一书中对Monad的介绍,一个Monad由以下三部分定义:

  • 一个抽象M[A],其中M是类型构造函数。在Scala语言中可以写成class M[A],或者case class M[A],有或者trait M[A]
  • 一个unit方法(unit v)。对应Scala中的函数new M(v)或者M(v)的调用。
  • 一个bind方法,起到将运算排成序列的作用。在Scala中通过flatMap组合子来实现。bind f m对应的Scala语句是m flatMap f。

同时,Monad还必须满足以下三条规则:

  • 右单位元(identity)。即对于任意Monad m,有m flatMap unit => m。对于Option,unit就是Option伴生对象定义的apply()方法。若m为Some("Scala"),则m flatMap {x => Option(x)},其结果还是m。
  • 左单位元(unit)。即对于任意Monad m,有unit(v) flatMap f => f(v)。

假设我们定义一个函数f:

def f(v: String) = Option(v)

则Option("Scala") flatMap {x => f(x)}的结果就等于f("scala")。

  • 结合律。即对于任意Monad m,有m flatMap g flatMap h => m flatMap {x => g(x) flatMap h}。

无论是Scala中的Option[A],还是Java 8中的Optional[T],都是一个Monad。此时的Null不再是特例,而是抽象Option[A]对称的两个元素中的其中一个,在Scala中,即Option[T]中的Some[T]或None。它们俩面貌相同,却是一对性格迥异的双生子。

在设计为Monad后,就可以利用Monad提供的bind功能,完成多个函数的组合。组合时,并不需要考虑返回为None的情况。Monad能保证在前一个函数返回空值时,后续函数不会被调用。让我们来看一个案例。例如,我们需要根据某个key从会话中获得对应的值,然后再将该值作为参数去查询符合条件的特定Customer。在Scala中,可以将这两个步骤定义为函数,返回结果分别为Option[String]与Option[Customer]:

def params(key: String): Option[String]
def queryCustomer(refId: String): Option[Customer]
val customer =
    (
        for {
            r <- params("customerId")
            c <- queryCustomer(r)
        } yield c
    ) getOrElse error("Not Found")

这段代码用到了Scala的for comprehension,它实则是对flatMap的一种包装。尤其当嵌套多个flatMap时,使用for comprehension会更加直观可读。翻译为flatMap,则为:

params("customerId").flatMap{
    r => queryCustomer(r).map {
        c => c
    }
} getOrElse error("Not Found")

当我最初看到Guava设计的Optional[T]时,我以为是Null Object模式的体现。显然,它的功能要超出Null Object的范畴。但它也并非Monad,在前面给出的定义中,我们可以看到Guava的Optional[T]仅提供了map(即定义中的transform)功能,而没有提供更基本的flatMap操作。具有函数式编程功能的Scala与Java 8加强了这一功能,利用Monad强化了程序对Null的处理。