查看原文
其他

深入分析Kotlin的属性代理机制

写代码的阿宗 郭霖 2020-10-29



今日科技快讯


近日,据The Verge报道,芯片制造商英特尔公司不久前宣布将退出了移动5G市场,现在该公司首席执行官鲍勃·斯旺给出了解释,即苹果和高通的意外和解促使他们退出移动5G领域的竞争。


作者简介


明天就是五一小长假了,今年的五一假期会放4天假,希望大家都可以利用好好放松一下,我们5月5号再见,祝大家五一快乐!

本篇文章来自 小小小小小粽子 的投稿,分享了他对属性代理的理解,相信会对大家有所帮助!同时也感谢作者贡献的精彩文章。

小小小小小粽子 的博客地址:

https://www.jianshu.com/u/e3e2429f26e8


前言


熟悉Kotlin的人可能知道,类代理是一种基于父类或者接口的实现,而在代理属性这边没有这种限制,而且这些代理对象的公共方法的参数中还包含了委托对象,这意味着在代理对象中也可以调用委托对象的公共方法。Kotlin的标准库中就包含了许多使用代理属性的实现,比如lazy。


正文


我们先来学习下写标准库的大佬怎么玩的,lazy的用法很简单:

val num by lazy {
  BigInteger.valueOf(120).modPow(BigInteger.valueOf(120))
}

我们假设num的获取是耗时操作,而且我们还不一定要用到它,一个比较好的策略就是惰性求值,用到时再去获取,并把结果缓存起来避免重复的运算,提高代码的性能,lazy提供的就是这样一种机制。

public actual fun <T> lazy(initializer: () -> T): Lazy<T> = SynchronizedLazyImpl(initializer)

这里是一个高阶函数,接受一个lambda作为参数,返回了一个SynchronizedLazyImpl的对象,现在还看不出是什么东西,我们再往里面看:

private class SynchronizedLazyImpl<out T>(initializer: () -> T, lock: Any? = null) : Lazy<T>, Serializable {
    private var initializer: (() -> T)? = initializer
    @Volatile private var _value: Any? = UNINITIALIZED_VALUE
    // final field is required to enable safe publication of constructed instance
  private val lock = lock ?: this   
    override val value: T
  get() {
            val _v1 = _value
  if (_v1 !== UNINITIALIZED_VALUE) {
                @Suppress("UNCHECKED_CAST")
                return _v1 as T
  }

            return synchronized(lock) {
  val _v2 = _value
  if (_v2 !== UNINITIALIZED_VALUE) {
                    @Suppress("UNCHECKED_CAST") (_v2 as T)
                } else {
                    val typedValue = initializer!!()
                    _value = typedValue
                    initializer = null
  typedValue
                }
            }
  }

    override fun isInitialized()Boolean = _value !== UNINITIALIZED_VALUE

    override fun toString(): String = if (isInitialized()) value.toString() else "Lazy value not initialized yet."    
        private fun writeReplace(): Any = InitializedLazyImpl(value)
}

哦,这是一个实现了Lazy接口的类,我们可以看到,value的get方法使用了synchronized关键字来确保线程安全,我们传入的lambda会在这里被调用计算出一个结果,然后结果被缓存在_value中,下次再访问就不会重新计算结果了。

而Lazy的结构如下:

public interface Lazy<out T> {
   public val value: T    
   public fun isInitialized()Boolean
}

结构很简单,没什么东西,我们再回到lazy函数的重载方法:

public actual fun <T> lazy(mode: LazyThreadSafetyMode, initializer: () -> T): Lazy<T> =
    when (mode) {
        LazyThreadSafetyMode.SYNCHRONIZED -> SynchronizedLazyImpl(initializer)
        LazyThreadSafetyMode.PUBLICATION -> SafePublicationLazyImpl(initializer)
        LazyThreadSafetyMode.NONE -> UnsafeLazyImpl(initializer)
    }

哦哟,使用这个方法我们可以显式指定一个LazyThreadSafetyMode,从名字上看它跟线程安全有关系,而且每个模式都使用了不同的Lazy实现,除了我们刚刚讨论的SynchronizedLazyImpl,还有其它一些。

先来看LazyThreadSafetyMode,这是一个枚举类,支持三种模式:

  1. SYNCHRONIZED 使用锁来确保只有一个线程来求值。

  2. PUBLICATION 允许多个线程来初始化值,但是只有第一个返回的值有效。

  3. NONE 允许多个线程来初始化值,但是行为就不确定了。

意思就是我们的app运行在单线程里我们就可以直接把mode传为NONE啰,避免加锁带来的开销呗,那在Android开发过程中,我们可以这么用:

private val rv by lazy(LazyThreadSafetyMode.NONE) {
    findViewById<RecyclerView>(R.id.rv)
    }

因为系统只会在UI线程上操作UI,所以我们不需要担心有什么并发访问,稍加包装我们甚至可以自己实现一个KotterKnife。

再来看看None模式下使用的UnsafeLazyImpl:

internal class UnsafeLazyImpl<out T>(initializer: () -> T) : Lazy<T>, Serializable {
    private var initializer: (() -> T)? = initializer
    private var _value: Any? = UNINITIALIZED_VALUE

    override val value: T
  get() {
            if (_value === UNINITIALIZED_VALUE) {
                _value = initializer!!()
                initializer = null
  }
            @Suppress("UNCHECKED_CAST")
            return _value as T
  }

    override fun isInitialized()Boolean = _value !== UNINITIALIZED_VALUE

    override fun toString(): String = if (isInitialized()) value.toString() else "Lazy value not initialized yet."    private fun writeReplace(): Any = InitializedLazyImpl(value)
}

还是主要看value的get方法,我们可以看到,get方法只会检查value有没有被赋值,然后计算出一个结果或者返回缓存的值,但是这里并没有加锁,就不会保证线程安全,常见的并发问题都有可能在这里发生。

最后到了PUBLICATION,它也允许多线程访问,但是跟NONE有些微妙的差别,来看一个小例子,来帮我们理解PUBLICATION的行为:

class CacheThread(val lazyValue: BigInteger) : Thread() {
    override fun run() {
        super.run()
        Thread.sleep(250)
        println("${this::class.java.simpleName} $lazyValue")
    }
}

class NetworkThread(val lazyValue: BigInteger) : Thread() {
    override fun run() {
        super.run()
        Thread.sleep(300)
        println("${this::class.java.simpleName} $lazyValue")
    }
}

我们模拟了两个线程执行耗时操作,一个取缓存,一个取网络数据,他们都需要一些时间来执行操作。

这是我们的测试代码:

fun main(args: Array<String>) {
    val lazyValue by lazy(LazyThreadSafetyMode.PUBLICATION) {
  println("computation")
        BigInteger.valueOf(2).modPow(
            BigInteger.valueOf(7),
  BigInteger.valueOf(20)
        )
    }
  CacheThread(lazyValue).start()
    NetworkThread(lazyValue).start()
}

结果如下:

computation
CacheThread 8
NetworkThread 8

我们可以发现,值只被计算了一次,当CacheThread引用了lazyValue之后,结果就被缓存了下来,后面线程再访问都是访问的这个缓存的值,不会再重新计算了。

它是怎么做的呢:

private class SafePublicationLazyImpl<out T>(initializer: () -> T) : Lazy<T>, Serializable {
    @Volatile private var initializer: (() -> T)? = initializer
    @Volatile private var _value: Any? = UNINITIALIZED_VALUE
    // this final field is required to enable safe publication of constructed instance
  private val final: Any = UNINITIALIZED_VALUE

    override val value: T
  get() 
{
            val value = _value
  if (value !== UNINITIALIZED_VALUE) 
{
                @Suppress("UNCHECKED_CAST")
                return value as T
  }

            val initializerValue = initializer
  // if we see null in initializer here, it means that the value is already set by another thread
  if (initializerValue != null) {
                val newValue = initializerValue()
                if (valueUpdater.compareAndSet(this, UNINITIALIZED_VALUE, newValue)) {
                    initializer = null
 return newValue
                }
            }
            @Suppress("UNCHECKED_CAST")
            return _value as T
  }

    override fun isInitialized(): Boolean = _value !== UNINITIALIZED_VALUE

    override fun toString(): String 
if (isInitialized()) value.toString() else "Lazy value not initialized yet."    private fun writeReplace(): Any = InitializedLazyImpl(value)

    companion object {
        private val valueUpdater = java.util.concurrent.atomic.AtomicReferenceFieldUpdater.newUpdater(
            SafePublicationLazyImpl::class.java,
  Any::class.java,
  "_value"
  )
    }
}

我们看到这里在调用了initializer之后就把就把它置为空了,确保它只执行一次,然后使用java.util.concurrent.atomic.AtomicReferenceFieldUpdater.newUpdater来更新_value的值,这就保证了第一次计算出的结果会被成功保存下来。

好了,到这里我们算是弄清楚三种模式的行为了,知道它们用什么策略来获取一个结果,接下来就要找哪里用到了这三个类的value字段,把这个value返回给我们的委托对象的。

鉴于我之前在文章里都有告诉大家编译器会悄咪咪帮我们做事,减少我们的工作量,我猜这次也不例外,还是写个最简单的例子,从字节码入手:

fun main() {
        val lazyValue by lazy { 1 }
        print(lazyValue)
    }

主要看字节码:

// access flags 0x11
  public final main()V
   L0
    LINENUMBER 3 L0
    GETSTATIC Main$main$lazyValue$2.INSTANCE : LMain$main$lazyValue$2;
    CHECKCAST kotlin/jvm/functions/Function0
    INVOKESTATIC kotlin/LazyKt.lazy (Lkotlin/jvm/functions/Function0;)Lkotlin/Lazy;
    GETSTATIC Main.$$delegatedProperties : [Lkotlin/reflect/KProperty;
    ICONST_0
    AALOAD
    ASTORE 2
    ASTORE 1
   L1
    LINENUMBER 4 L1
    ALOAD 1
    ASTORE 3
    ACONST_NULL
    ASTORE 4
   L2
    ALOAD 3
    INVOKEINTERFACE kotlin/Lazy.getValue ()Ljava/lang/Object; (itf)
   L3
    CHECKCAST java/lang/Number
    INVOKEVIRTUAL java/lang/Number.intValue ()I
    ISTORE 3
   L4
    LINENUMBER 4 L4
   L5
    GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
    ILOAD 3
    INVOKEVIRTUAL java/io/PrintStream.print (I)V
   L6
   L7
    LINENUMBER 5 L7
    RETURN
   L8
    LOCALVARIABLE lazyValue Lkotlin/Lazy; L1 L8 1
    LOCALVARIABLE this LMain; L0 L8 0
    MAXSTACK = 3
    MAXLOCALS = 5

我们可以看到我们在打印时调用了Lazy的getValue方法。

我们就来找一找它,很巧,在这个枚举类上面,相同的文件下(Lazy.kt),包含了一个叫getValue的扩展方法:

/**
 * An extension to delegate a read-only property of type [T] to an instance of [Lazy].
 *
 * This extension allows to use instances of Lazy for property delegation:
 * `val property: String by lazy { initializer }`
 */

@kotlin.internal.InlineOnly
public inline operator fun <T> Lazy<T>.getValue(thisRef: Any?, property: KProperty<*>): T = value

虽然这个方法看起来很奇怪,不过这下就很明了了,我们使用属性的时候是调用了这个方法,它直接使用了Lazy接口的value值,也就是我们刚刚分析的三个类中产生的value值,注意,它被operator修饰了,这代表着我们不一定要通过方法名来调用它。

结合前面的源码分析,我们可以稍做总结,Lazy对象确实做到了惰性求值,在我们访问属性,间接调用了getValue方法的时候才根据有无缓存的值来判断是否要计算结果。

目前看来,这里就是奥妙所在,而且从注释来看跟by关键字配合起来实现的黑魔法。按照套路总得有个规范是实现特定的功能,我们目前了解的公共的东西怕是也只有Lazy接口了,那kotlin是靠Lazy接口来创建代理属性的吗?再继续追究下去,我们就得先说说如何创建一个代理属性了。

一般来说,对于一个用val声明的属性,需要一个包含get方法的代理,而对于用var声明的,则get,set都需要有,根据文档我们要实现ReadWriteProperty或者ReadOnlyProperty接口,认真看的同学可能要问了,不对呀,我们刚刚看的Lazy系列都没有实现这些接口呀,怎么能够实现代理功能的?别急,即将揭晓,我们往下看:

/**
 * Base interface that can be used for implementing property delegates of read-only properties.
 *
 * This is provided only for convenience; you don't have to extend this interface
 * as long as your property delegate has methods with the same signatures.
 *
 * @param R the type of object which owns the delegated property.
 * @param T the type of the property value.
 */

public interface ReadOnlyProperty<in R, out T> {
    /**
     * Returns the value of the property for the given object.
     * @param thisRef the object for which the value is requested.
     * @param property the metadata for the property.
     * @return the property value.
     */

    public operator fun getValue(thisRef: R, property: KProperty<*>): T
}

/**
 * Base interface that can be used for implementing property delegates of read-write properties.
 *
 * This is provided only for convenience; you don't have to extend this interface
 * as long as your property delegate has methods with the same signatures.
 *
 * @param R the type of object which owns the delegated property.
 * @param T the type of the property value.
 */
public interface ReadWriteProperty<in R, T> 
{
    /**
     * Returns the value of the property for the given object.
     * @param thisRef the object for which the value is requested.
     * @param property the metadata for the property.
     * @return the property value.
     */

    public operator fun getValue(thisRef: R, property: KProperty<*>): T

    /**
     * Sets the value of the property for the given object.
     * @param thisRef the object for which the value is requested.
     * @param property the metadata for the property.
     * @param value the value to set.
     */
    public operator fun setValue(thisRef: R, property: KProperty<*>, value: T)
}

很巧,都包含了一个跟前面我们找到的Lazy相似的getValue方法,但是稍微看一下注释就发现其实并不是巧合,接口不是必须的,只要我们的类包含跟这些接口中的方法相同签名的方法,就可以实现属性代理的功能,那这样说我们也就豁然开朗了,怪不得要给我们的Lazy接口增加一个签名这么奇怪的扩展方法,怪不得Lazy的子类都能用作属性代理。

我是觉得实现接口可以避免我们方法签名写错,毕竟这方法又长又奇怪,而且实现起来也很简单:

class MyDelegate<T> : ReadWriteProperty<Any?, T?> {
    private var value: T? = null
 override fun getValue(thisRef: Any?, property: KProperty<*>): T? {
        value
  }

    override fun setValue(thisRef: Any?, property: KProperty<*>, value: T?) {
        this.value = value
    }

}

这里我们直接返回了vaue,根据业务逻辑需求也可以在这里放复杂的逻辑。

使用起来就更简单了:

fun main(args: Array<String>) {
    val value by MyDelegate<String>()    
    println(value)
}

到这里疑惑就都解开了,只要有一个符合特定条件的对象,这个对象的类不一定要实现特定的接口,只要包含了那些签名特殊的getValue,或者getValue,setValue方法都有,哪怕只是把这些方法声明成扩展方法也可以,那这个对象就能作为代理属性在by关键字后面使用。

另外,即使是局部变量也是可以使用代理属性的,不过需要注意的是,如果我们的代理会被局部变量使用,那第一个泛型参数要是可以为空的(Nullable),为什么呢,我们来看一下反编译的Java代码:

public final class MyDelegate implements ReadWriteProperty {
   private Object value;    @Nullable
   public Object getValue(@Nullable Object thisRef, @NotNull KProperty property) {
      Intrinsics.checkParameterIsNotNull(property, "property");
  Object var10000 = this.value;
 return Unit.INSTANCE;
  }

   public void setValue(@Nullable Object thisRef, @NotNull KProperty property, @Nullable Object value) {
      Intrinsics.checkParameterIsNotNull(property, "property");
 this.value = value;
  }
}
public final void main(@NotNull String[] args) {
   Intrinsics.checkParameterIsNotNull(args, "args");
  MyDelegate var10000 = new MyDelegate();
  KProperty var3 = $$delegatedProperties[0];
  MyDelegate value = var10000;
  Object var4 = value.getValue((Object)null, var3);
  System.out.println(var4); 
  }

我们发现对于本地变量value,getValue的第一个参数传的是null,因为本地变量不属于任何对象。

如果确定我们的代理只会被类的属性使用,那么我们就可以直接把第一个泛型参数传为不可空(NonNull)。

还没完,按照我之前讨论类代理的套路,我是要扒一扒使用多个代理的开销的,再来看一个例子,再添加一个使用相同代理的属性,

class Main {
    val value by MyDelegate<String>()
    val value1 by MyDelegate<String>()
}

这是反编译的java代码:

public final class Main {
   // $FF: synthetic field
  static final KProperty[] $$delegatedProperties = new KProperty[]{(KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value""getValue()Ljava/lang/String;")), (KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value1""getValue1()Ljava/lang/String;"))};
  @Nullable
  private final MyDelegate value$delegate = new MyDelegate();
  @Nullable
  private final MyDelegate value1$delegate = new MyDelegate();    @Nullable
  public final String getValue() {
      return (String)this.value$delegate.getValue(this, $$delegatedProperties[0]);
  }

   @Nullable
  public final String getValue1() {
      return (String)this.value1$delegate.getValue(this, $$delegatedProperties[1]);
  }
}

我们可以看到,跟之前讲类代理的时候一样,每次使用代理都会单独创建一个代理对象,在这儿显然不是必须的,大家要有意识地减少开销,我们可以按照老套路把它声明成一个单例,至于如何声明也跟之前类代理的解决办法类似,这里就不再赘述了。

此外我还发现一个有意思的东西,我们的代理是支持泛型的,这意味着它可以用于任意类,比如这样:

class Main {
    val value by MyDelegate<Int>()
    val value1 by MyDelegate<Float>()
}

反编译成Java代码是这样的:

public final class Main {
   // $FF: synthetic field
  static final KProperty[] $$delegatedProperties = new KProperty[]{(KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value""getValue()Ljava/lang/Integer;")), (KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value1""getValue1()Ljava/lang/Float;"))};
  @Nullable
  private final MyDelegate value$delegate = new MyDelegate();
  @Nullable
  private final MyDelegate value1$delegate = new MyDelegate();   

   @Nullable
  public final Integer getValue() {
      return (Integer)this.value$delegate.getValue(this, $$delegatedProperties[0]);
  }

   @Nullable
  public final Float getValue1() {
      return (Float)this.value1$delegate.getValue(this, $$delegatedProperties[1]);
  }
}

做了一些类型转换,这也是有开销的,而我在之前分析lambda的时候翻到过一个文件Ref.java,里面单独给原始类型创建了类,给其他类才提供了泛型版本:

public static final class ObjectRef<T> implements Serializable {
    public T element;    
    @Override
  public String toString() {
        return String.valueOf(element);
  }
}

public static final class ByteRef implements Serializable {
    public byte element;    
    @Override
  public String toString() {
        return String.valueOf(element);
  }
}

public static final class ShortRef implements Serializable {
    public short element;    
    @Override
  public String toString() {
        return String.valueOf(element);
  }
}

库作者为了避免类型转换带来的开销,特地加了这几个看起来冗余的类,我们这里也是可以效仿一下的嘛:

class IntDelegate : ReadOnlyProperty<Any?, Int?> {    
  override fun getValue(thisRef: Any?, property: KProperty<*>)Int? {  
        TODO()    
          }
      }


总结


好了,经过这么一通硬核的分析,代理属性还能难得了谁?还是那句话哈,不一定是Kotlin比Java慢,可能是我们写的代码姿势不对优化不到位,大家平时学习的时候可以翻一翻源码,多看看字节码,多看看反编译的Java文件,比较比较,就能知道编译器为我们做了什么,即能加深对这些语法糖的理解,也能学到一些编码技巧。


推荐阅读:

面试必问的HashMap,你真的了解吗?

让你的方法数不要超过64K,MainDex优化记

布局渲染inflate方法的前世今生


欢迎关注我的公众号,学习技术或投稿

长按上图,识别图中二维码即可关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存