查看原文
其他

为 CameraX ImageAnalysis 进行 YUV 到 RGB 的转换

Android Android 开发者 2022-05-12

CameraX 是一个旨在帮助开发者简化相机应用开发工作的 Jetpack 支持库。它支持多种诸如 ImageCapture、Preview 和 ImageAnalysis 这种可以和 ML KitTensorFlow Lite 无缝结合的使用场景。这为文本识别、图像标记等应用的开发提供了可能,甚至还可以支持使用开发者自己训练的 TensorFlow Lite 模型进行物体的识别和检测。然而,在 CameraX 和这些库之间进行图像格式转换的工作还是比较费时费力的。本文我们会介绍最近为 CameraX ImageAnalysis 带来的新功能,支持从 YUV 到 RGB 的转换,我们会介绍一些背景知识,为什么会引入该功能,并会以少量的示例代码来介绍如何使用它。


  • CameraX
    https://developer.android.google.cn/training/camerax

  • ML Kit
    https://developers.google.cn/ml-kit

  • TensorFlow Lite
    https://www.tensorflow.org/lite



背景



CameraX 使用 YUV420_888 来生成图像,该格式有 8 位的 Luma(Y)、Chroma(U, V) 和 Paddings(P) 三个通道。YUV 是一种通用且灵活的格式,它支持不同的设备上的 OEM 变体,这就覆盖了很多 ImageAnalysis 的使用场景。然而很多应用依然依赖 RGB 格式。在我们的开发者社区,YUV 到 RGB 的转换是呼声最高的功能之一,因为 RGB 格式流行且易于使用,且有时需要在 TensorFlow Lite 模型中使用。让我们先来看看 YUV 和 RGB 格式。


  • YUV420_888
    https://developer.android.google.cn/reference/android/graphics/ImageFormat#YUV_420_888



YUV_420_888 格式



YUV 格式也可以被称为 "YCbCr",它包括平面 (planar,如 I420)、半平面 (semi-planar,如 NV21/NV12) 和打包 (packed,如 UYVY) 格式。YUV_420_888 是一种通用的 YCbCr 格式,它能够表示任何 4:2:0 色度二次采样的平面或半平面缓冲区 (但不完全交错),每个颜色样本有 8 位。且能够保证 Y 平面不会与 U/V 平面交错 (且像素步长始终为 1),以及 U/V 平面总是具有相同的行步长和像素步长。




RGBA_8888 格式



RGBA_8888 是一种标准的具有红、绿、蓝和 alpha 通道的 RGB 格式,每个通道有 8 位。主要的转换对象是 RGB 颜色空间,RGB 因为色差变化较少,相对来说比较简单。

  • RGBA_8888

    https://en.wikipedia.org/wiki/RGBA_color_model



API 实现



我们评估了三种将 YUV 转换为 RGB 的方法:
  1. 使用 Java/Kotlin

  2. 使用 Renderscript 渲染脚本
  3. 原生方案 (使用 C/C++ 和 NDK)

使用 Java/Kotlin 来实现对图片的处理需要长时间的计算,并面临着垃圾回收带来的压力。而 Renderscript 是面向计算密集型任务 (比如从 YUV 转换为 RGB 格式) 的一个候选方案,然而从 Android 12 开始,这种方法已经被废弃了。

  • Renderscript
    https://developer.android.google.cn/guide/topics/renderscript/compute

  • 废弃
    https://developer.android.google.cn/guide/topics/renderscript/migrate#scripts


考虑到之后的扩展性和兼容性,我们决定使用原生方案 (libyuv + NDK)。Libyuv 是一个开源项目,它包含了对 YUV 的缩放、转换和旋转功能。综合所有因素,宏观上来看,CameraX 颜色转换的 pipeline 如下图:

  • Libyuv
    https://chromium.googlesource.com/libyuv/libyuv/


为了向后兼容,我们依然使用 ImageProxy 作为输出。ImageProxy 是 media.image 的一个封装类,它是 Android framework 中提供的一个图片缓冲。Java/Kotlin 层可以从 Surface 中通过 dequeueInputImage() 获得一个输入的 Image,然后使用 ImageReaderImageWriter 将 Image 数据写入其中,从而得到一个转换后的 Image。由于 ImageWriter 是在 API 23 中添加的,我们使用 ANativeWindow 以及其缓冲区来产生 RGBA 格式的输出图像,以支持更多的 API 级别。


  • ImageProxy
    https://developer.android.google.cn/reference/androidx/camera/core/ImageProxy

  • Surface
    https://developer.android.google.cn/reference/android/view/Surface

  • dequeueInputImage()
    https://developer.android.google.cn/reference/android/media/ImageWriter#dequeueInputImage()

  • ImageReader
    https://developer.android.google.cn/reference/android/media/ImageReader

  • ImageWriter
    https://developer.android.google.cn/reference/android/media/ImageWriter

  • ANativeWindow
    https://developer.android.google.cn/ndk/reference/group/a-native-window


对于输入数据,我们在 CameraX 内部支持 YUV_420_888 格式的不同变体 (I420,NV12,NV21 等)。对于输出数据,我们现在支持 RGBA 格式,但将来会扩展到更多其他的 RGB 格式。

由于我们使用 libyuv 作为新的依赖库,我们的库大小增加了大约 50 KB


  • libyuv
    https://chromium.googlesource.com/libyuv/libyuv/



API 使用



CameraX 1.1.0-alpha08 版本开始,应用可以通过在 ImageAnalysis 配置中使用 setOutputImageFormat 来选择 YUV_420_888 或者 RGBA_8888 的图片输出格式。

  • CameraX 1.1.0-alpha08
    https://developer.android.google.cn/jetpack/androidx/releases/camera#1.1.0-alpha08


一旦选择了 RGBA_8888,输出的图片格式将会是 PixelFormat.RGBA_8888,它只有一个带有填充的图像平面 (逐个 R,G,B,A 的像素)。原则上 Android framework 支持的图像缓冲区格式是 PixelFormat 和 ImageFormat 的子集。

  • PixelFormat.RGBA_8888
    https://developer.android.google.cn/reference/android/graphics/PixelFormat#RGBA_8888


相比之下,如果选择了 YUV_420_888,输出的图片格式将是 ImageFormat.YUV_420_888,它有 3 个独立的图像平面 (Y,U,V)。

  • ImageFormat.YUV_420_888
    https://developer.android.google.cn/reference/android/graphics/ImageFormat#YUV_420_888



性能



我们做了一些性能测试,并与在不同的 Android 版本和设备上使用 Renderscript 的结果进行了比较。总体上来说,在不同分辨率和 Android 系统版本上,使用 libyuv 的 pipeline 要优于使用 Renderscript 的实现。

  • Renderscript
    https://github.com/android/camera-samples/blob/master/CameraUtils/lib/src/main/java/com/example/android/camera/utils/YuvToRgbConverter.kt



总结



我们在 CameraX ImageAnalysis pipeline 中支持了 YUV 到 RGB 的转换。用户现在可以简单地为一个 ImageAnalysis 用例选择一个输出格式 (YUV_420_888 或 RGBA_8888),并用于其他库之中。而这仅仅是一个开始,我们还计划在 CameraX ImageAnalysis pipeline 中增加更多的图像处理功能,并将其扩展到其他的用例中 (例如 ImageCapture 或 Preview 等)。如果您有任何功能上的需求,请联系我们。


YUV 到 RGB 转换的示例代码可以在 GitHub 中查看。若需了解更多关于 CameraX 的消息,请参考官方文档。若要了解关于 CameraX 的最新进展,您可以加入 CameraX 讨论区。另外,您的反馈对我们来说十分具有价值,欢迎随时在 CameraX 讨论区留言或在官方的 Issue Tracker 中给我们反馈。


  • GitHub
    https://github.com/android/camera-samples/blob/main/CameraXTfLite/app/src/main/java/com/example/android/camerax/tflite/CameraActivity.kt#L170

  • 官方文档
    https://developer.android.google.cn/training/camerax

  • CameraX 讨论区
    https://groups.google.com/a/android.com/g/camerax-developers

  • Issue Tracker
    https://issuetracker.google.com/issues/new?component=618491&template=1257717



相关引用



  • CameraX 发布说明

    https://developer.android.google.cn/jetpack/androidx/releases/camera

  • 开始使用 CameraX

    https://developer.android.google.cn/codelabs/camerax-getting-started#0

  • CameraX Github 用例

    https://github.com/android/camera-samples

  • YUV 格式 Wiki

    https://wiki.videolan.org/YUV

您也可以通过下方二维码向我们提交反馈,或分享您喜欢的内容、发现的问题。您的反馈对我们非常重要,感谢您的支持!



推荐阅读

如页面未加载,请刷新重试

 点击屏末 | 阅读原文 | 即刻了解更多 CameraX 相关内容



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存