其他
百度APP Android包体积优化实践(三)资源优化
The following article is from 百度App技术 Author 政、蕙、迪
01
02
丨2.1 res/
丨2.2 resources.arsc
通过阅读在arsc中寻找对应资源的源码,可以看到在 LoadedPackage::GetEntryOffset 方法中,有两种资源 entry 偏移量定位方式,其中 SPARSE 格式在Android O+ 引入。我们以下图为例,假设 0x7f020010 和 0x7f020011 两个 ID 对应的entry为空,则两种方式的布局如下图所示,可以发现 SPARSE 格式在体积上会有优化,但查找资源的时间复杂度会从O(1)上升到O(logn)。
丨2.3 assets/
assets/ 下的资源属于 raw 文件,raw 文件表示需以原始形式保存的任意文件。从目录结构到文件内容均由开发者直接控制,使用时通过 AssetManager 直接获取。本质上 assets/和 res/ 的资源文件读取方式是一样的,都是 AssetsProvider 将 APK 内对应路径的文件解压映射到内存中。不同的是开发者调用 API 到 AssetsProvider 读取文件之间的路径,res/ 做了更多封装,所以相应地限制也会多一些。
由于 assets 资源文件灵活度很高,通用优化机制对其作用有限,我们一般会采取后下发的方式直接抹除这部分体积。后续我们的优化项全部针对 res/ 和resources.arsc展开。
03
丨3.1 AGP和AAPT
AGP(Android Gradle Plugin)在编译流程中定义了不少资源优化相关的任务,AGP 资源优化任务底层都是通过 AAPT2 完成的(除了旧资源缩减任务)。AAPT2(Android 资源打包工具)是一种构建工具,Android Studio 和 Android Gradle 插件使用它来编译和打包应用的资源。AAPT2 会解析资源、为资源编制索引,并将资源编译为针对 Android 平台进行过优化的二进制格式。下面介绍一些资源优化相关任务和AAPT2的优化参数。
丨OptimizeResources
AGP 4.2 + 注册了一个新的编译任务 OptimizeResourcesTask,顾名思义是对资源进行优化,在 LinkResourcesTask(即资源链接) 或 ShrinkResourceTask (即资源缩减)之后执行。该优化任务在 debuggable false 情况下默认开启,可以使用 android.enableResourceOptimizations = false 手动关闭。
// com/android/build/gradle/internal/tasks/OptimizeResourcesTask.class// OptimizeResourcesTask关联了AAPT2提供的优化项enum class AAPT2OptimizeFlags(val flag: String) { COLLAPSE_RESOURCE_NAMES("--collapse-resource-names"), SHORTEN_RESOURCE_PATHS("--shorten-resource-paths"), ENABLE_SPARSE_ENCODING("--enable-sparse-encoding")}internal fun doFullTaskAction(params: OptimizeResourcesTask.OptimizeResourcesParams) { // 添加 资源路径优化 参数 val optimizeFlags = mutableSetOf( AAPT2OptimizeFlags.SHORTEN_RESOURCE_PATHS.flag ) // 目前enableResourceObfuscation默认为false,且没有提供参数配置,所以不会开启资源名优化任务 if (params.enableResourceObfuscation.get()) { optimizeFlags += AAPT2OptimizeFlags.COLLAPSE_RESOURCE_NAMES.flag }}
丨ShrinkResources
1、必须启用严格模式
2、没有完全删除无用的资源文件
3、没有删除无用的value资源
启用 preciseShrinking 效果
任务顺序
丨resConfigs
分辨率配置最多配置一个值,若配置多个会编译报错 Cannot filter assets for multiple densities using SDK build tools 21 or later. Consider using apk splits instead。 使用安全优化。优化逻辑如图所示(不会出现NO_ENTRY)。
(2) 非分辨率配置
可以配置多个值。例如语言配置可以同时选英文、中文。
使用激进优化。该类型配置下,非目标配置均会被移除(可能出现NO_ENTRY)。
丨splits
splits 的作用是分包,例如根据不同分辨率打多个包。与 resConfigs 的区别是可以指定多个分辨率,一次性出包;但仅支持分辨率配置。谷歌官方建议,分包需求优先使用 AAB,应用商店不支持 AAB 的情况下再使用splits。
丨--shorten-resource-paths
添加资源路径优化参数后,AAPT2 会处理除了 res/color 目录外的全部资源路径,并在指定目录输出优化前后的路径映射文件。
// Android detects ColorStateLists via pathname, skip res/color*
if (util::StartsWith(res_subdir, "res/color"))
continue;
但翻看Android源码没有发现对应的使用,只是会对res/color目录下的资源扩展名进行校验,以区分xml文件和其他格式文件(这里进一步决定了后续的扩展名优化加白策略)。
丨--resources-config-path args
no_collapse。资源名优化加白。 no_obfuscate。同no_collapse(虽然目前跟no_collapse作用一样,但根据命名看未来有可能会满足混淆需求,资源同名化 小节会讲什么场景下有资源名混淆的需求)。 remove。移除该资源,优先级高于前两类 directive(我们认为这个优先级不合理)。是资源缩减 preciseShrinking 的底层实现。
丨--collapse-resource-names
丨--enable-sparse-encoding
丨3.2 AndResGurard
丨3.3 AabResGuard
04
丨4.1 资源文件路径优化
由于资源路径同时存在上述四处地方,而且除了MANIFEST.MF文件是可压缩的,其他三处均不可压缩。因此如果能对资源路径进行缩减,带来的将是近乎四倍的收益。例如,对每个资源文件,其资源路径缩减一个字符(占用1byte),按照以上方式所述再乘以四倍的收益,可减少大约4byte体积,假设一个App中有10000个资源文件,就可以优化将近40k的体积。如果能大幅减少资源文件路径长度则会带来更明显的收益。
百度App在资源路径方面的具体优化点主要分为以下三点:
丨资源文件目录优化
我们将资源文件所属目录从res/type[-config_qualifier ]修改为r/,尽可能的缩短了资源文件的路径长度。
丨资源文件名优化
我们通过一致性Hash映射机制,保持了原资源路径与优化后的路径固定映射,优化后的文件名固定为三个字符,相比原文件名有了明显缩短,实际测试有较少的哈希冲突,这样能够保持较小的安装差量包,同时也减少了覆盖安装后首次启动因为资源名称和资源ID变化造成的崩溃问题。
std::string ShortenFileName(const android::StringPiece& file_path, int output_length) {
std::size_t hash_num = std::hash<android::StringPiece>{}(file_path);
std::string result = "";
// Convert to (modified) base64 so that it is a proper file path.
for (int i = 0; i < output_length; i++) {
uint8_t sextet = hash_num & 0x3f;
hash_num >>= 6;
result += base64_chars[sextet];
}
return result;
}
丨资源文件扩展名优化
除此之外,我们还较为激进地去掉了大部分文件的扩展名,这样每个资源至少可以优化4个byte。
文件的扩展名主要有两个作用,一是给使用者辨别文件格式,二是操作系统默认使用什么软件加载文件,真正的文件格式并不受扩展名影响。对 Android 系统来说,res文件扩展名也有两个作用:
(1)在编译期利用扩展名快速校验,限制文件类型。
(2)运行期间获取文件流后,根据扩展名进行不同的解析封装操作(或者再次校验),再传递给上层。
由于我们的优化是在资源编译之后进行,所以问题1可以不用考虑。针对问题2,我们发现源码中使用扩展名的情况包括:
private ComplexColor loadComplexColorForCookie(Resources wrapper, TypedValue value, int id,
Resources.Theme theme) {
...
if (file.endsWith(".xml")) {
// xml 格式解析
} else {
// 校验不通过,必须是xml文件
}
...
}
private Drawable loadDrawableForCookie(@NonNull Resources wrapper, @NonNull TypedValue value,
int id, int density) {
...
if (file.endsWith(".xml")) {
// xml 格式解析
} else {
// 其他格式解析
}
...
}
分析上面的代码可以发现,是将 res/color 和 res/drawable 目录下的文件分为 xml 格式和其他格式,所以只需要针对这两类目录下的 xml 格式文件保留扩展名即可。
bool ResourcePathShortener::Consume(IAaptContext* context, ResourceTable* table) {
// res/color 和 res/drawable 目录下的xml文件扩展名需要保留
if (util::StartsWith(res_subdir, "res/color") || util::StartsWith(res_subdir, "res/drawable")) {
if (util::StartsWith(extension, ".xml")) {
keep_extensions = true;
}
}
}
除此之外,我们还配置了资源文件路径优化白名单机制,对于需要通过路径查找资源等特殊情况进行了豁免。
通过上述对三种路径优化方式,我们分析APK可以直观的看出优化的结果。
丨4.2 资源名优化
资源名优化主要包含了资源同名化和资源名混淆两部分。
如第4章开始处介绍,除了arsc文件中的全局字符串池记录了完整的资源路径,在arsc中的Package数据块中还保存了所有资源名的字符串池。
在实际应用中,我们默认通过资源 id 查找资源内容,对资源名的使用频率十分低,仅限于通过资源名反查资源 id 以及 通过资源 id 获取资源名两种情况。所以资源项名称字符串池所占据的空间即是我们的优化对象。极限优化结果是,这个池子里仅存放一个字符串,所有 ResTable_entry 的资源项名称 index均指向这个池子里仅有的字符串,即所有资源的名字都变得一样了。考虑到豁免的需求,我们也增加了白名单机制。对于资源文件来说,虽然文件名和 ResourceEntryName 的内容是一样的,但实质是两个不同的概念,所以优化与加白都应该分开处理。
由于现在 arsc 不能压缩,资源名对应的字符串都是可以实实在在优化的体积。
在实际使用中,如果调用了以下接口,那么同名化后,不能通过资源名区分资源,可能会导致某些场景的失效。例如全埋点场景,通常会收集UI控件的名字(也就是资源名)作为唯一标识。在同名化后必须修改为将[资源名,资源类型,包名]作为唯一标识。
// android/content/res/Resources.java
public int getIdentifier(String name, String defType, String defPackage)
public String getResourceName(@AnyRes int resid)
public String getResourceEntryName(@AnyRes int resid)
// android/content/ContentResolver.java
// URI scheme = android.resource,内部调用的还是Resources.getIdentifier
public final @Nullable InputStream openInputStream(@NonNull Uri uri)
public final @Nullable AssetFileDescriptor openAssetFileDescriptor(@NonNull Uri uri,
@NonNull String mode, @Nullable CancellationSignal cancellationSignal)
除此之外,我们还提供了混淆功能,可以输出混淆前后的资源名映射文件。对于上面全埋点场景的例子,建议使用资源名混淆。这样既保证了场景的有效性,也可以减少一部分体积。
丨4.3 arsc configuraion稀疏条目优化
我们知道arsc的Package数据块中包含了Type Spec(类型规范数据块)列表,每个Type Spec包含了configuraion 列表。每一个资源id是从属于特定Type Spec的,会在该Type Spec下面的所有configuration列表中有对应的res value信息。这是同一个资源ID在不同配置下,找到不同资源值的原理。根据起始偏移量和每个字符串的偏移量数组,我们就能定位资源。如果这个资源对应的configuration不存在,仍会保留一个res value的空间(值为0) ,占用4个字节的空间,以满足偏移量查询方式。
如下图中的空白区域所示,对一个名为abc_edit_text_material的资源来说,只存在于默认的drawable目录下,其他配置项均为空白占位,有较大的优化空间。
因此通过优化arsc中不必要的 configuraion,就可以减少对齐占位。百度App目前主要是以优化源码中的资源目录来实现,删除不必要的资源类型路径,从而达到减少configuraion的目的。
如第2章介绍,AAPT2已经支持对稀疏条目进行优化,百度App由于minSdkVersion的原因暂未开启。
丨4.4 其它优化
上面讲得是集成在编译流程中的体积优化项,还有一部分优化由于时间原因或者成本原因没有做到工具里,这里也会逐一介绍。这部分优化关系到的不止是体积,还有开发效率等。
丨图片文件压缩
图片压缩主要有两种方式:
(1)减少颜色数。一张图具备颜色数量越多,单个pixel位数就会越多。一般情况下,非渐进色图片只需要256种颜色(即pixel 8bit)。TinyPng采用的就是这个原理。
(2)移除元数据。图片中会携带版权、相机信息等元数据,可以选择移除这部分数据。
我们对比了多种业界图片压缩工具,最终选择了ImageOptim工具来完成图片压缩。ImageOptim能移除元数据,并支持无损压缩,在磁盘空间和带宽方面收益明显。
丨重复资源
重复资源指的是资源内容相同,但资源路径不同的资源,这个问题会导致重复的体积。我们可以通过对比md5判断资源文件是否重复。
丨相似资源
相较重复资源,相似资源出现的概率更高、更不容易被发现。对于图片资源,可以使用opecv中集成的特征检测器计算相似度,应用内置资源通常特征点数量少,计算速度快。
重复资源与相似资源最佳的解决方案是协同UE共建资源平台,从源头上提升资源复用率。
丨AAB
从2021年8月开始,谷歌商店要求应用以AAB格式上架,其主要目的是在应用分发处消化机型适配和动态功能造成的体积增加,避免了开发者管理多个分包的麻烦事。
丨声明式UI
随着声明式UI 逐渐走上前台,越来越多的替代传统的View + xml的格式,逻辑代码与 UI 布局之间的转化隔阂势必会被消除。Compose 带来的优点很多,其中之一即是体积会比View + xml更小。在谷歌官方的 《Jetpack Compose 使用前后对比》 一文说道:Tivi应用在使用了 Compose 后,我们发现 APK 大小缩减了 41%,方法数减少了 17%。
05
本文主要介绍了百度APP资源优化方案,其中重点讲述了在资源路径和资源名方面的优化。感谢各位阅读至此,如有问题请不吝指正。
END