Flutter 性能优化 Tips
本文目的
- 介绍应用流畅性的检测和优化策略
- 介绍内存的检测和优化策略
- 介绍性能优化证明的意义和流程
- 介绍性能检测工具 Observatory 的基础使用
目录结构
- 流畅性
- 内存优化
- 优化证明
- 性能检测利器 Observatory 基础使用
- 总结
流畅性
App 流畅性的关键指标有 UI帧率,GPU帧率,我们期望它能达到 60fps,也就是16ms每帧。
以 profile / release 模式运行
为了获取最接近生产环境的数据,我们应该选择一台尽可能低端的真机,并且以 profile 模式或者 release 模式下运行app。
- 因为 debug 模式会有一些额外的检查工作,比如
assert()
等- 为了加速开发效率,debug 模式是以 JIT(Just in time)模式编译 dart 代码的,而 profile 和 release 是提前编译为机器码 AOT(Ahead Of Time),所以 debug 会慢很多
-
在 Android Studio and IntelliJ 中, 在菜单栏中点击
Run > Flutter Run main.dart in Profile Mode
-
VS Code:打开 launch.json 文件并设置flutterMode 为 profile:
"configurations": [
{
"name": "Flutter",
"request": "launch",
"type": "dart",
"flutterMode": "profile" # 测试完后记得把它改回去!
}
]
- 用命令行启动:
$ flutter run --profile
检测帧率
那么检测帧率有哪些方法呢?Flutter 给我们提供了 Performance Overlay
,如下图,绿色代表当前渲染帧。

我们有三种开启方式
- 在Android Studio 和 IntelliJ IDEA中:
选中
View > Tool Windows > Flutter Inspector
. 点击下面这个按钮。

-
在 VS Code中 选中
View > Command Palette…
会显示一个 command 面板. 在命令面板中输入performance
并选择Toggle Performance Overlay
如果命令显示为不可用,需要检查 app 是否正在运行. -
从命令行中运行 键盘输入
P
-
代码中打开 在
MaterialApp
或者WidgetsApp
的构造函数中设置showPerformanceOverlay
属性为true
:
class MyApp extends StatelessWidget {
@override
Widget build(BuildContext context) {
return MaterialApp(
showPerformanceOverlay: true, // 开启
title: 'My Awesome App',
home: MyHomePage(title: 'My Awesome App'),
);
}
}
然后就是动手操作 app,并观察图表上是否出现红色线条。绿色代表当前帧,当页面有变动,图表会不断绘制。蒙版上有2个图表,每个图表上有三横格,每个横格代表16ms。如果大多数帧都在第一格,说明达到了期望的帧率。

图表分别体现了 UI帧率 和 GPU帧率。如果出现了红色,说明对应的线程有太多work要做。那先来了解一下 Flutter 中的4个主要线程分别承担了什么职责。
- Platform线程:插件代码运行的线程;即Android/iOS的主线程,
- UI线程:在Dart虚拟机中执行Dart代码。作用是创建视图树,然后将它发送给GPU。注意不要阻塞此线程!
- GPU线程:把上面提到的视图树渲染出来,虽然我们在flutter中不能直接访问GPU线程和数据,但是Dart代码可能导致此线程变慢
- I/O线程:执行比较耗时的任务
在运行app的过程中,观察爆红的地方和触发场景,进行分析。
分析思路
- 如果是UI报红:那么可能是执行了某个较耗时的函数?或者函数调用过多?算法复杂度高?
- 如果只是 GPU 报红:那么可能是要绘制的图形过于复杂?或者执行了过多GPU操作?
- 比如要实现一个混合图层的半透明效果:如果把透明度设置在顶层控件上,CPU会把每个子控件图层渲染出来,再执行
saveLayer
操作保存为一个图层,最后给这个图层设置透明度。而saveLayer
开销很大,这里官方给出了一个建议:首先确认这些效果是否真的有必要;如果有必要,我们可以把透明度设置到每个子控件上,而不是父控件。裁剪操作也是类似。 - 还有一个拖慢GPU渲染速度的是没有给静态图像做缓存,导致每次build都会重新绘制。我们可以把静态图形加到
RepaintBoundry
控件中,引擎会自动判断图像是否复杂到需要用repaint boundary,不需要的话也会忽略。 - 开启saveLayer和图形缓存的检查
MaterialApp( showPerformanceOverlay: true, checkerboardOffscreenLayers: true, // 使用了saveLayer的图形会显示为棋盘格式并随着页面刷新而闪烁 checkerboardRasterCacheImages: true, // 做了缓存的静态图片在刷新页面时不会改变棋盘格的颜色;如果棋盘格颜色变了说明被重新缓存了,这是我们要避免的 ... );
- 比如要实现一个混合图层的半透明效果:如果把透明度设置在顶层控件上,CPU会把每个子控件图层渲染出来,再执行
提高流畅性的策略
内存优化
在内存优化方面,我们的目标是希望减少应用内存占用,减少被系统杀死的概率,同时尽可能的避免内存泄露,减少内存碎片化。
内存优化策略
- 加载对象过大?如图片质量和尺寸不做限制就加载
- 加载对象过多?如加载长列表;在调用频率很高的方法中创建对象
- 合理设置缓存大小/长度
- 在内存不足时或离开页面时清空缓存数据
- 使用ListView.build()来复用子控件
- 自定义绘图中避免在onDraw中做创建对象操作,或者相同的参数设置
- 复用系统提供的资源,比如字符串、图片、动画、样式、颜色、简单布局,在应用中直接引用
- 内存泄露的问题?比如dispose需要销毁的listener等
- 不可见的视图是否也在build?
- 页面离开后的网络请求是否取消?
如何获取内存状态
Dart 提供了一个性能检测工具Observatory,我在最后一部分会进行详细介绍
优化证明
优化证明的意义
性能优化不像其它的开发需求只要完成功能即可,它需要通过统计和数据来证明优化的效果。比如帧率有了多少提高?CPU占用率降低了多少?内存占用减少了多少?对比其它优化策略,哪个优化效果好?
优化证明的流程

举个例子
以检查流畅性为例
1. 在profile模式下运行并开启Performance Overlay,整体测试app
2. 找到帧率报红色的模块
3. 把页面孤立出来,并多次测量,并得到baseline(参照)帧率数据。比如长列表页面出现了卡顿,我们可以用TestDriver写一个ListView滑动的性能测试(更多参考Flutter gallery)
scroll_pref.dart
void main() {
enableFlutterDriverExtension();
runApp(const GalleryApp(testMode: true));
}
scroll_perf_test.dart
void main() {
group('scrolling performance test', () {
FlutterDriver driver;
setUpAll(() async {
driver = await FlutterDriver.connect();
});
tearDownAll(() async {
if (driver != null)
driver.close();
});
test('measure', () async {
final Timeline timeline = await driver.traceAction(() async {
await driver.tap(find.text('Material'));
final SerializableFinder demoList = find.byValueKey('GalleryDemoList');
for (int i = 0; i < 5; i++) {
await driver.scroll(demoList, 0.0, -300.0, const Duration(milliseconds: 300));
await Future<void>.delayed(const Duration(milliseconds: 500));
}
// Scroll up
for (int i = 0; i < 5; i++) {
await driver.scroll(demoList, 0.0, 300.0, const Duration(milliseconds: 300));
await Future<void>.delayed(const Duration(milliseconds: 500));
}
});
TimelineSummary.summarize(timeline)
..writeSummaryToFile('home_scroll_perf', pretty: true)
..writeTimelineToFile('home_scroll_perf', pretty: true);
});
});
}
在命令行下执行以下命令
flutter driver --target=test_driver/scroll_perf.dart
这个命令会:
- build 目标 app,并把它安装到设备上
- 运行位于
test_driver/
目录下的scroll_perf_test.dart
的测试( flutter drive 能帮你找到带_test
后缀的同名文件)
Test Driver 将会安装 app 到设备上,再跳转到 Material-GalleryDemoList 页面,做5次滑动列表的操作。执行完成后会借助 TimelineSummary
,在build目录下生成两个json文件:home_scroll_perf.timeline.json
和home_scroll_perf.timeline_summary.json
。这里我们看一下timeline_summary.json
文件的内容
{
"average_frame_build_time_millis": 5.6319655172413805, # 平均每帧 build 时间
"90th_percentile_frame_build_time_millis": 10.216,
"99th_percentile_frame_build_time_millis": 17.168,
"worst_frame_build_time_millis": 20.415, # 最长帧 build 时间
"missed_frame_build_budget_count": 21, # build 期丢帧数
"average_frame_rasterizer_time_millis": 14.234294964028772, # 平均每帧光栅化时间
"90th_percentile_frame_rasterizer_time_millis": 22.338,
"99th_percentile_frame_rasterizer_time_millis": 42.661,
"worst_frame_rasterizer_time_millis": 43.161,
"missed_frame_rasterizer_budget_count": 112,
"frame_count": 116,
"frame_build_times": [
...
],# 所有帧的 build 时间
"frame_rasterizer_times": [
...
] # 所有帧的光栅化时间
}
4. 优化
5. 用步骤3的方法再次测量,对比baseline得出确切的优化效果
Flutter 提供的性能调试 API
更多可以参考官方文档
性能检测利器 Observatory
Observatory 是用于分析和调试Dart应用程序的工具。Observatory允许您根据需要查看正在运行的Dart虚拟机(VM),并提供实时,即时的数据报告。您可以使用它来浏览应用程序的很多状态。
打开Observatory
有2种方式:
- 在 androidStudio 中打开
Flutter Inspector
面板,点击小闹钟图标,如下图 - 再命令行中运行
flutter run
,应用启动成功后,命令行中会输出一个 url,把 url copy 到浏览器即可。
打开Observatory面板,要先选择isolate,表示当前应用。

主要页面
下面是性能优化常关注的几个页面。

1. CPU Profile
app的时间都花在哪了?
进入这个页面后要一般需加载个几秒钟,so be patient。图表的下部按cpu占用比例做了一个列表,反映的是函数的调用次数和执行时间(划重点)。一般排在前面的函数(这些函数是?有待学习)都不是我们写的dart代码。如果你发现自己的某个函数调用占比反常,那么可能存在问题。
注:flutter程序的cpu profile和官方文档上的数据展示不太一样,没有VM tags,所以对于百分比的具体含义有待研究。

采样过程:它每隔一定时间对isolate做采样,采样的数据存储在一个环形缓冲区(叫做profile),它能存放约2分钟的数据,一旦缓冲区满了,它会用最新的sample替换掉最旧的。
- Profile contains:采样时长和对应的采样数
- Sampling:采样频率,默认1000Hz,即每毫秒采样一次
2. Allocation Profile
内存都被谁吃了?

Heap 堆,动态分配的Dart对象所在的内存空间
- New generation: 新创建的对象,一般来说对象比较小,生命周期短,如local 变量。在这里GC活动频繁
- Old generation:从GC中存活下来的New generation将会提拔到老生代Old generation,它比新生代空间大,更适合大的对象和生命周期长的对象
通过这个面板你能看到新生代/老生代的内存大小和占比;每个类型所占用的内存大小。
为了debug的方便,我们可以获取到某段时间的内存分配情况:点击Reset Accumulator按钮,把数据清零,执行一下要测试的程序,点击刷新。
为了检查内存泄露,我们可以点击GC按钮,手动执行GC。
Accumulator Size:自点击Reset Accumulator以来,累加对象占用内存大小 Accumulator Instances:自点击Reset Accumulator以来,累加实例个数 Current Size:当前对象占用内存大小 Current Instances:当前对象数量
3. Heap Map
是否出现内存碎片化
heap map 面板能查看old generation中的内存状态
它以颜色显示内存块。 每个内存页面(page of memory)为256 KB,每页由水平黑线分隔。 像素的颜色表示对象的类ID - 例如,蓝色表示字符串,绿色表示双精度表。 可用空间为白色,指令(代码)为紫色。 如果启动垃圾收集(使用“分配配置文件”屏幕中的GC按钮),堆映射中将显示更多空白区域(可用空间)。 将光标悬停在上面时,顶部的状态栏显示有关光标下像素所代表的对象的信息。 显示的信息包括该对象的类型,大小和地址。 当你看到白色区域中有很多分散的其它颜色,说明存在内存碎片化,可能是内存泄露导致的。
其它
1. Code Coverage
知道哪些代码执行了,哪些没有执行

- 绿色:已执行的代码
- 红色:未执行的代码
- 没有颜色:不可执行的代码
应用场景:写某个类的单元测试,跑完测试后,可以查看哪些代码没有覆盖到,进而补全
2. Class/Instance 信息
查看某个实例的状态,比如我们的项目中使用了Flutter_redux,页面的展示来源与状态树,当页面出现了非预期的效果,我们可以通过Observatory查看状态树

举个例子
总结
性能优化涉及了应用的方法面面,很难一言以蔽之。本文我们主要讨论了性能优化的两大主题 —— 流畅性和内存优化,并分别介绍了他们的检测方法和优化策略。另外,我们在优化的同时也要加强优化的证明,用数据说话。最后,我强烈推荐大家尝试一下 Observatory 这个工具,开发中如果遇到了奇怪的问题,没准它能帮你找到答案。
参考
本文版权属于再惠研发团队,欢迎转载,转载请保留出处。@akindone
转载自:https://juejin.cn/post/6844903736956059662