Rust 异步编程简单入门
再次祭出陈天老师的 Rust 学习路径图,记得当初初学 Rust 的时候异步编程就看了个大概,直接略过了底层原理的探究,尤其是自引用和Pin之类的概念相当枯燥难懂,理解看起来着实费劲。如果你的工作大部分是 CRUD,写一些和数据库打交道的 HTTP API,底层原理的东西的确用处不大,但如果你想让自己的技能树稍微丰富一些,能做一些别人做不了的事情,能面对不同的场景设计出来更高效的系统,那就需要系统的认真的学习 Rust 异步的设计思路和精髓。先用一个简单例子进入 Rust 异步编程的世界。
Rust 异步编程 async/.await
async/.await
是 Rust 内置的语言特性,可以让我们用同步的方式去编写异步的代码。
下面我们来通过例子学习 async/.await
关键字该如何使用,在开始之前,需要先引入 futures
包。编辑 Cargo.toml
文件并添加以下内容:
[dependencies]
futures = "0.3"
使用 async
创建一个异步 Future
简单地说,async
关键字可以用于创建如下类型的 Future
:
- 定义函数:
async fn
- 定义 block:
async {}
比如async
函数:
async fn hello_world() {
...
}
async
关键字,将函数的原型修改为返回一个Future trait object
。然后将执行的结果包装在一个新的future
中返回,大致相当于:
fn hello_world() -> impl Future<Output = ()> {
async { ... }
}
注:
async
代码块会实现一个匿名的Future trait object
,包裹一个Generator
。也就是一个实现了Future
的Generator
。Generator
实际上是一个状态机,配合.await
当每次async
代码块中任何返回Poll::Pending
则即调用generator yeild
,让出执行权,一旦恢复执行,generator resume
继续执行剩余流程,当所有代码执行完,也就是状态机进入Complete
,返回Poll::Ready
,代表Future
执行完毕。
通过 async
标记的语法块会被转换成实现了Future
特征的状态机。与同步调用阻塞当前线程不同,当Future
执行并遇到阻塞时,它会让出当前线程的控制权,等待其他 Future 的执行结果。
Future
需要在一个执行器( executor
)上运行,比如block_on
就是一个可以阻塞当前线程的执行器
// block_on 会阻塞当前线程直到指定的 Future 执行完成,这种阻塞当前线程以等待任务完成的方式较为简单、粗暴,
// 好在其它运行时的执行器(executor)会提供更加复杂的行为,例如 join 将多个 future 调度到同一个线程上执行。
use futures::executor::block_on;
async fn hello_world() {
println!("hello, world!");
}
fn main() {
let future = hello_world(); // 返回一个Future, 因此不会打印任何输出
block_on(future); // 执行 Future 并等待其运行完成,此时 "hello, world!"会被打印输出
}
使用 await
等待另一个异步 Future
调用的完成
在上述代码的main
函数中,我们使用block_on
这个执行器等待Future
的完成,让代码看上去非常像是同步代码,但是如果你要在一个async fn
函数中去调用另一个async fn
并等待其完成后再执行后续的代码,该如何做?例如:
use futures::executor::block_on;
async fn hello_world() {
// 在异步函数中直接调用另一个异步函数,是否会有问题?
hello_cat();
println!("hello, world!");
}
async fn hello_cat() {
println!("hello, kitty!");
}
fn main() {
let future = hello_world();
block_on(future);
}
这里,我们在hello_world
异步函数中先调用了另一个异步函数hello_cat
,然后再输出hello, world!
,看看运行结果:
warning: unused implementer of `futures::Future` that must be used
--> src/main.rs:6:5
|
6 | hello_cat();
| ^^^^^^^^^^^^
= note: futures do nothing unless you `.await` or poll them
...
hello, world!
不出所料,main
函数中的future
我们通过block_on
函数进行了运行,但是这里的hello_cat
返回的Future
却没有任何人去执行它,不过好在编译器友善的给出了提示:futures do nothing unless you `.await` or poll them
,两种解决方法:使用.await
语法或者对Future
进行轮询(poll
)。
后者较为复杂,暂且不表,先来使用.await
试试:
use futures::executor::block_on;
async fn hello_world() {
hello_cat().await;
println!("hello, world!");
}
async fn hello_cat() {
println!("hello, kitty!");
}
fn main() {
let future = hello_world();
block_on(future);
}
为hello_cat()
添加上.await
后,结果立刻大为不同:
hello, kitty!
hello, world!
输出的顺序跟代码定义的顺序完全符合,因此,我们在上面代码中使用同步的代码顺序实现了异步的执行效果,非常简单、高效,而且很好理解,未来也绝对不会有回调地狱的发生。
实际上每一个.await
本身就像一个执行器,在循环中查询Future
的状态。如果返回Pending
,则 yield
,否则退出循环,结束当前Future
。
代码逻辑大致如下:
loop {
match some_future.poll() {
Pending => yield,
Ready(x) => break
}
}
总之,在async fn
函数中使用.await
可以等待另一个异步调用的完成。但是与block_on
不同,.await
并不会阻塞当前的线程,而是异步的等待Future A
的完成,在等待的过程中,该线程还可以继续执行其它的Future B
,最终实现了并发处理的效果。
一个例子
考虑一个载歌载舞的例子,如果不用.await
,我们可能会有如下实现:
use futures::executor::block_on;
struct Song {
author: String,
name: String,
}
async fn learn_song() -> Song {
Song {
author: "周杰伦".to_string(),
name: String::from("《菊花台》"),
}
}
async fn sing_song(song: Song) {
println!(
"给大家献上一首{}的{} ~ {}",
song.author, song.name, "菊花残,满地伤~ ~"
);
}
async fn dance() {
println!("唱到情深处,身体不由自主的动了起来~ ~");
}
fn main() {
let song = block_on(learn_song()); // 第一次阻塞
block_on(sing_song(song)); // 第二次阻塞
block_on(dance()); // 第三次阻塞
}
以上代码运行结果无疑是正确的,但需要通过连续三次阻塞去等待三个任务的完成,一次只能做一件事,实际上我们完全可以载歌载舞。
use futures::executor::block_on;
struct Song {
author: String,
name: String,
}
async fn learn_song() -> Song {
Song {
author: "周杰伦".to_string(),
name: String::from("《菊花台》"),
}
}
async fn sing_song(song: Song) {
println!(
"给大家献上一首{}的{} ~ {}",
song.author, song.name, "菊花残,满地伤~ ~"
);
}
async fn dance() {
println!("唱到情深处,身体不由自主的动了起来~ ~");
}
async fn learn_and_sing() {
// 这里使用 .await 来等待学歌的完成,但是并不会阻塞当前线程
let song = learn_song().await;
// 唱歌必须要在学歌之后,也就是sing_song Future 必须等待learn_song Future 完成
sing_song(song).await;
}
async fn async_main() {
let f1 = learn_and_sing(); // 学歌然后唱歌的 Future
let f2 = dance(); // 跳舞的 Future
// join!宏 可以并发的处理和等待多个 Future
// 若 learn_and_sing Future 被阻塞,那 dance Future 可以拿过线程的所有权继续执行。若 dance 也变成阻塞状态,那 learn_and_sing 又可以再次拿回线程所有权,继续执行。
// 若两个都被阻塞,那么 async main 会变成阻塞状态,然后让出线程所有权,并将其交给 main 函数中的 block_on 执行器
futures::join!(f1, f2);
}
fn main() {
block_on(async_main());
}
上面代码中,学歌和唱歌具有明显的先后顺序,但是这两者都可以跟跳舞一同存在,也就是你可以在跳舞的时候学歌,也可以在跳舞的时候唱歌。如果上面代码不使用.await
,而是使用block_on(learn_song())
, 那在学歌时,当前线程就会阻塞,不再可以做其它任何事,包括跳舞。
因此.await
对于实现异步编程至关重要,它允许我们在同一个线程内并发的运行多个任务,而不是一个一个先后完成。
至此,对 Rust 的async/.await
异步编程有了一个清晰的初步印象,后续再深度学习这背后的原理:Future
和任务在底层如何被执行。
注:实际上
async/.await
通过一个状态机来控制代码的流程,配合执行器Executor
完成协程的切换,编写异步代码不需要手动写Future
及其poll
方法,特别是异步逻辑的状态机也是由async
自动生成,大大简化程序员的工作。
总结
async
/.await
是 Rust 的内置工具,用于编写看起来像同步代码的异步函数,async
将一个代码区块,转换为实现称为 Future
trait 的状态机,Future
需要在一个 executor
上运行。而在同步方法中,调用阻塞函数将阻塞整个线程,Future
将 yield 对线程的控制权,允许其他Future
运行。在async fn
函数中使用.await
可以等待另一个异步调用的完成。但是与block_on
不同,.await
并不会阻塞当前的线程,而是异步的等待Future A
的完成,在等待的过程中,该线程还可以继续执行其它的Future B
,最终实现了并发处理的效果。
Future
代表一个可在未来某个时候获取返回值的 task,在 Rust 中是惰性的,只有在被轮询(poll
)时才会运行async
用于创建一个Future
,比如创建一个异步函数或者异步代码块await
本身就像一个执行器,在循环中查询Future
的状态,等待另一个Future
的完成executor
是Future
的管理和执行器, 比如block_on
是一个可以阻塞当前线程的执行器async
在 Rust 中使用零开销的,无需分配任何堆内存、也无需任何动态分发来使用async
async/await
是 Rust 语言层面支持等关键字,但是并没有内置异步调用所必需的运行时,需要引入第三方运行时实现,例如tokio
,async-std
,smol
等
总之,async/await
是 Rust 的异步编程模型,是产生和运行并发任务的手段,async
来方便地生成 Future,await
来触发 Future 的调度和执行。
参考
转载自:https://juejin.cn/post/7214007449907740732