如何理解Rust闭包的虫洞穿梭

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

这篇文章主要介绍“如何理解Rust闭包的虫洞穿梭”，在日常操作中，相信很多人在如何理解Rust闭包的虫洞穿梭问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何理解Rust闭包的虫洞穿梭”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

1. 闭包是什么

闭包(Closure)的概念由来已久。无论哪种语言，闭包的概念都被以下几个特征共同约束：

匿名数函(非独有，函数指针也可以);
可以调用闭包，并显式传递参数(非独有，函数指针也可以);
以变量形式存在，可以传来传去(非独有，函数指针也可以);
可以在闭包内直接捕获并使用定义所处作用域的值(独有);

神奇的是最后一点，理解起来也比较别扭的，习惯就好了。

为了说明上述特征，可以看一个Rust例子。

fn display<T>(age: u32, print_info: T)     where T: Fn(u32) {    print_info(age);}fn main() {     let name = String::from("Ethan");     let print_info_closure = |age|{         println!("name is {}", name);         println!("age is {}", age);     };    let age = 18;     display(age, print_info_closure);}

运行代码：

name is Ethan  age is 18

首先，闭包作为匿名函数存在了print_info_closure栈变量中，然后传递给了函数display作为参数，在display内部调用了闭包，并传递了参数age。最后神奇的事情出现了：在函数display中调用的闭包居然打印出了函数main作用域中的变量name。

闭包的精髓，就在于它同时涉及两个作用域，就仿佛打开了一个"虫洞"，让不同作用域的变量穿梭其中。

let x_closure = ||{};

单独一行代码，就藏着这个奥妙：

赋值=的左侧，是存储闭包的变量，它处在一个作用域中，也就是我们说的闭包定义处的环境上下文;
赋值=的右侧，那对花括号{}里，也是一个作用域，它在闭包被调用处动态产生;

无论左侧右侧，都定义了闭包的属性，天然的联通了两个作用域。

对于闭包，Rust如此，其他语言也大抵如此。不过，Rust不是还有所有权、生命周期这一档子事儿么，所以还可以深入分析下。

2. Rust闭包捕获上下文的方式

Rust闭包如何捕获上下文?

换个问法，main作用域中的变量name是以何种方式进入闭包的作用域的(第1节例子)?转移or借用?

It Depends，视情况而定。

Rust在std中定义了3种trait：

FnOnce：闭包内对外部变量存在转移操作，导致外部变量不可用(所以只能call一次);
FnMut：闭包内对外部变量直接使用，并进行修改;
Fn：闭包内对外部变量直接使用，不进行修改;

后者能办到的，前者一定能办到。反之则不然。所以，编译器对闭包签名进行推理时：

实现FnMut的，同时也实现了FnOnce;
实现Fn的，同时也实现了FnMut和FnOnce。

第1节的例子，将display的泛型参数从Fn改成FnMut，也可以无警告通过。

fn display<T>(age: u32, mut print_info: T)     where T: FnMut(u32) {    print_info(age);}

对环境变量进行捕获的闭包，需要额外的空间支持才能将环境变量进行存储。

3. 作为参数的闭包签名

上面代码display函数定义，要接受一个闭包作为参数，揭示了如何显式的描述闭包的签名：在泛型参数上添加trait约束，比如T: FnMut(u32)，其中(u32)显式的表示了输入参数的类型。尽管是泛型参数约束，但是函数签名(除了没有函数名)描述还是非常精确的。

顺便说一句，Rust的泛型真的是干了不少事情，除了泛型该干的，还能添加trait约束，还能描述生命周期。

描述签名是一回事，但是谁来定义闭包的签名呢?闭包定义处，我们没有看到任何的类型约束，直接就可以调用。

答案是：闭包的签名，编译器全部一手包办了，它会将首次调用闭包传入参数和返回值的类型，绑定到闭包的签名。这就意味着，一旦闭包被调用过一次后，再次调用闭包时传入的参数类型，就必须是和第一次相同。

传入参数和返回值类型绑定好了，但你心中难免还会有一丝忧愁：描述生命周期的泛型参数肿么办?

Rust编译器也搞得定。

fn main(){         let lifttime_closure = |a, b|{         println!("{}", a);         println!("{}", b);         b    };    let a = String::from("abc");     let c;     {        let b = String::from("xyz");         c = lifttime_closure(&a, &b);    }    println!("{}", c); }

以上代码无法通过编译，成功检测出了悬垂引用：

error[E0597]: b does not live long enough

显然，对于闭包，编译期可以对引用的生命周期进行检查，以保证引用始终有效。

这个例子，与其解释闭包与函数的区别，不如解释匿名函数与具名函数的区别：

具名函数是签名在先的，对于编译器来说，调用方和函数内部实现，只要分别遵守签名的约定即可。
匿名函数的签名则是被推理出来的，编译器要看全看透调用方的实际输入，以及函数内部的实际返回，检查自然也就顺带做掉了。

4. 函数返回闭包

第1节的例子，我们将一个闭包作为函数参数传入，那么根据闭包的特性，它应该能够作为函数的返回值。答案是肯定的。

基于前面介绍的Fn trait，我们定义一个返回闭包的函数，代码如下：

fn closure_return() -> Fn() -> (){     ||{}    }

可是，编译失败了：

error[E0746]: return type cannot have an unboxed trait object  doesn't have a size known at compile-time

失败信息显示，编译器无法确定函数返回值的大小。一个闭包有多大呢?并不重要。

开门见山，通用的解决方法是：为了能够返回闭包，可以使用一次装箱，从而将栈内存变量装箱存入堆内存，这样无论闭包有多大，函数返回值都是一个确定大小的指针。下面的代码里，使用Box::new即可完成装箱。

fn closure_inside() -> Box<dyn FnMut() -> ()> {    let mut age = 1;     let mut name = String::from("Ethan");     let age_closure = move || {         name.push_str(" Yuan");         age += 1;         println!("name is {}", name);         println!("age is {}", age);     };    Box::new(age_closure) }fn main(){     let mut age_closure = closure_inside();     age_closure();    age_closure();}

运行结果如下：