性能优化利器之Constexpr
最近在升级系统和进行一些性能优化,业余时间也看一些技术书籍和视频,看了下上次更新文章的时间,大致在一个月前了,确实有点久了,所以赶紧拾起来,不能让大伙忘了我不是😁。
今天,聊聊在升级过程中的一个比较重要的优化点-编译期优化。
概述
说明符constexpr是自C++11引入,我相信很多人跟我一样,在第一次接触这个的时候,会很容易和const混淆。
从概念上理解的话,constexpr即常量表达式,重点在表达式字段,用于指定变量或函数可以在常量表达式中使用,可以(或者说一定)在编译时求值的表达式,而const则为了约束变量的访问控制,表示运行时不可以直接被修改,其往往可以在编译期和运行时进行初始化。
前面提到了constexpr是在编译阶段进行求值,那么也就是说在程序运行之前,就已经计算完成,这种无疑大大提升了程序的运行效率。因此提升运行效率就是C++11引入constexpr说明符的目的,也就是说能在编译阶段做的事情就绝不放在运行期做。
变量
代码如下:
example1.cc
int main() {
const int val = 1 + 2;
return 0;
}
上述代码汇编结果如下:
main:
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-4], 3
mov eax, 0
pop rbp
ret
从上述汇编结果可以看出,在编译阶段就将val赋值成3,也就是说在编译阶段完成了求值操作。
再看另外一个示例2:
example2.cc
int Add(const int a, const int b) {
return a + b;
}
int main() {
const int val = Add(1, 2);
return 0;
}
同样的,其汇编如下:
Add(int, int):
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-4], edi
mov DWORD PTR [rbp-8], esi
mov edx, DWORD PTR [rbp-4]
mov eax, DWORD PTR [rbp-8]
add eax, edx
pop rbp
ret
main:
push rbp
mov rbp, rsp
sub rsp, 16
mov esi, 2
mov edi, 1
call Add(int, int)
mov DWORD PTR [rbp-4], eax
mov eax, 0
leave
ret
分析上述汇编,发现并没有在编译阶段进行求值,所以也就是说上述的求值过程将会延后至编译期进行。
好了,既然示例一(使用const)可以在编译期进行求值,而constexpr也可以在编译期求值,那么直接用constexpr替换示例一种的const是否可行?
example3.cc
int main() {
constexpr int val = 1 + 2;
return 0;
}
接着看下汇编代码:
main:
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-4], 3
mov eax, 0
pop rbp
ret
呃😓,与示例一完全一样。。。
在上面示例2中,通过汇编代码发现其是在运行期求值,那么有没有办法在编译期求值呢?那就是使用constexpr表达式:
example4.cc
constexpr int Add(const int a, const int b) {
return a + b;
}
int main() {
const int val = Add(1, 2);
return 0;
}
汇编如下:
main:
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-4], 3
mov eax, 0
pop rbp
ret
有没有发现很眼熟,对,跟示例1和示例3的结果一样,该代码较示例2的唯一区别是多了个constexpr说明符,但将求值时期从运行期放到了编译期,可想而知,效率提升那是杠杠的。。。😁
函数
constexpr也可以修饰普通函数或者成员函数,其实这块在上一节已经有提过,示例如下:
constexpr int Add(const int a, const int b) {
return a + b;
}
int main() {
const int val = Add(1, 2);
int val1 = 3;
int val2 = Add(val, val1);
return 0;
}
汇编如下:
Add(int, int):
push rbp
mov rbp, rsp
mov DWORD PTR [rbp-4], edi
mov DWORD PTR [rbp-8], esi
mov edx, DWORD PTR [rbp-4]
mov eax, DWORD PTR [rbp-8]
add eax, edx
pop rbp
ret
main:
push rbp
mov rbp, rsp
sub rsp, 16
mov DWORD PTR [rbp-4], 3
mov DWORD PTR [rbp-8], 3
mov eax, DWORD PTR [rbp-8]
mov esi, eax
mov edi, 3
call Add(int, int)
mov DWORD PTR [rbp-12], eax
mov eax, 0
leave
ret
从上述汇编代码可以看出,val的求值是在编译阶段,而val2的求值则是在运行阶段,这是因为其引入了一个非const变量val1。
通过本示例,可以看出,将函数声明为constexpr可以提示效率,让编译器来决定是在编译阶段还是运行阶段来进行求值,当然了,如果想了解在编译阶段求值的各种细节规则,请参考constexpr in cppreference。
if语句
如果您目前使用C++11进行编码,那么需要仔细阅读本节,这样可以为将来的版本升级打好基础;如果您正在使用C++17进行编码,那么更得阅读本节,相信读完本节后,会有一个不一样的认识😁。
自C++17起,引入了if constexpr语句,在本节中,将借助SFINAE 和 std::enable_if来实现一个简单的Square功能,最后借助if constexpr对代码进行优化(如果对SFINAE 和 std::enable_if不是很了解的,建议自行阅读哈)。
如果有个需求,实现一个Add函数,其既支持算术类型又支持用户自定义类型:
template
struct Number {
Number(const T& _val) :
value(_val) {}
T value;
};
template
T Square(const T& t) {
return t + t;
}
int main() {
int i = 5;
float f = 5.0;
bool b = true;
Number n(5);
auto res = Square(i); // 调用int Add(int);
auto res2 = Square(f); // 调用 float Add(float);
auto res3 = Square(b); // call bool Square(bool);
auto res4 = Square(n); //编译失败,因为Number<>没有提供operator*操作
}
上述代码编译出错,因为Number<>没有提供operator*操作,所以这个时候第一个想法是修改Square函数,如下:
template
T Square(const T& t) {
if (std::is_arithmetic::value) {
return t * t;
} else {
return t.value * t.value;
}
}
在上述代码中,如果T是算数类型,则直接进行*操作,否则取其value进行*操作。
将上述代码进行编译,报错如下:
example5.cc: In instantiation of ‘T Square(const T&) [with T = int]’:
example5.cc:26:20: required from here
example5.cc:16:18: error: request for member ‘value’ in ‘t’, which is of non-class type ‘const int’
16 | return t.value * t.value;
| ~~^~~~~
example5.cc:16:28: error: request for member ‘value’ in ‘t’, which is of non-class type ‘const int’
16 | return t.value * t.value;
| ~~^~~~~
....
以Square(i)为例,这是因为在编译的时候,会尝试int.value操作,显然int.value不存在,这就导致了上述的错误输出,为了更为清楚的显示本错误,将Square()修改如下:
int Square(const int& t) {
if (true) {
return t * t;
} else {
return t.value * t.value;
}
}
这样就能很清楚的知道为什么编译失败了,因为在代码中存在t.value * t.value操作,而对于一个int来说并没有value这个变量,所以编译失败。
为了解决这个问题,我们尝试引入std::enable_if操作,如下:
template
typename std::enable_if::value, T>::type Square(const T& t) {
return t * t;
}
template
typename std::enable_if::value, T>::type Square(const T& t) {
return t.value * t.value;
}
现在有两个函数模板,如果是算术类型,则调用第一个,否则调用第二个,完整代码如下:
#include
template
typename std::enable_if::value, T>::type Square(const T& t) {
return t * t;
}
template
typename std::enable_if::value, T>::type Square(const T& t) {
return t.value * t.value;
}
template
struct Number {
Number(const T& _val) :
value(_val) {}
T value;
};
int main() {
int i = 5;
float f = 5.0;
bool b = true;
Number n(5);
auto res = Square(i); // 调用int Add(int);
auto res2 = Square(f); // 调用 float Add(float);
auto res3 = Square(b); // call bool Square(bool);
auto res4 = Square(n); // 成功
return 0;
}
上述代码编译成功。
在上述代码中,为了编译成功,我们引入了两个Square()模板函数借助std::enable_if来实现,代码上多少有点冗余,在这个时候,本节的主角if constexpr 出场,完整代码如下:
#include
template
T Square(const T& t) {
if constexpr (std::is_arithmetic::value) {
return t * t;
} else {
return t.value * t.value;
}
}
template
struct Number {
Number(const T& _val) :
value(_val) {}
T value;
};
int main() {
int i = 5;
float f = 5.0;
bool b = true;
Number n(5);
auto res = Square(i); // 调用int Add(int);
auto res2 = Square(f); // 调用 float Add(float);
auto res3 = Square(b); // call bool Square(bool);
auto res4 = Square(n); // 成功
return 0;
}
编译成功。
我们借助一个Square()函数模板以及更加符合编码习惯的if语句就能解决上面的问题,且比使用std::enable_if方式更为优雅和符合阅读习惯,进而提高代码的可阅读性。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341