`strings.EqualFold` 不首先进行长度比较是否有原因?
php小编苹果,今天我们来探讨一下`strings.EqualFold`函数为什么在比较字符串是否相等时不先进行长度比较的原因。在字符串比较中,我们经常会使用`strings.EqualFold`函数来忽略大小写进行比较。然而,有些人可能会好奇为什么这个函数不先进行长度比较呢?在接下来的文章中,我们将解答这个问题,并探讨这个设计的合理性。让我们一起来看看吧!
问题内容
比较不区分大小写的字符串的常见做法是首先显式检查长度:
if len(a) == len(b) && strings.EqualFold(a, b) { ... }
这似乎是一种解决方法,因为当前的实现仅在耗尽两个输入字符串中的任何一个时才进行长度检查。
是否有理由不首先进行长度检查,无论是性能方面还是其他方面?
解决方法
简短的回答是因为 Go 中 2 个字符串可能具有不同的长度,但在简单的 Unicode 大小写折叠下仍然相等(因此首先进行长度比较并不能确定大小写折叠相等性)。
更长的答案是:Go 在内存中将字符串存储为 UTF-8字节数,内置 len()
函数报告 UTF-8 编码的字节数。 UTF-8 是一种可变长度字符编码:它可能对单个 unicode 代码点使用不同数量的字节,因此匹配的大小写折叠代码点可能在 UTF-8 中使用不同数量的字节。
看一个例子来证明这一点:
s1, s2 := "\u017F", "\u0073"
fmt.Println(s1, s2)
fmt.Println(len(s1), len(s2), strings.EqualFold(s1, s2))
这将输出(在 Go Playground 上尝试):
ſ s
2 1 true
以上就是`strings.EqualFold` 不首先进行长度比较是否有原因?的详细内容,更多请关注编程网其它相关文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341