卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章35610本站已运行397

`strings.EqualFold` 不首先进行长度比较是否有原因?

`strings.equalfold` 不首先进行长度比较是否有原因?

php小编苹果,今天我们来探讨一下`strings.EqualFold`函数为什么在比较字符串是否相等时不先进行长度比较的原因。在字符串比较中,我们经常会使用`strings.EqualFold`函数来忽略大小写进行比较。然而,有些人可能会好奇为什么这个函数不先进行长度比较呢?在接下来的文章中,我们将解答这个问题,并探讨这个设计的合理性。让我们一起来看看吧!

问题内容

比较不区分大小写的字符串的常见做法是首先显式检查长度:

if len(a) == len(b) && strings.EqualFold(a, b) { ... }

这似乎是一种解决方法,因为当前的实现仅在耗尽两个输入字符串中的任何一个时才进行长度检查。

是否有理由不首先进行长度检查,无论是性能方面还是其他方面?

解决方法

简短的回答是因为 Go 中 2 个字符串可能具有不同的长度,但在简单的 Unicode 大小写折叠下仍然相等(因此首先进行长度比较并不能确定大小写折叠相等性)。

更长的答案是:Go 在内存中将字符串存储为 UTF-8字节数,内置 len() 函数报告 UTF-8 编码的字节数。 UTF-8 是一种可变长度字符编码:它可能对单个 unicode 代码点使用不同数量的字节,因此匹配的大小写折叠代码点可能在 UTF-8 中使用不同数量的字节。

看一个例子来证明这一点:

s1, s2 := "u017F", "u0073"
fmt.Println(s1, s2)

fmt.Println(len(s1), len(s2), strings.EqualFold(s1, s2))

这将输出(在 Go Playground 上尝试):

ſ s
2 1 true
卓越飞翔博客
上一篇: 如何捕获 jsonrpc 服务器的服务器端错误?
下一篇: 返回列表
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏