卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章35332本站已运行395

正则表达式的运行时优化

正则表达式的运行时优化

php小编柚子为大家介绍正则表达式的运行时优化。正则表达式是一种用于字符串匹配和处理的强大工具,但在处理大规模数据时可能会导致性能问题。为了提高正则表达式的执行效率,我们可以采取一些优化策略,如使用惰性匹配、避免使用回溯、使用更精确的匹配模式等。这些优化技巧能够帮助我们在实际开发中更高效地使用正则表达式,提升程序性能。

问题内容

大多数正则表达式在其生命周期中都是“恒定的”。使用全局正则表达式来加速执行是个好主意吗?例如:

func work() {
    r := regexp.mustcompile(`...`)
    if r.matchstring(...) {
        ...
    }
}

比较:

var r *regexp.Regexp

func work() {
    if r.MatchString(...) {
        ...
    }
}

func init() {
    r = regexp.MustCompile(`...`)
}

这两个版本有什么有意义的区别吗?

  1. 正则表达式编译的成本非常低,因此从 cpu 成本和垃圾收集角度来看,不值得使用全局正则表达式(假设 work() 被大量调用)
  2. 最好在适当的时候使用全局正则表达式。

以上哪项是正确的,或者答案不是简单的黑/白?

解决方法

如果您仅使用一次相同的正则表达式(例如“d+”)->,则不值得使用全局正则表达式。

如果你经常使用相同的正则表达式(例如“d+”)->,那么值得使用

func benchmark01(b *testing.b) {
    for i := 0; i < b.n; i++ {
        r := regexp.mustcompile(`d+`)
        r.matchstring("aaaaaaa123bbbbbbb")
    }
}

func benchmark02(b *testing.b) {
    r := regexp.mustcompile(`d+`)
    for i := 0; i < b.n; i++ {
        r.matchstring("aaaaaaa123bbbbbbb")
    }
}
Benchmark01
Benchmark01-4             886909              1361 ns/op
Benchmark02
Benchmark02-4            5368380               232.8 ns/op
卓越飞翔博客
上一篇: 如何修复 proxyconnect tcp: tls: 第一条记录看起来不像 TLS 握手
下一篇: 返回列表
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏