与表类似,了解Lua如何实现字符串可以让你更⾼效地使⽤它。
Lua实现字符串的⽅式与多数其他脚本语⾔所采⽤的两种主要⽅式都不相同。⾸先,Lua中的所有字符串都是内部化[1]的,这意味着Lua维护着任何字符串的⼀个单⼀拷贝。当⼀个新字符串出现时,Lua检查是否有现成的拷贝,如果有的话,重⽤之。内部化使得诸如字符串对⽐和索引表之类的操作⾮常快速,但是会降低创建字符串的速度。
第⼆,Lua中的变量从不存储字符串,只是引⽤它们。这种实现⽅式可以加快很多字符串操作,例如在Perl中,当你写类似于$x=$y的代码、$y是⼀个字符串时,赋值操作会将字符串的内容从$y的缓冲区复制到$x的缓冲区。如果这个字符串很长,这个操作的开销就很⼤。⽽在Lua中,这个赋值仅仅是⼀次指针的复制。
然⽽,这种引⽤实现会降低特定⽅式的字符串连接的速度。在Perl中,操作$s = $s . \"x\"和$s .= \"x\"区别⾮常⼤,对于前者,你获得了$s的⼀个拷贝,并且追加\"x\"到它的尾部;⽽对于后者,\"x\"只是简单地被追加到$s所维护的内部缓冲区的尾部。因此,后者⽆关于字符串的长度(假设缓冲区⾜够放下追加的⽂本)。如果把这两句代码放进循环⾥,它们的区别就是线性和⼆次算法的区别。例如,下述循环需要⼤约五分钟来读取⼀个5MB的⽂件:复制代码 代码如下:$x = \"\";while (<>){
$x = $x . $_;}
如果我们把
复制代码 代码如下:$x = $x . $_改为
复制代码 代码如下:$x .= $_
耗时将会降低为0.1秒!
Lua没有提供第⼆种,也就是更快速的⽅式,因为它的变量没有内部缓冲区。因此,我们需要⼀个显式的缓冲区:⼀个包含字符串⽚段的表来完成这项⼯作。下⾯的循环读取相同的5MB的⽂件,需要0.28秒,虽然没有Perl那么快,也还算不错:复制代码 代码如下:local t = {}
for line in io.lines() do t[#t + 1] = lineend
s = table.concat(t, \"\\n\")[1] 内部化,原⽂internalize
因篇幅问题不能全部显示,请点此查看更多更全内容