與表類似,了解Lua如何實現字符串可以讓你更高效地使用它。
Lua實現字符串的方式與多數其他腳本語言所采用的兩種主要方式都不相同。首先,Lua中的所有字符串都是內部化[1]的,這意味著Lua維護著任何字符串的一個單一拷貝。當一個新字符串出現時,Lua檢查是否有現成的拷貝,如果有的話,重用之。內部化使得諸如字符串對比和索引表之類的操作非常快速,但是會降低創建字符串的速度。
第二,Lua中的變量從不存儲字符串,只是引用它們。這種實現方式可以加快很多字符串操作,例如在Perl中,當你寫類似于$x=$y的代碼、$y是一個字符串時,賦值操作會將字符串的內容從$y的緩沖區復制到$x的緩沖區。如果這個字符串很長,這個操作的開銷就很大。而在Lua中,這個賦值僅僅是一次指針的復制。
然而,這種引用實現會降低特定方式的字符串連接的速度。在Perl中,操作$s = $s . "x"和$s .= "x"區別非常大,對于前者,你獲得了$s的一個拷貝,并且追加"x"到它的尾部;而對于后者,"x"只是簡單地被追加到$s所維護的內部緩沖區的尾部。因此,后者無關于字符串的長度(假設緩沖區足夠放下追加的文本)。如果把這兩句代碼放進循環里,它們的區別就是線性和二次算法的區別。例如,下述循環需要大約五分鐘來讀取一個5MB的文件:
復制代碼 代碼如下:
$x = "";
while (>)
{
$x = $x . $_;
}
如果我們把
復制代碼 代碼如下:
$x = $x . $_
改為
復制代碼 代碼如下:
$x .= $_
耗時將會降低為0.1秒!
Lua沒有提供第二種,也就是更快速的方式,因為它的變量沒有內部緩沖區。因此,我們需要一個顯式的緩沖區:一個包含字符串片段的表來完成這項工作。下面的循環讀取相同的5MB的文件,需要0.28秒,雖然沒有Perl那么快,也還算不錯:
復制代碼 代碼如下:
local t = {}
for line in io.lines() do
t[#t + 1] = line
end
s = table.concat(t, "\n")
[1] 內部化,原文internalize
您可能感興趣的文章:- Lua性能優化技巧(一):前言
- Lua性能優化技巧(二):基本事實
- Lua性能優化技巧(三):關于表
- Lua性能優化技巧(五):削減、重用和回收
- Lua性能優化技巧(六):最后的提示