lua string

字符串庫中的一些函數是非常簡單的:

string.len(s)          返回字符串s的長度;
string.rep(s, n)      返回重複n次字符串s的串;你使用string.rep("a", 2^20)可以創建一個1M bytes的字符串(比如,爲了測試需要);
string.lower(s)       將s中的大寫字母轉換成小寫(string.upper將小寫轉換成大寫)。如果你想不關心大小寫對一個數組進行排序的話,你可以這樣:
                             table.sort(a, function (a, b) return string.lower(a) < string.lower(b) end)
string.upper(s)       將s中的小寫字母轉換成大寫
                            string.upperstring.lower都依賴於本地環境變量。所以,如果你在 European Latin-1環境下,表達式:
                            string.upper("a??o")    --> "A??O"
string.sub(s,i,j)      函數截取字符串s的從第i個字符到第j個字符之間的串。Lua中,字符串的第一個字符索引從1開始。你也可以使用負索引,負索引從字符串的結尾向前計數:-1指向最後一個字符,-2指向倒數第二個,以此類推。所以, string.sub(s, 1, j)返回字符串s的長度爲j的前綴;string.sub(s, j, -1)返回從第j個字符開始的後綴。如果不提供第3個參數,默認爲-1,因此我們將最後一個調用寫爲string.sub(s, j);string.sub(s, 2, -2)返回去除第一個和最後一個字符後的子串。
s = "[in brackets]"
print(string.sub(s, 2, -2)) --> in brackets
記住:Lua中的字符串是恆定不變的。string.sub函數以及Lua中其他的字符串操作函數都不會改變字符串的值,而是返回一個新的字符串。一個常見的錯誤是:
string.sub(s, 2, -2)
認爲上面的這個函數會改變字符串s的值。如果你想修改一個字符串變量的值,你必須將變量賦給一個新的字符串:
s = string.sub(s, 2, -2)
string.char函數和string.byte函數用來將字符在字符和數字之間轉換。string.char獲取0個或多個整數,將每一個數字轉換成字符,然後返回一個所有這些字符連接起來的字符串。string.byte(s, i)將字符串s的第i個字符的轉換成整數;第二個參數是可選的,缺省情況下i=1。下面的例子中,我們假定字符用ASCII表示:

print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99 

上面最後一行,我們使用負數索引訪問字符串的最後一個字符。

Lua提供了string.format()函數來生成具有特定格式的字符串, 函數的第一個參數是格式(formatstring), 之後是對應格式中每個代號的各種數據. 由於格式字符串的存在, 使得產生的長字符串可讀性大大提高了. 這個函數的格式很像C語言中的printf().函數string.format在用來對字符串進行格式化的時候,特別是字符串輸出,是功能強大的工具。這個函數有兩個參數,你完全可以照C語言的printf來使用這個函數。第一個參數爲格式化串:由指示符和控制格式的字符組成。指示符後的控制格式的字符可以爲:十進制'd';十六進制'x';八進制'o';浮點數'f';字符串's'。在指示符'%'和控制格式字符之間還可以有其他的選項:用來控制更詳細的格式,比如一個浮點數的小數的位數:

格式字符串可能包含以下的轉義碼:

%c - 接受一個數字, 並將其轉化爲ASCII碼錶中對應的字符
%d, %i - 接受一個數字並將其轉化爲有符號的整數格式
%o - 接受一個數字並將其轉化爲八進制數格式
%u - 接受一個數字並將其轉化爲無符號整數格式
%x - 接受一個數字並將其轉化爲十六進制數格式, 使用小寫字母
%X - 接受一個數字並將其轉化爲十六進制數格式, 使用大寫字母
%e - 接受一個數字並將其轉化爲科學記數法格式, 使用小寫字母e
%E - 接受一個數字並將其轉化爲科學記數法格式, 使用大寫字母E
%f - 接受一個數字並將其轉化爲浮點數格式
%g(%G) - 接受一個數字並將其轉化爲%e(%E, 對應%G)及%f中較短的一種格式
%q - 接受一個字符串並將其轉化爲可安全被Lua編譯器讀入的格式
%s - 接受一個字符串並按照給定的參數格式化該字符串

爲進一步細化格式, 可以在%號後添加參數. 參數將以如下的順序讀入:

(1) 符號: 一個+號表示其後的數字轉義符將讓正數顯示正號. 默認情況下只有負數顯示符號.
(2) 佔位符: 一個0, 在後面指定了字串寬度時佔位用. 不填時的默認佔位符是空格.
(3) 對齊標識: 在指定了字串寬度時, 默認爲右對齊, 增加-號可以改爲左對齊.
(4) 寬度數值
(5) 小數位數/字串裁切: 在寬度數值後增加的小數部分n, 若後接f(浮點數轉義符, 如%6.3f)則設定該浮點數的小數只保留n位, 若後接s(字符串轉義符, 如%5.3s)則設定該字符串只顯示前n位.

在這些參數的後面則是上述所列的轉義碼類型(c, d, i, f, ...).


print(string.format("pi = %.4f", PI))
      --> pi = 3.1416
d = 5; m = 11; y = 1990
print(string.format("%02d/%02d/%04d", d, m, y))
        --> 05/11/1990
tag, title = "h1", "a title"
print(string.format("<%s>%s</%s>", tag, title, tag))
        --> <h1>a title</h1>

第一個例子,%.4f代表小數點後面有4位小數的浮點數。第二個例子%02d代表以固定的兩位顯示十進制數,不足的前面補0。而%2d前面沒有指定0,不足兩位時會以空白補足。對於格式串部分指示符得詳細描述清參考lua手冊,或者參考C手冊,因爲Lua調用標準C的printf函數來實現最終的功能。

以下是一些例子:


string.format("%%c: %c", 83)            輸出S
string.format("%+d", 17.0)              輸出+17
string.format("%05d", 17)               輸出00017
string.format("%o", 17)                 輸出21
string.format("%u", 3.14)               輸出3
string.format("%x", 13)                 輸出d
string.format("%X", 13)                 輸出D
string.format("%e", 1000)               輸出1.000000e+03
string.format("%E", 1000)               輸出1.000000E+03
string.format("%6.3f", 13)              輸出13.000
string.format("%q", "One\nTwo")         輸出"One\
                                          Two"
string.format("%s", "monkey")           輸出monkey
string.format("%10s", "monkey")         輸出    monkey
string.format("%5.3s", "monkey")        輸出  mon

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章