lua string庫函數

copy:http://blog.csdn.net/cws1214/article/details/16963231

Lua 最強大的特性之一就是它的字符串處理能力,它支持字符格式化輸出,具有可擴展的模式匹配查找功能,以及一些實用的字符操作,例如查詢、截取、替換和刪除等字符串操作,這些字符串操作函數都封裝在一個名爲 string 的模塊裏。

Lua 裏的字符索引是從 1 開始,索引值也可以是負數,這種情況將被解釋成向後索引,從字符串末尾開始算起。

下面是 Lua 5.2 提供的字符串操作函數:

byte

函數 string.byte 把字符串裏的第 i 個字符轉爲 ASCII 編碼,默認是輸出第一個字符的編碼(只有一個參數的話),用法:

1
string.byte(s [, i [, j]])

例子:

1
print(string.byte("abc"))
1
print(string.byte("abc"2))

char

函數 string.char 是把一個 ASCII 編碼轉換爲對應的字符,用法:

1
string.char(asc1, ...)

例子:

1
print(string.char(97))
1
print(string.char(99100101))

dump

函數 string.dump 返回一個函數二進制形式的字符串,用法:

1
string.dump(function)

參數 function 是一個 Lua 函數:

1
2
3
4
functiontest()
    print("just a test")
end
print(string.dump(test))

函數 string.dump 實現了函數的序列化,函數可以很輕鬆的傳遞,並在其他作用域調用。函數 string.dump 出來的二進制字符串,可以用 load 函數反序列回來直接調用。

1
2
3
4
5
6
7
8
functiontest()
    print("just a test")
end
localsd = string.dump(test)
print(sd)
localls = load(sd)
print(ls)
ls()

find

函數 string.find 查找字符串 s 裏第一個符合查找字符 pattern 的位置,用法:

1
string.find(s, pattern [, init [, plain]])

如果找到了目標字符 pattern,則返回它的開始和結束位置:

1
2
start, endstring.find("just a test""st")
print(start, end)

如果沒有找到,則返回 nil:

1
print(string.find("just a test""dhq.me"))

format

函數 string.format 用於把字符串格式化輸出,用法:

1
string.format(formatstring, ···)

string.format 函數的第一個參數是用來指定字符串的格式,例如:

1
print(string.format("%s is %d""ten"10))

上面例子裏的 %s 表示字符串,%d 表示數字,它們是 Lua 的格式化輸出符號。

string.format 函數的用法跟 C 語言裏的 printf 函數類似,例如它可以像 printf 那樣輸出指定位數的數字:

1
2
Pi = 3.1415926
print(string.format("Pi is %.2f", Pi))

Lua 的字符格式化輸出符號列表:

1
2
3
4
5
6
7
8
9
10
11
12
.           所有字符
%a          字母
%c          控制符
%d          數字
%D          非數字
%l          小寫字母
%p          標點符號
%s          字符串
%u          大寫字母
%w          字母數字
%x          十六進制數
%z          用 0 表示的字符

gmatch

函數 string.gmatch 會返回一個迭代函數,尅通過該函數遍歷到一個字符串 s 中所有出現指定匹配模式 pattern 的地方,用法:

1
string.gmatch(s, pattern)

例如下面是找出字符串 s 裏的所有單詞:

1
2
3
4
s = "just a test"
for w in string.gmatch(s, "%a+"do
    print(w)
end

gsub

函數 string.gsub 用於全局字符串替換,字符串 s 裏滿足匹配模式 pattern 格式的字符都會被替換成 repl 參數的值,用法:

1
string.gsub(s, pattern, repl [, n])

例如:

1
print(string.gsub("just a test""st""*"))

匹配模式 pattern 可以是一個正則:

1
2
s = "num is 1234567890"
print(string.gsub(s, "%d""*"))

可在函數的最後加上一個可選參數 n,表示指定要替換的次數:

1
2
s = "sethook, setlocal, setmetatable, setupvalue, setuservalue"
print(string.gsub(s, "s%a+""S"2))

len

函數 string.len 用於返回字符串 s 的長度,用法:

1
string.len(s)

例子:

1
print(string.len("abcdefg"))

lower

函數 string.lower 用於把字符串 s 裏的字母轉爲小寫,用法:

1
string.lower(s)

例如:

1
print(string.lower("AbCdEfG"))

match

函數 string.match 用於查找字符串 s 裏第一個匹配對模式 pattern 的值,並返回匹配值,用法:

1
string.match(s, pattern [, init])

上面參數 init 是可選, 表示查找過程的起點, 默認從 1 開始:

1
print(string.match("just a test""test"))

參數 patter 可以是一個正則模式:

1
2
t = "today is 2003-5-31"
print(string.match(t, "%d+-%d+-%d+"))

如果 pattern 爲空,則返回整個字符串;如果沒匹配成功,則返回 nil。

1
print(string.match("abcdabcd""a"))

rep

函數 string.rep 返回一個由分隔符 sep 隔開的重複(repeat)n 次字符 s 的字符串,用法:

1
string.rep(s, n [, sep])

默認的分隔符 sep 是空字符。

1
print(string.rep("repeat"3))

reverse

函數 string.reverse 用於倒轉一個字符串 s 的排序,用法:

1
string.reverse(s)

例如:

1
print(string.reverse("reverse"))

sub

函數 string.sub 用於從字符串 s 裏截取一個從第 i 個字符到第 j 個字符間的子字符串,用法:

1
string.sub(s, i [, j])

例如:

1
print(string.sub("abcdefg"25))

參數 i 可以是負數,這種情況下,子串的位置從字符串 s 的最後開始算起:

1
print(string.sub("abcdefg", -4, -2))

參數 end 省略的話,則會返回從 i 到字符串末尾的子字符串:

1
print(string.sub("abcdefg"3))

upper

函數 string.upper 用於把字符串 s 裏的字母轉爲大寫,用法:

1
string.upper(s)

例如:

1
print(string.upper("AbCdEfG"))


==============================================
其他參考

字符串庫中的一些函數是非常簡單的:

string.len(s)          返回字符串s的長度;
string.rep(s, n)      返回重複n次字符串s的串;你使用string.rep("a", 2^20)可以創建一個1M bytes的字符串(比如,爲了測試需要);
string.lower(s)       將s中的大寫字母轉換成小寫(string.upper將小寫轉換成大寫)。如果你想不關心大小寫對一個數組進行排序的話,你可以這樣:
                             table.sort(a, function (a, b) return string.lower(a) < string.lower(b) end)
string.upper(s)       將s中的小寫字母轉換成大寫
                            string.upperstring.lower都依賴於本地環境變量。所以,如果你在  European Latin-1環境下,表達式:
                            string.upper("a??o")    --> "A??O"
string.sub(s,i,j)      函數截取字符串s的從第i個字符到第j個字符之間的串。Lua中,字符串的第一個字符索引從1開始。你也可以使用負索引,負索引從字符串的結尾向前計數:-1指向最後一個字符,-2指向倒數第二個,以此類推。所以, string.sub(s, 1, j)返回字符串s的長度爲j的前綴;string.sub(s, j, -1)返回從第j個字符開始的後綴。如果不提供第3個參數,默認爲-1,因此我們將最後一個調用寫爲string.sub(s, j);string.sub(s, 2, -2)返回去除第一個和最後一個字符後的子串。
s = "[in brackets]"
print(string.sub(s, 2, -2)) --> in brackets
記住:Lua中的字符串是恆定不變的。string.sub函數以及Lua中其他的字符串操作函數都不會改變字符串的值,而是返回一個新的字符串。一個常見的錯誤是:
string.sub(s, 2, -2)
認爲上面的這個函數會改變字符串s的值。如果你想修改一個字符串變量的值,你必須將變量賦給一個新的字符串:
s = string.sub(s, 2, -2)
string.char函數和string.byte函數用來將字符在字符和數字之間轉換。string.char獲取0個或多個整數,將每一個數字轉換成字符,然後返回一個所有這些字符連接起來的字符串。string.byte(s, i)將字符串s的第i個字符的轉換成整數;第二個參數是可選的,缺省情況下i=1。下面的例子中,我們假定字符用ASCII表示:

print(string.char(97)) --> a
i = 99; print(string.char(i, i+1, i+2)) --> cde
print(string.byte("abc")) --> 97
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99 

上面最後一行,我們使用負數索引訪問字符串的最後一個字符。

Lua提供了string.format()函數來生成具有特定格式的字符串, 函數的第一個參數是格式(formatstring), 之後是對應格式中每個代號的各種數據. 由於格式字符串的存在, 使得產生的長字符串可讀性大大提高了. 這個函數的格式很像C語言中的printf().函數string.format在用來對字符串進行格式化的時候,特別是字符串輸出,是功能強大的工具。這個函數有兩個參數,你完全可以照C語言的printf來使用這個函數。第一個參數爲格式化串:由指示符和控制格式的字符組成。指示符後的控制格式的字符可以爲:十進制'd';十六進制'x';八進制'o';浮點數'f';字符串's'。在指示符'%'和控制格式字符之間還可以有其他的選項:用來控制更詳細的格式,比如一個浮點數的小數的位數:

格式字符串可能包含以下的轉義碼:

%c - 接受一個數字, 並將其轉化爲ASCII碼錶中對應的字符
%d, %i - 接受一個數字並將其轉化爲有符號的整數格式
%o - 接受一個數字並將其轉化爲八進制數格式
%u - 接受一個數字並將其轉化爲無符號整數格式
%x - 接受一個數字並將其轉化爲十六進制數格式, 使用小寫字母
%X - 接受一個數字並將其轉化爲十六進制數格式, 使用大寫字母
%e - 接受一個數字並將其轉化爲科學記數法格式, 使用小寫字母e
%E - 接受一個數字並將其轉化爲科學記數法格式, 使用大寫字母E
%f - 接受一個數字並將其轉化爲浮點數格式
%g(%G) - 接受一個數字並將其轉化爲%e(%E, 對應%G)及%f中較短的一種格式
%q - 接受一個字符串並將其轉化爲可安全被Lua編譯器讀入的格式
%s - 接受一個字符串並按照給定的參數格式化該字符串

爲進一步細化格式, 可以在%號後添加參數. 參數將以如下的順序讀入:

(1) 符號: 一個+號表示其後的數字轉義符將讓正數顯示正號. 默認情況下只有負數顯示符號.
(2) 佔位符: 一個0, 在後面指定了字串寬度時佔位用. 不填時的默認佔位符是空格.
(3) 對齊標識: 在指定了字串寬度時, 默認爲右對齊, 增加-號可以改爲左對齊.
(4) 寬度數值
(5) 小數位數/字串裁切: 在寬度數值後增加的小數部分n, 若後接f(浮點數轉義符, 如%6.3f)則設定該浮點數的小數只保留n位, 若後接s(字符串轉義符, 如%5.3s)則設定該字符串只顯示前n位.

在這些參數的後面則是上述所列的轉義碼類型(c, d, i, f, ...).


print(string.format("pi = %.4f", PI))
      --> pi = 3.1416
d = 5; m = 11; y = 1990
print(string.format("%02d/%02d/%04d", d, m, y))
        --> 05/11/1990
tag, title = "h1", "a title"
print(string.format("<%s>%s</%s>", tag, title, tag))
        --> <h1>a title</h1>

第一個例子,%.4f代表小數點後面有4位小數的浮點數。第二個例子%02d代表以固定的兩位顯示十進制數,不足的前面補0。而%2d前面沒有指定0,不足兩位時會以空白補足。對於格式串部分指示符得詳細描述清參考lua手冊,或者參考C手冊,因爲Lua調用標準C的printf函數來實現最終的功能。

以下是一些例子:


string.format("%%c: %c", 83)            輸出S
string.format("%+d", 17.0)              輸出+17
string.format("%05d", 17)               輸出00017
string.format("%o", 17)                 輸出21
string.format("%u", 3.14)               輸出3
string.format("%x", 13)                 輸出d
string.format("%X", 13)                 輸出D
string.format("%e", 1000)               輸出1.000000e+03
string.format("%E", 1000)               輸出1.000000E+03
string.format("%6.3f", 13)              輸出13.000
string.format("%q", "One\nTwo")         輸出"One\
                                          Two"
string.format("%s", "monkey")           輸出monkey
string.format("%10s", "monkey")         輸出    monkey
string.format("%5.3s", "monkey")        輸出  mon

 

發佈了6 篇原創文章 · 獲贊 5 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章