scanf,sscanf高級用法
最近遇到了解析配置的問題,用正規表達式感覺大題小做,使用sscanf因只會用基本用法,感覺功能不夠,上網搜了下,解析起來不費吹灰之力,代碼也很簡潔。
原帖出處不詳,網上到處是,我做了點修改
名稱:
sscanf() - 從一個字符串中讀進與指定格式相符的數據.
函數原型:
Int sscanf( string str, string fmt, mixed var1, mixed var2 ... );
int scanf( const char *format [,argument]... );
說明:
sscanf與scanf類似,都是用於輸入的,只是後者以屏幕(stdin)爲輸入源,前者以固定字符串爲輸入源。
其中的format可以是一個或多個{%[*] [width] [size]type | ' ' | '\t' | '\n' | 非%符號}
注:
1、 * 亦可用於格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中)
2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d。
3、width表示讀取寬度。
4、參數的size: 常用的有hh表示單字節size,h表示2字節 size,其他詳見man sscanf或msdn
5、type :這就很多了,就是%s,%d之類。
控制字符 說明
%c 一個單一的字符
%d 一個十進制整數
%i 一個整數
%e, %f, %g 一個浮點數
%o 一個八進制數
%s 一個字符串
%x 一個十六進制數
%p 一個指針
%n 一個等於讀取字符數量的整數
%u 一個無符號整數
%[] 一個字符集
%% 一個精度符
6、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值
支持集合操作:
%[a-z] 表示匹配a到z中任意字符,貪婪性(儘可能多的匹配)
%[aB'] 匹配a、B、'中一員,貪婪性
%[^a] 匹配非a的任意字符,貪婪性
還是用例子說話:
#include <stdio.h>
int main()
{
char buf[512] = {0};
unsigned char m[6] = {0};
int n = 0;
//1. 常見用法。
sscanf("123456 asdf", "%s", buf);
printf("%s\n", buf);
printf("123456 Expect! %%s\n\n");
//結果爲:123456
//2. 取指定長度的字符串。如在下例中,取最大長度爲4字節的字符串。
sscanf("123456 ", "%4s", buf);
printf("%s\n", buf);
printf("1234 Expect! %%4s\n\n");
//結果爲:1234
//3. 取到指定字符爲止的字符串。如在下例中,取遇到空格爲止字符串。
sscanf("123456 abcdedf", "%[^ ]", buf);
printf("%s\n", buf);
printf("123456 Expect! %%[^ ]\n\n");
//結果爲:123456
//4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。
sscanf("123456abcdedfBCDEFxyz", "%[1-9a-z]", buf);
printf("%s\n", buf);
printf("123456abcdedf Expect! %%[1-9a-z]\n\n");
//結果爲:123456abcdedf
//5. 取到指定字符集爲止的字符串。如在下例中,取遇到大寫字母爲止的字符串。
sscanf("123456 abcdedfBCDEFxyz", "%[^A-Z]", buf);
printf("%s\n", buf);
printf("123456 abcdedf Expect! %%[^A-Z]\n\n");
//結果爲:123456 abcdedf
//6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中
sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
printf("%s\n", buf);
printf("12DDWDFF Expect! %%*[^/]/%%[^@]\n\n");
//結果爲:12DDWDFF
//7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之後有一空格)
sscanf("hello, world", "%*s%s", buf);
printf("%s\n", buf);
printf("world Expect! %%*s%%s\n\n");
//結果爲:world
//8、給定一個字符串"ErrorLog20150522",獲取後面的日期
{
int iYear, iMonth, iDay;
sscanf("ErrorLog20150522", "%*8s%04d%02d%02d", &iYear, &iMonth, &iDay);
printf("%04d%02d%02d\n\n", iYear, iMonth, iDay);
}
//9、參數size的控制
// sscanf 返回輸入了幾個參數
n = sscanf("010203040506", "%hhx%hhx%hhx%hhx%hhx%hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
printf("hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
// 結果 n 爲 1, 因爲 hhx 把所有字符串作爲一個數字,後面的都沒有輸入
n = sscanf("010203040506", "%2hhx%2hhx%2hhx%2hhx%2hhx%2hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
printf("2hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
// 結果 n 爲 6, 加了2,之後限制每次hhx只匹配2個字符,所以每個都被輸入
n = sscanf("010203040506", "%02x%02x%02x%02x%02x%02x", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
printf(" 02x: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
// 0 是填充字符,2表示匹配2個字符,x表示一個十六進制數
// 注意:編譯有warning,有時結果是正確的(跟具體的編譯器、編譯選項、編譯環境有關),但x表示4個字節,大於被輸入對象的大小
// 這會導致相鄰的3個字節會被覆蓋!!這會導致分配在相鄰內存的變量被清0
//http://blog.csdn.net/rainharder/archive/2008/09/27/2989675.aspx裏面有個覆蓋的例子
return 0;
}
sscanf的功能很類似於正則表達式, 但卻沒有正則表達式強大,所以如果對於比較複雜的字符串處理,建議使用正則表達式.
個人認爲正則表達式略顯複雜,還是使用sscanf方便,搞不定再用正則表達式