scanf,sscanf高級用法

scanf,sscanf高級用法

最近遇到了解析配置的問題,用正規表達式感覺大題小做,使用sscanf因只會用基本用法,感覺功能不夠,上網搜了下,解析起來不費吹灰之力,代碼也很簡潔。

原帖出處不詳,網上到處是,我做了點修改

名稱:
sscanf() - 從一個字符串中讀進與指定格式相符的數據.
 
函數原型:
Int  sscanf( string str, string fmt, mixed var1, mixed var2 ... );
int  scanf( const char *format [,argument]... );
 
說明:
sscanf與scanf類似,都是用於輸入的,只是後者以屏幕(stdin)爲輸入源,前者以固定字符串爲輸入源。
其中的format可以是一個或多個{%[*] [width] [size]type | ' ' | '\t' | '\n' | 非%符號}
 
注:
1、 * 亦可用於格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中)
 
2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d。
 
3、width表示讀取寬度。
 
4、參數的size: 常用的有hh表示單字節size,h表示2字節 size,其他詳見man sscanf或msdn
 
5、type :這就很多了,就是%s,%d之類。
 
控制字符 說明 
%c  一個單一的字符 
%d  一個十進制整數 
%i  一個整數 
%e, %f, %g 一個浮點數 
%o  一個八進制數 
%s  一個字符串 
%x  一個十六進制數 
%p  一個指針 
%n  一個等於讀取字符數量的整數 
%u  一個無符號整數 
%[]  一個字符集 
%%  一個精度符


6、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值
 
支持集合操作:

     %[a-z] 表示匹配a到z中任意字符,貪婪性(儘可能多的匹配)

     %[aB'] 匹配a、B、'中一員,貪婪性

     %[^a] 匹配非a的任意字符,貪婪性

還是用例子說話:

#include <stdio.h>
int main()
{
	char buf[512] = {0};
	unsigned char m[6] = {0};
	int n = 0;

	//1. 常見用法。
	sscanf("123456 asdf", "%s", buf);
	printf("%s\n", buf);
	printf("123456 Expect! %%s\n\n");
	//結果爲:123456

	//2. 取指定長度的字符串。如在下例中,取最大長度爲4字節的字符串。
	sscanf("123456 ", "%4s", buf);
	printf("%s\n", buf);
	printf("1234 Expect! %%4s\n\n");
	//結果爲:1234

	//3. 取到指定字符爲止的字符串。如在下例中,取遇到空格爲止字符串。
	sscanf("123456 abcdedf", "%[^ ]", buf);
	printf("%s\n", buf);
	printf("123456 Expect! %%[^ ]\n\n");
	//結果爲:123456

	//4.  取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。
	sscanf("123456abcdedfBCDEFxyz", "%[1-9a-z]", buf);
	printf("%s\n", buf);
	printf("123456abcdedf Expect! %%[1-9a-z]\n\n");
	//結果爲:123456abcdedf

	//5.  取到指定字符集爲止的字符串。如在下例中,取遇到大寫字母爲止的字符串。
	sscanf("123456 abcdedfBCDEFxyz", "%[^A-Z]", buf);
	printf("%s\n", buf);
	printf("123456 abcdedf Expect! %%[^A-Z]\n\n");
	//結果爲:123456 abcdedf

	//6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中
	sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf);
	printf("%s\n", buf);
	printf("12DDWDFF Expect! %%*[^/]/%%[^@]\n\n");
	//結果爲:12DDWDFF

	//7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之後有一空格)
	sscanf("hello, world",  "%*s%s",  buf);
	printf("%s\n", buf);
	printf("world Expect! %%*s%%s\n\n");
	//結果爲:world 

	//8、給定一個字符串"ErrorLog20150522",獲取後面的日期
	{
		int iYear, iMonth, iDay;
		sscanf("ErrorLog20150522", "%*8s%04d%02d%02d", &iYear, &iMonth, &iDay);
		printf("%04d%02d%02d\n\n", iYear, iMonth, iDay);
	}

	//9、參數size的控制
	// sscanf 返回輸入了幾個參數
	n = sscanf("010203040506", "%hhx%hhx%hhx%hhx%hhx%hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
	printf("hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
	// 結果 n 爲 1, 因爲 hhx 把所有字符串作爲一個數字,後面的都沒有輸入
	
	n = sscanf("010203040506", "%2hhx%2hhx%2hhx%2hhx%2hhx%2hhx", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
	printf("2hhx: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
	// 結果 n 爲 6, 加了2,之後限制每次hhx只匹配2個字符,所以每個都被輸入
	n = sscanf("010203040506", "%02x%02x%02x%02x%02x%02x", &m[0], &m[1], &m[2], &m[3], &m[4], &m[5]);
	printf(" 02x: %d :%02x%02x%02x%02x%02x%02x\n",n, m[0], m[1],m[2],m[3], m[4], m[5]);
	// 0 是填充字符,2表示匹配2個字符,x表示一個十六進制數
	// 注意:編譯有warning,有時結果是正確的(跟具體的編譯器、編譯選項、編譯環境有關),但x表示4個字節,大於被輸入對象的大小
	// 這會導致相鄰的3個字節會被覆蓋!!這會導致分配在相鄰內存的變量被清0
	//http://blog.csdn.net/rainharder/archive/2008/09/27/2989675.aspx裏面有個覆蓋的例子

	return 0;
}

sscanf的功能很類似於正則表達式, 但卻沒有正則表達式強大,所以如果對於比較複雜的字符串處理,建議使用正則表達式.

個人認爲正則表達式略顯複雜,還是使用sscanf方便,搞不定再用正則表達式

發佈了31 篇原創文章 · 獲贊 16 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章