printf或者sprintf一定是任何一个C程序员最常见到的函数,与sprintf的作用相反,sscanf通常被用来解析并转换字符串,其格式定义灵活多变,可以实现很强大的字符串解析功能。
sscanf的原型很简单,定义如下: #include <stdio.h> str:待解析的字符串 format:字符串格式描述,其后是一序列数目不定的指针参数,存储解析后的数据
下面是一个简单的例子: int year, month, day; int converted = sscanf("20080808", "%04d%02d%02d", &year, &month, &day); printf("converted=%d, year=%d, month=%d, day=%d/n", converted, year, month, day); 输出结果: converted=3, year=2008, month=8, day=8
"%04d%02d%02d"是用来解析字符串的格式,%表示格式转换的开始,d表示转换为一个整数,04作为d的修饰,表示这是一个长度为4位的整数,不足4位时以0补齐。 例子返回结果等于3,表示有3个数据成功转换,转换成功数目同时取决于被解析的字符串以及其转换格式,如果我们把例子中的格式改为"%04d%02d",那么sscanf将只返回2,day的数值不会被sscanf更改。
这是一个浮点数转换的例子: double longitude, latitude; 输出结果: converted=2, longitude=113.123456789, latitude=31.123457 sscanf的格式字符串中,f表示这是一个浮点数,其修饰词l表示这是一个double的浮点数。
上面是两个关于sscanf基本的例子,下面我们来演示sscanf的高级用法: char str[32] = ""; 输出结果: str=123456 上面的格式中,[0-9]表示这是一个仅包含0-9这几个字符的字符串,前面使用数字31修饰词表示这个字符串缓冲区的最大长度(这也是sscanf最为人诟病的地方,很容易出现缓冲区溢出错误,实际上sscanf是可以避免出现缓冲区溢出的,只要在书写任何字符串解析的格式时,注意加上其缓冲区尺寸的限制)。
又一个例子: char str[32] = ""; 输出结果: str=123456abcdedf 在格式[]中增加了a-z的描述。
使用^的例子: char str[32] = ""; 输出结果: str=123456 在[]中增加^表示相反的意思,上面的[^a-z]表示一个不包含任何a-z之间的字符串。
使用*的例子: char str[32] = ""; 输出结果: ret=1, str=abcdedf 加上*修饰表示一个被忽略的数据,同时也不需要为它准备空间存放解析结果。如上面的例子中,我们就只使用了str一个参数存放%31[a-z]的解析结果,而sscanf也只返回1,表示只解析了一个数据。
掌握了[], ^, *如何使用后,我们会发现sscanf原来是一个如此强大的工具,很多我们原先认为必须使用正则表达式的地方,很可能使用sscanf就可以实现。
下面是format的一些参考资料:
转换类型: %d:整数,需要一个类型为int*的的参数存放转换结果 %i:整数,如果字符串以0x或者0X开头,则按16进制进行转换,如果以0开头,则按8进制进行转换,否则按10进制转换,需要一个类型为int*的的参数存放转换结果 %o:无符号的8进制数,需要一个类型为unsigned int*的参数存放转换结果 %u:无符号的整数,需要一个类型为unsigned int*的参数存放转换结果 %x:无符号的16进制数,需要一个类型为unsigned int*的参数存放转换结果 %X:等同于%x %f:浮点数,需要一个类型为float*的参数存放转换结果
%c:单个字符,需要一个类型为char*的参数存放转换结果 %s:以空格或者换行符结尾的字符串,需要一个类型为char*的参数存放转换结果 %[]:仅包含在[]中的字符的字符串,如[0-9]表示一个全部是数字的字符串,[a-z]表示一个全部为小写字母的字符串,需要一个类型为char*的参数存放转换结果 %[^]:与上面相反,[^之后,]之前的所有字符都作为字符串结束标志,如[^0-9]表示一个不包含任何0-9的字符串,需要一个类型为char*的参数存放转换结果
转换类型修饰符: *:忽略标志,如%*d表示忽略一个整数,%*s表示忽略一个字符串 h:short修饰符,如%hd表示这是一个short int的整数 l:long修饰符,如%ld表示这是一个long int的整数, %lf表示这是一个double的浮点数(%f表示一个float的浮点数) L: <GCC> long long修饰符,如%Ld表示这是一个64位字节的整数, %Lf表示这是一个long double的浮点数 I64: <VisualC++> __int64修饰符,如%I64d表示这是一个64位字节的整数 |
|
来自: astrotycoon > 《sscanf》