考察C程序員是否合格的一個(gè)重要標(biāo)準(zhǔn)就是看他操作字符串的能力,一個(gè)合格的C程序員應(yīng)該可以熟練的對(duì)字符串進(jìn)行拆分、組合、格式轉(zhuǎn)換以及搜索定位,從一堆數(shù)據(jù)中提取出有效信息。
比如說我們要做一個(gè)GPS導(dǎo)航的項(xiàng)目,需要讀取GPS模塊以ASCII碼的形式發(fā)送過來的數(shù)據(jù),然后對(duì)這些數(shù)據(jù)進(jìn)行處理,提取我們需要的信息。這就涉及到很多操作字符串的問題。下面就以此為例,利用strstr函數(shù)和sscanf函數(shù)解析GPS數(shù)據(jù)。
GPS輸出的數(shù)據(jù)格式如下:
$GPGGA,121252.000,3937.3032,N,11611.6046,E,1,05,2.0,45.9,M,-5.7,M,,0000*77
$GPRMC,121252.000,A,3958.3032,N,11629.6046,E,15.15,359.95,070306,,,A*54
$GPVTG,359.95,T,,M,15.15,N,28.0,K,A*04
$GPGGA,121253.000,3937.3090,N,11611.6057,E,1,06,1.2,44.6,M,-5.7,M,,0000*72
$GPGSA,A,3,14,15,05,22,18,26,,,,,,,2.1,1.2,1.7*3D
$GPGSV,3,1,10,18,84,067,23,09,67,067,27,22,49,312,28,15,47,231,30*70
$GPGSV,3,2,10,21,32,199,23,14,25,272,24,05,21,140,32,26,14,070,20*7E
$GPGSV,3,3,10,29,07,074,,30,07,163,28*7D
可以看到,GPS模塊發(fā)送過來的原始數(shù)據(jù)有很多,但是通常我們只需要其中的一部分信息就夠用了,比如對(duì)于導(dǎo)航的功能,我們只需要以$GPRMC開頭,以換行符結(jié)束的一行信息就夠了。即:
$GPRMC,121252.000,A,3958.3032,N,11629.6046,E,15.15,359.95,070306,,,A*54
因此我們需要做的就是從讀取的數(shù)據(jù)中截取以$GPRMC開頭的一行信息,然后從中解析出經(jīng)緯度、日期時(shí)間等有效信息即可。
假設(shè)從串口讀取的數(shù)據(jù)存放在一個(gè)字符串指針char *raw_buf指向的內(nèi)存單元里,首先我們通過ANSI C提供的strstr()函數(shù)找到以$GPRMC開頭以換行符’\n’結(jié)束的字符串:
/* find "$GPRMC" from raw_buf */
if ((wellhandled_string = strstr(raw_buf, “$GPRMC”)) != NULL)
{
for (i=0; i<strlen(wellhandled_string); i++)
{
if (wellhandled_string[i] == '\n')
{
wellhandled_string[i] = '\0'; //replace ‘\n’ with null
}
}
}
strstr()函數(shù)的原型是這樣聲明的:
char *strstr(const char *haystack, const char *needle);
strstr()函數(shù)可以在字符串haystack中搜索字符串needle第一次出現(xiàn)的位置,并且返回指向字符串needle首地址的指針,如果沒有搜索到則返回NULL。因此上面的代碼為我們?cè)谧x取的原始數(shù)據(jù)raw_buf里搜索$GPRMC第一次出現(xiàn)的位置,并將返回的指針賦給wellhandled_string,這樣如果搜索成功,則wellhandled_string就會(huì)指向以$GPRMC開始的字符串,接下來通過一個(gè)for循環(huán)找到換行符’\n’,將其替換為’\0’,即字符串結(jié)束符。這樣就得到了一個(gè)指向有效數(shù)據(jù)的字符串指針wellhandled_string。
然后要做的工作就是從wellhandled_string中提取出經(jīng)緯度、日期時(shí)間等信息。這個(gè)工作就可以交給強(qiáng)大的sscanf函數(shù)來實(shí)現(xiàn)。sscanf函數(shù)的原型如下:
int sscanf(const char *str, const char *format, ...);
我們都比較熟悉scanf這個(gè)函數(shù),scanf可以從標(biāo)準(zhǔn)輸入流讀取與指定格式相符的數(shù)據(jù)。sscanf則是從const char *str中讀取。它的強(qiáng)大之處在于可以方便地從字符串中取出整數(shù)、浮點(diǎn)數(shù)和字符串等各種類型的數(shù)據(jù),而且它還具有類似于正則表達(dá)式的匹配功能,sscanf默認(rèn)是以空格分隔字符串的,如果不是以空格來分割的話,就可以使用%[ ]來指定分割的條件。如%[a-z]表示讀取a到z的所有字符,%[^a-z]表示過濾a-z之間的所有字符,即只要遇到a到z之間的任意字符,轉(zhuǎn)換立刻停止。比如:
sscanf(“abcdefABCDEF”, “%[^A-Z]”, str);
printf(“%s\n”, str);
result is: abcdef
%[^A-Z]這樣的匹配格式為我們?nèi)∮龅酱髮懽帜笧橹沟淖址@眠@種匹配方式,我們就可以靈活的操作字符串,得到我們想要的結(jié)果。
現(xiàn)在我們需要從下面的字符串中提取有效信息:
$GPRMC,121252.000,A,3958.3032,N,11629.6046,E,15.15,359.95,070306,,,A*54
GPRMC每個(gè)字段的含義如下:
$GPRMC,<1>,<2>,<3>,<4>,<5>,<6>,<7>,<8>,<9>,<10>,<11>,<12>*hh<CR><LF>
<1> UTC時(shí)間,hhmmss(時(shí)分秒)格式
<2> 定位狀態(tài),A=有效定位,V=無效定位
<3> 緯度ddmm.mmmm(度分)格式(前面的0也將被傳輸)
<4> 緯度半球N(北半球)或S(南半球)
<5> 經(jīng)度dddmm.mmmm(度分)格式(前面的0也將被傳輸)
<6> 經(jīng)度半球E(東經(jīng))或W(西經(jīng))
<7> 地面速率(000.0~999.9節(jié),前面的0也將被傳輸)
<8> 地面航向(000.0~359.9度,以真北為參考基準(zhǔn),前面的0也將被傳輸)
<9> UTC日期,ddmmyy(日月年)格式
<10> 磁偏角(000.0~180.0度,前面的0也將被傳輸)
<11> 磁偏角方向,E(東)或W(西)
<12> 模式指示(僅NMEA0183 3.00版本輸出,A=自主定位,D=差分,E=估算,N=數(shù)據(jù)無效)
我們提取1~9九條信息。用一個(gè)結(jié)構(gòu)體存放這些信息:
typedef struct gps_info
{
char utc_time[BUF_SIZE];
char status;
float latitude_value;
char latitude;
float longtitude_value;
char longtitude;
float speed;
float azimuth_angle;
char utc_data[BUF_SIZE];
}GPS_INFO;
因?yàn)槊恳粋(gè)字段之間都是以逗號(hào)間隔開的,所以我們可以利用%[^,]來分割字符串,這樣用sscanf函數(shù)就可以實(shí)現(xiàn)對(duì)有效信息的提。
sscanf(wellhandled_string,"$GPRMC,%[^,],%c,%f,%c,%f,%c,%f,%f,%[^,]",
rmc_info->utc_time,\
&(rmc_info->status),&(rmc_info->latitude_value),&(rmc_info->latitude),\
&(rmc_info->longtitude_value),&(rmc_info->longtitude),&(rmc_info->speed),\
&(rmc_info->azimuth_angle),\
rmc_info->utc_data );
這個(gè)函數(shù)執(zhí)行后,打印出的保存在struct gps_info結(jié)構(gòu)體里的信息如下所示:
utc_time: 024813.640
status: A
latitude: N latitude value: 3158.460693
longtitude: E longtitude value: 11848.374023
speed: 10.050000
azimuth_angle: 324.269989
utc_data: 150706
可見,利用好sscanf函數(shù),可以讓我們可以很高效的處理字符串。