
作者:楊老師,華清遠(yuǎn)見教育科技集團(tuán)講師。
在linux下的C程序編程中對文件的IO操作有標(biāo)準(zhǔn)IO和文件IO兩種操作類型。標(biāo)準(zhǔn)IO是帶緩沖的IO屬于庫函數(shù),文件IO是不帶緩沖的屬于系統(tǒng)調(diào)用。系統(tǒng)調(diào)用和庫函數(shù)之間的區(qū)別如下圖1-1
圖 1-1
一、 標(biāo)準(zhǔn)IO
標(biāo)準(zhǔn)IO的緩沖類型分為:全緩沖、行緩沖、不緩沖三種類型。
在標(biāo)準(zhǔn)IO中對文件操作默認(rèn)是全緩沖的,對于磁盤文件的緩沖區(qū)是由標(biāo)準(zhǔn)IO庫中的函數(shù)通過malloc來獲得的。
在標(biāo)準(zhǔn)IO中與終端相關(guān)的通常是行緩沖,但是如果標(biāo)準(zhǔn)輸入、標(biāo)準(zhǔn)輸出不涉及交互時(shí)也可以設(shè)成全緩沖。
標(biāo)準(zhǔn)出錯(cuò)是不帶緩沖的,這樣就可以將出錯(cuò)信息實(shí)時(shí)的顯示出來。
這三種緩沖類型可以通過void setbuf(FILE * f p, char * b u f) 和int setvbuf(FILE * f p, char * b u f, int m o d e, size_t s i z e) 這兩個(gè)函數(shù)進(jìn)行修改。比如,在linux下標(biāo)準(zhǔn)輸出的行緩沖的大小默認(rèn)設(shè)置為1024個(gè)字節(jié),如果你想把它擴(kuò)大2048個(gè)字節(jié),那么就可在應(yīng)用程序中調(diào)用setbuf函數(shù)來設(shè)置。設(shè)置后再向終端進(jìn)行輸出時(shí)如果不加其他刷新條件,那么直到輸出超過2048個(gè)字節(jié)時(shí)數(shù)據(jù)才會(huì)被刷新出來。 而setvbuf函數(shù)還可以明確的指定緩沖類型,比如_IOFBF(全緩沖)、_IOLBF(行緩沖)、_IONBF(無緩沖)。
標(biāo)準(zhǔn)IO中的freopen函數(shù)是用來將一個(gè)流進(jìn)行重新定向的。如果該流之前已經(jīng)被重新定向,那么freopen函數(shù)將會(huì)清除之前的定向并且使用本次定向。通常用來將一個(gè)文件打開為stdin、stdout、stderr三個(gè)流。
fdopen函數(shù)是用來將一個(gè)已經(jīng)打開的文件描述和一個(gè)流進(jìn)行關(guān)聯(lián)。因?yàn)楣艿篮蛃ocket套接字等描述符是不可以用標(biāo)準(zhǔn)IO的函數(shù)打開的,因此可以調(diào)用此函數(shù)進(jìn)行關(guān)聯(lián),然后就可以用標(biāo)準(zhǔn)IO的函數(shù)進(jìn)行操作了。
標(biāo)準(zhǔn)IO中g(shù)ets函數(shù)是用來從終端讀入字符串的,因?yàn)樗⒉粫?huì)檢測字符串的長度,因此如果緩沖的大小設(shè)置不合適會(huì)導(dǎo)致未知的錯(cuò)誤。gets函數(shù)從終端上讀到的字符串中后一個(gè)字符其實(shí)是‘\n’字符,然后gets函數(shù)又將‘\n’字符轉(zhuǎn)換成了‘\0’字符,所以gets函數(shù)會(huì)將后的換行符讀走。
相對于gets函數(shù)來說fgets函數(shù)是安全的因?yàn)樗鼤?huì)檢測讀入字符的長度。當(dāng)使用fgets函數(shù)從終端上讀入字符時(shí)有兩種情況:
第一種:如果終端上輸入的字符個(gè)數(shù)小于fgets函數(shù)指定的size-1個(gè),那么它也會(huì)將終端上‘\n’字符讀走并且在結(jié)尾添加上‘\0’字符。
第二種:如果終端上輸入的字符個(gè)數(shù)大于fgets函數(shù)指定的sisz-1個(gè),那么它就不會(huì)讀走終端上的‘\n’字符,而且末尾始終會(huì)添加‘\0’字符。
二、文件IO
文件IO是不帶緩沖,是因?yàn)槊總(gè)read和write都會(huì)調(diào)用內(nèi)核中的系統(tǒng)調(diào)用。當(dāng)使用文件IO的讀寫函數(shù)對文件進(jìn)行操作后,其實(shí)數(shù)據(jù)也并不會(huì)實(shí)時(shí)的寫入磁盤,只是放到了內(nèi)核緩沖區(qū)中,如果該緩沖區(qū)沒有寫滿,那么不會(huì)將該緩沖區(qū)放入到輸出隊(duì)列。只有緩沖區(qū)滿了或者內(nèi)核需要該緩沖區(qū),那么才將該緩沖區(qū)加入到輸出隊(duì)列中,等待其到達(dá)隊(duì)首時(shí)才可以進(jìn)行實(shí)際的IO操作。
在使用open函數(shù)打開文件時(shí),如果使用了O_SYNC標(biāo)志,那么當(dāng)調(diào)用的write函數(shù)在返回時(shí)就已經(jīng)將數(shù)據(jù)寫入到磁盤上了。而如果是調(diào)用sync()函數(shù),那么當(dāng)該函數(shù)返回時(shí)數(shù)據(jù)并沒有寫到磁盤上而僅僅是被放到了輸出隊(duì)列中。
文件IO中的定位函數(shù)lseek可以返回一個(gè)負(fù)的文件指針偏移,因?yàn)閷τ谀承┰O(shè)備文件允許負(fù)的偏移量。因此在對lseek函數(shù)進(jìn)行出錯(cuò)判斷時(shí),不可以用是否小于0,而應(yīng)該用是否等于-1。當(dāng)時(shí)用lseek函數(shù)生成一個(gè)空洞文件時(shí),其實(shí)文件的空洞部分是不占磁盤塊的。使用ls –ls命令查看兩個(gè)字節(jié)大小相同但是一個(gè)有空洞,一個(gè)沒有空洞的文件時(shí)會(huì)發(fā)現(xiàn),有空洞的文件所占的磁盤塊要少(空洞的大小要足夠大時(shí)才可以看到現(xiàn)象),如下圖1-2:
圖 1-2