Perl中的文件讀寫(xiě)學(xué)習(xí)筆記

字號(hào):


    一、打開(kāi)、關(guān)閉文件
    語(yǔ)法為open (filevar, filename),其中filevar為文件句柄,或者說(shuō)是程序中用來(lái)代表某文件的代號(hào),filename為文件名,其路徑可為相對(duì)路徑,亦可為絕對(duì)路徑。
    代碼如下:
    open(FILE1,"file1");
    open(FILE1, "/u/jqpublic/file1");
    打開(kāi)文件時(shí)必須決定訪問(wèn)模式,在PERL中有三種訪問(wèn)模式:讀、寫(xiě)和添加。后兩種模式的區(qū)別在于寫(xiě)模式將原文件覆蓋,原有內(nèi)容丟失,形式為:open (outfile,">outfile");而添加模式則在原文件的末尾處繼續(xù)添加內(nèi)容,形式為:open(appendfile, ">>appendfile")。要注意的是:不能對(duì)文件同時(shí)進(jìn)行讀和寫(xiě)/添加操作。
    open的返回值用來(lái)確定打開(kāi)文件的操作是否成功,當(dāng)其成功時(shí)返回非零值,失敗時(shí)返回零,因此可以如下判斷:
    代碼如下:
    if (open(MYFILE, "myfile")) {
    # here's what to do if the file opened successfully
    }
    當(dāng)文件打開(kāi)失敗時(shí)結(jié)束程序:
    代碼如下:
    unless (open (MYFILE, "file1")) {
    die ("cannot open input file file1\n");
    }
    亦可用邏輯或操作符表示如下:
    代碼如下:
    open (MYFILE, "file1") || die ("Could not open file");
    當(dāng)文件操作完畢后,用close(MYFILE); 關(guān)閉文件。
    二、讀文件
    語(yǔ)句$line =<> ;從文件中讀取一行數(shù)據(jù)存儲(chǔ)到簡(jiǎn)單變量$line中并把文件指針向后移動(dòng)一行。為標(biāo)準(zhǔn)輸入文件,通常為鍵盤(pán)輸入,不需要打開(kāi)。語(yǔ)句@array = <>;把文件的全部?jī)?nèi)容讀入數(shù)組@array,文件的每一行(含回車(chē)符)為@array的一個(gè)元素。
    三、寫(xiě)文件
    形式為:
    代碼如下:
    open(OUTFILE, ">outfile");
    print OUTFILE ("Here is an output line.\n");
    注:STDOUT、STDERR為標(biāo)準(zhǔn)輸出和標(biāo)準(zhǔn)錯(cuò)誤文件,通常為屏幕,且不需要打開(kāi)。
    四、判斷文件狀態(tài)
    1、文件測(cè)試操作符
    語(yǔ)法為:-op expr,如:
    代碼如下:
    if (-e "/path/file1") {
    print STDERR ("File file1 exists.\n");
    }
    文件測(cè)試操作符
    操作符 描述
    -b 是否為塊設(shè)備
    -c 是否為字符設(shè)備
    -d 是否為目錄
    -e 是否存在
    -f 是否為普通文件
    -g 是否設(shè)置了setgid位
    -k 是否設(shè)置了sticky位
    -l 是否為符號(hào)鏈接
    -o 是否擁有該文件
    -p 是否為管道
    -r 是否可讀
    -s 是否非空
    -t 是否表示終端
    -u 是否設(shè)置了setuid位
    -w 是否可寫(xiě)
    -x 是否可執(zhí)行
    -z 是否為空文件
    -A 距上次訪問(wèn)多長(zhǎng)時(shí)間
    -B 是否為二進(jìn)制文件
    -C 距上次訪問(wèn)文件的inode多長(zhǎng)時(shí)間
    -M 距上次修改多長(zhǎng)時(shí)間
    -O 是否只為“真正的用戶”所擁有
    -R 是否只有“真正的用戶”可讀
    -S 是否為socket
    -T 是否為文本文件
    -W 是否只有"真正的用戶"可寫(xiě)
    -X 是否只有"真正的用戶"可執(zhí)行
    注:“真正的用戶”指登錄時(shí)指定的userid,與當(dāng)前進(jìn)程用戶ID相對(duì),命令suid可以改變有效用戶ID。例:
    代碼如下:
    unless (open(INFILE, "infile")) {
    die ("Input file infile cannot be opened.\n");
    }
    if (-e "outfile") {
    die ("Output file outfile already exists.\n");
    }
    unless (open(OUTFILE, ">outfile")) {
    die ("Output file outfile cannot be opened.\n");
    }
    等價(jià)于
    代碼如下:
    open(INFILE, "infile") && !(-e "outfile") &&
    open(OUTFILE, ">outfile") || die("Cannot open files\n");
    五、命令行參數(shù)的解釋
    象C一樣,PERL也有存儲(chǔ)命令行參數(shù)的數(shù)組@ARGV,可以用來(lái)分別處理各個(gè)命令行參數(shù);與C不同的是,$ARGV[0]是第一個(gè)參數(shù),而不是程序名本身。
    代碼如下:
    $var = $ARGV[0]; # 第一個(gè)參數(shù)
    $numargs = @ARGV; # 參數(shù)的個(gè)數(shù)
    Perl中,操作符實(shí)際上是對(duì)數(shù)組@ARGV的隱含的引用,其工作原理為:
    1、當(dāng)PERL解釋器第一次看到時(shí),打開(kāi)以$ARGV[0]為文件名的文件;
    2、執(zhí)行動(dòng)作shift(@ARGV); 即把數(shù)組@ARGV的元素向前移動(dòng)一個(gè),其元素?cái)?shù)量即減少了一個(gè)。
    3、操作符讀取在第一步打開(kāi)的文件中的所有行。
    4、讀完后,解釋器回到第一步重復(fù)。
    例:
    代碼如下:
    @ARGV = ("myfile1", "myfile2"); #實(shí)際上由命令行參數(shù)賦值
    while ($line = ) {
    print ($line);
    }
    將把文件myfile1和myfile2的內(nèi)容打印出來(lái)。
    函數(shù)的參數(shù)
    代碼如下:
    &abc("a","b")
    sub abc {
    $first=$_[0];
    $second=$_[1];
    ....
    }
    abc("a","b")
    abc函數(shù)中有a,b兩個(gè)參數(shù)
    $_[0]的值就是a
    $_[1]的值就是b
    可以這樣來(lái)加深理解
    代碼如下:
    &abc("a","b")
    sub abc {
    $first=$_[0];
    $second=$_[1];
    print $first.$second;
    }
    $_[0]表示函數(shù)的第一個(gè)參數(shù)
    $_[1]表示函數(shù)的第二個(gè)參數(shù)
    以此類推.......
    代碼如下:
    #!/usr/bin/perl
    $sum1 = my_sum1(1,2);
    $sum2 = my_sum2(1,2);
    print "sum1 = $sum1 sum2 = $sum2";
    sub my_sum1 {
    ($first,$second)=@_;
    return($first+$second);
    }
    sub my_sum2 {
    $first=$_[0];
    $second=$_[1];
    return($first+$second);
    }
    exit;
    ++++++++++++++++++
    Perl的表達(dá)是非常靈活的,以上兩個(gè)函數(shù)是等效的,還有其他寫(xiě)法,這里不多舉例了,執(zhí)行結(jié)果為:
    代碼如下:
    sum1 = 3 sum2 = 3
    第一種寫(xiě)法是比較常見(jiàn)的,第二種是簡(jiǎn)單直接的寫(xiě)法,你可以只接收你想要的參數(shù),它的好處是如果你接收了一萬(wàn)個(gè)參數(shù),你可以用$_[999]來(lái)接收第999 個(gè)參數(shù),而其他的就不用管。在PERL中,當(dāng)一個(gè)自定義函數(shù)接收參數(shù)時(shí),它都放在數(shù)組@_中,$_[0],$_[1]就是從該數(shù)組中去取參數(shù)。
    其實(shí)很簡(jiǎn)單,所有傳入perl過(guò)程的參數(shù)都是以@_身份傳入的。如果調(diào)用一個(gè)有兩個(gè)參數(shù)的函數(shù),它們?cè)诤瘮?shù)內(nèi)部可以作為@_數(shù)組的前兩個(gè)成員訪問(wèn):$_ [0]和$_[1]。因?yàn)锧_只是一個(gè)有著奇怪名字的普通數(shù)組,所以你可以像處理普通數(shù)組一樣隨意的處理它,知道了這一點(diǎn),其他的書(shū)寫(xiě)模式也就不奇怪了:
    比如:($first,$second)=@_; 就是將數(shù)組@_中的兩個(gè)元素分別付給$first,$second,由于@_是數(shù)組,所以將$first,$second用括號(hào)括起來(lái)表示列表環(huán)境。
    還有什么$first = shift; $second = shift; 將@_中的第一個(gè)元素付給$first,第二個(gè)元素付給$second。
    Perl 中的特殊變量 $&, $`,$' 用在模式匹配中
    $& 用來(lái)存放匹配中的值
    $` 用來(lái)存放匹配中之前所有字符
    $' 用來(lái)存放匹配中之后所有字符
    如:
    代碼如下:
    #!/usr/bin/perl -w
    if("Hello good there,neigbor hello" =~ /\S\w+,/){
    print "That actually matched '$&'. ";
    print $`." ";
    print $'." ";
    }
    執(zhí)行的結(jié)果為:
    代碼如下:
    That actually matched 'there,'.
    Hello good
    neigbor hello
    ---------------------------
    另外常用的變量@_
    @_ 是子程序的一個(gè)私有變量;如果有一個(gè)全局變量@_,它將在此子程序調(diào)用前存儲(chǔ)起來(lái),當(dāng)子程序調(diào)用完成后,其早期的值會(huì)被重新賦還給@_。這意味著當(dāng)將參數(shù)傳遞給子程序時(shí)不用擔(dān)心它會(huì)影響此程序中其它子程序的@_這個(gè)變量的值。嵌套的子程序調(diào)用時(shí),@_的值和上述類似。甚至此子程序遞歸調(diào)用時(shí),每一次調(diào)用將得到新的@_,因此子程序調(diào)用時(shí)將得到其自身的參數(shù)列表。
    除非調(diào)用的子程序前有&而后面沒(méi)有括號(hào)(或者沒(méi)有參數(shù)),此時(shí)@_從此調(diào)用者的上下文(context)得到。這通常不是個(gè)好主意,但有時(shí)很有用。
    六、打開(kāi)管道
    用程序的形式也可以象命令行一樣打開(kāi)和使用管道(ex:ls>tempfile)。如語(yǔ)句open (MYPIPE, "| cat >hello"); 打開(kāi)一個(gè)管道,發(fā)送到MYPIPE的輸出成為命令"cat >hello"的輸入。由于cat命令將顯示輸入文件的內(nèi)容,故該語(yǔ)句等價(jià)于open(MYPIPE, ">hello"); 用管道發(fā)送郵件如下:
    代碼如下:
    open (MESSAGE, "| mail dave");
    print MESSAGE ("Hi, Dave! Your Perl program sent this!\n");
    close (MESSAGE);