2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

AWK使用

 zm8208 2010-01-27

 

1 awk的調用可以定義變量,提供程序并且指定輸入文件。

2   Awk [ -F fs ] [ -v var=value …] ‘program’ [ --- ]\

    [ var=value … ] [ file(s) ]

Awk [ -F fs ] [ -v var=value …] –f programfile [ --- ]\

    [ var=value … ] [ file(s) ]

    A. 短程序直接在命令行上提供,長的程序以-f項指定。

B--是特殊選項,指出awk本身已沒有進一步的命令選項,任何接下來的選項都被你的程序使用。

    C -F 用來重新定義默認字段的分隔字符。分隔字符也可以使用內建變量FS指定。

        awk –F ‘\t’ ‘{…}’ files FS=”[\f\v]” files

D. –v選項必須放在命令行上直接給定的任何程序之前,它們會在程序啟動之前以及處理文件之前生效。

3 awk程序模型。

    A awk把輸入流看作一連串的記錄的集合,一行一條記錄,每條記錄再分為字段。

B.一個awk程序是一對以模式與大括號框起來的操作組合而成的。模式與操作可省略其中一個,如模式省略,則操作將被應用到每條輸入記錄。如果操作省略,則默認操作是打印匹配記錄到標準輸出上。

Pattern { action }

Pattern

        { action }

CBEGIN END BEGIN模式對應的操作只在-v選項完成后執(zhí)行一次,通常BEGIN放到各種操作之前,END模式對應的操作在所有數據已被處理完成后執(zhí)行,只執(zhí)行一次,END通常放到最后。

4 程序元素

    1) 兩個連續(xù)的字符串會自動連接到一起。

    2) 將數字轉換為字符串,通過數字連接空字符串便可:n=123, s = “” n

    3awk 功能強大的地方來自于它對正則表達式的支持。~ 匹配,!~ 不匹配。

        ABC ~ ^[A-Z]+$” 結果為真。

4)正則表達式常量可以用引號或斜杠來定界。注意轉義:\\\\Tex/\Tex/ 都匹配包含\Tex的字字符串表達式。

    5) 字符串轉換成數字。加個零到字符串就可,s = “123” n = 0 + s

        “+123ABC”轉成123, “ABC124”轉成0. “ABC” 轉成0.“”轉成0.

    (6)

5 內建變量

       FILENAME當前的輸入文件名

       FNR 當前的輸入文件記錄數。

       FS 字段分隔字符

       NF當前記錄的字段數

       NR在工作中的記錄數

       OFS輸出字段分隔字符

       ORS輸出記錄分隔字符

       RS 輸入記錄分隔字符(僅用gawk, mawk

 

6 字段

字段可以以特殊名稱$0, $1, $2, … $NFawk程序使用。$0引用當前的記錄。記錄分隔符不是記錄的一部分。

 

7 awk里的單行程序。

 

(1)       awk '{ C += length($0) + 1 ; W+= NF} {print NR, W, C }' 統計記錄數輸入的行數與總工的字節(jié)數。

(2)       awk '{print $2, log($2) }' test2.txt 打印第2欄的值與其對數值。

(3)       awk -v COLUMN=2 ' { sum += $COLUMN } {print sum} ' test2.txt報告第2欄的值,注意欄就是列的意思。

(4)       awk '/main/ { print FILENAME ":" FNR ":" $0}' * AWK查找字符。然后打印出文件名所在和行與當前記錄,也就是當前行內容。

(5)       awk 'BEGIN { FS = "#"; OFS = "&" } { $2 = $2 ;print }' test3.txt > test4.txt

開始時指定#為記錄中的字段分隔符,指定&為輸出記錄的字段分隔符。

8 語句

       1)連續(xù)執(zhí)行。

              多條語句寫在一行上用分號隔開,或是一個語句一行。

       2)條件執(zhí)行。

              if( expressino)

                     Statement

              else

                     Sssss

             

       (3) 重復執(zhí)行。

              A, while(express)

            statement

        B, do

                statemetnt

            while(expresss)

        C, for(exp1; exp2; exp3)

                statement

        D, for( key in arrary)

                statement

            用來反復處理數組里的元素。

        可以使用break, continue.

9 數組成員。

    引用元素時如果元素不存在則會建一個元素。測試是應這樣寫if( “sally” in telArry)而非if( telArry[“sally”] != “”);

 

10 用戶控制輸入

    getline

11 執(zhí)行外部程序

    有三種方式

(1)       getline語句通過管道外部程序通信。使用完管道后要用close()關閉。

(2)       輸出重定向與外部程序通訊。使用完文件后要用close()關閉。

(3)       system(command)。這個在system返回前會自動關閉所用的文件或管道。

12 用戶定義函數。

1)函數可以定義在程序頂層的任何位置:成對的模式/操作之前,之間,之后。慣例是放在后面。

2)調用時函數名與括號之間不能有空格。

3)標量為傳值,數組為傳引用,函數里可以更改數組中的值。

4)函數返回值不是零就是空字符串。

5)所有用在函數體內而在參數中沒有出現的變量都認為是全局的。調用時傳入的參數可以比定義的少,多余的參數視為局部變量。

13 字符串函數

(1)       子字符串提取

substr(string, start, len )   返回一個由stringstart字符開始,共len個字符長度的子字符串副本。字符位置從1開始編號, 參數超出范圍得到一個空串。

(2)       字符串長度

length( string )

(3)       字母大小寫轉換

tolower(string), toupper( string )

tolower(“aBcDeF123”), 返回”abcdef123”

(4)       字符串查找。

index( string, find ), string里查找find, 然后返回stringfind字符串的起始位置,如果找不到就返回0,注意字符位置從1開始。

                     index( tolower(string), tolower(find))可以在查找時忽略大小寫。

index只會找出第一個出現的字符串,要找最后一個的話沒有標準的函數,下面這段程序可以完成這個功能。

              function rindex( string, find,     k,  ns, nf )

        {

                     ns = length(string)

                     nf = length(find)

                     for( k = ns + 1-nf; k>=1; k--)

                            if( substr(string, k, nf) == find)

                     return k

       return 0

}

      

(5)       字符串匹配

match(string, regexp)string與正則表達式regexp匹配,如果匹配就返回匹配string的索引,不匹配就返回0.

       6 字符串替換

               sub( regexp, replacement, target)

               gsub(regexp, replacement, target)

       7 字符串分割。

              A awk 對當前記錄$0自動進行了分割,$1, $2,$3 $NF.

B 可以用函數來做上面的分割。split( string, array, regexp ) regexpstring切割為片段,并存在array里,如果將第三個參數省略則用FS當成分隔符。數組從1開始。

A split( $0, parts, “:”)以冒號分隔。

B split(string, chars, “”)分隔符沒有空格,就是把string分隔成單字節(jié)存放在chars數組中。

C split(“”, array ) 刪除array里的所有元素。

       8 字符串重建

              awk沒有提供標準的重建函數,但可以通過下面的程序實現。

function join(array, n, fs,     k, s )

{

#重新組合arrary元素為一字符串

#fs為分隔

       if( n >= 1 )

       {

              s = array[1]

for( k = 2; k<=n; k++)

       s = s fs array[k]

}

return (s)

}

14 數值函數

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多