第一題:連續(xù)正整數(shù)(10分) 題目描述: 輸入數(shù)據(jù):一個(gè)正整數(shù),以命令行參數(shù)的形式提供給程序。
第二題:重疊區(qū)間大?。?0分) 題目描述: 輸入數(shù)據(jù):
第三題:字符串替換(30分) 題目描述:請(qǐng)編寫程序,根據(jù)指定的對(duì)應(yīng)關(guān)系,把一個(gè)文本中的字符串替換成另外的字符串。 輸入數(shù)據(jù):程序讀入已被命名為text.txt和dict.txt的兩個(gè)輸入數(shù)據(jù)文本文件,text.txt為一個(gè)包含大量字符串(含中文)的文 本,以whitespace為分隔符;dict.txt為表示字符串(s1)與字符串(s2)的對(duì)應(yīng)關(guān)系的另一個(gè)文本(含中文),大約在1萬行左右,每行 兩個(gè)字符串(即s1和s2),用一個(gè)\t或空格分隔。dict.txt中各行的s1沒有排序,并有可能有重復(fù),這時(shí)以最后出現(xiàn)的那次s1所對(duì)應(yīng)的s2為 準(zhǔn)。text.txt和dict.txt中的每個(gè)字符串都可能包含除whitespace之外的任何字符。text.txt中的字符串必須和 dict.txt中的某s1完全匹配才能被替換。(為便于調(diào)試,您可下載測(cè)試text.txt和dict.txt文件,實(shí)際運(yùn)行時(shí)我們會(huì)使用不同內(nèi)容的輸 入文件。) 輸出數(shù)據(jù):在標(biāo)準(zhǔn)輸出上打印text.txt被dict.txt替換后了的整個(gè)文本。 評(píng)分標(biāo)準(zhǔn):程序輸出結(jié)果必須正確,內(nèi)存使用越少越好,程序的執(zhí)行時(shí)間越快越好。 第四題:低頻詞過濾(40分) 題目描述:請(qǐng)編寫程序,從包含大量單詞的文本中刪除出現(xiàn)次數(shù)最少的單詞。如果有多個(gè)單詞都出現(xiàn)最少的次數(shù),則將這些單詞都刪除。 輸入數(shù)據(jù):程序讀入已被命名為corpus.txt的一個(gè)大數(shù)據(jù)量的文本文件,該文件包含英文單詞和中文單詞,詞與詞之間以一個(gè)或多個(gè)whitespace分隔。(為便于調(diào)試,您可下載測(cè)試corpus.txt文件,實(shí)際運(yùn)行時(shí)我們會(huì)使用不同內(nèi)容的輸入文件。) 輸出數(shù)據(jù):在標(biāo)準(zhǔn)輸出上打印刪除了corpus.txt中出現(xiàn)次數(shù)最少的單詞之后的文本(詞與詞保持原來的順序,仍以空格分隔)。 評(píng)分標(biāo)準(zhǔn):程序輸出結(jié)果必須正確,內(nèi)存使用越少越好,程序的執(zhí)行時(shí)間越快越好。 |
|