2020国产成人精品视频,性做久久久久久久久,亚洲国产成人久久综合一区,亚洲影院天堂中文av色

分享

tag與關(guān)鍵字

 grantbb 2005-07-15

這是jiangwei在我的webnote上的留言:

國內(nèi)并非沒有人研究tag技術(shù),以《Tags,無序,分類和家族相似》這篇文章為例,我用計算機自動提煉的tag如下:信息分類 檢索語言 分類檢索 Tag 維特根施坦 標(biāo)簽△ 關(guān)鍵字△ 邏輯△ 家族△ 本質(zhì) 實證主義△ ,覺得計算機提煉得如何?特別指出的是:信息分類是原文中沒有的詞語,這個tag是計算機自動抽象概括出來的主題。

這是我的回復(fù):

電腦提煉的只能算關(guān)鍵字或主題詞,不是tag。比如同樣是你提到的那篇文章,如果是人來給它設(shè)置tag,可能會是:tagsresearch, opinion, folksonomy, etc.

tag表現(xiàn)的是普通人的思維而不是機器的思維,它要求的不是精確,而是方便自己找到。

我之前也說過,“很多人習(xí)慣性地把tag理解成關(guān)鍵字,實際上tag不是關(guān)鍵字。”比如機器就沒有辦法提取一張照片的關(guān)鍵字,但人可以給它設(shè)定一個或多個tag。

zheng也談到過tag與關(guān)鍵字的問題:

標(biāo)簽和關(guān)鍵詞比起來,除了更近乎個人的知識體系之外,在功能上也強大的多。標(biāo)簽和目錄在功能上一致,而關(guān)鍵詞卻不同于目錄,因此也不同于標(biāo)簽。

但是在信息的索引找尋上,標(biāo)簽和關(guān)鍵詞卻有相通的地方。關(guān)鍵詞標(biāo)注內(nèi)容的主題,而標(biāo)簽則是在對內(nèi)容的個人理解上的私人標(biāo)注,未必針對的是主題,比如我可能關(guān)注的是時間,或者是內(nèi)容中某個和通篇主題無關(guān)的觀點。因此標(biāo)簽的設(shè)定要比關(guān)鍵詞自由的多,也要方便得多,就好像我把東西到處亂放,但我總能找到我需要的東西。因為那是我自己地盤的坐標(biāo)。標(biāo)簽就是自己關(guān)注/存儲內(nèi)容的坐標(biāo)。

比如中網(wǎng)的老板萬平國的辦公桌上總是亂七八糟,東西堆得像座山,但他總能找到他想找的東西,不管是一本書,還是一封信,因為他已經(jīng)在腦子里為那個東西貼上了標(biāo)簽,他知道那東西在哪兒。但別人把他的桌子收拾干凈以后,他卻發(fā)現(xiàn),很多東西找不到了。

zheng還認(rèn)為,“就算是有著悠久歷史的分類法下的信息,它所能展現(xiàn)的,遠(yuǎn)遠(yuǎn)落后于信息本身所產(chǎn)生的,因為它有著嚴(yán)重的時滯。”

人的思維常常是無序的,跳躍的,同時也是活躍的;但嚴(yán)格的分類法把這種無序的狀態(tài)進行規(guī)整化以后,同時也損失了這種無序所承載的信息量。關(guān)鍵字技術(shù)當(dāng)然是有用的,基于文章的語義分析未來可能產(chǎn)生大量有價值的應(yīng)用。但,人并不總是需要精確。就像你愛上了一個姑娘,并不是因為她完全符合你事先確定的那些規(guī)格,其中一定有很多不可言說的成分。

tag是人產(chǎn)生的,又是通過機器實現(xiàn)的,所以它天然地帶有人和機器的雙重性格。它無法替代關(guān)鍵字和主題詞,但同時,機械的關(guān)鍵字和主題詞也無法替代tag。

Update 1: 剛剛又在MSN上跟jiangwei聊了幾句,他在政府部門從事語義挖掘方面的工作。像很多人一樣,他或許也認(rèn)為tag這種民間分類的價值被高估了。不過我的看法是,語言學(xué)和圖書館學(xué)關(guān)注的中心是物,是無生命的文本,而民間分類關(guān)注的中心是人,tag是一種人類活動,而不完全是一種分類方法。

Update 2: xuer對tag與關(guān)鍵字的評論,是我見過的最形象的評論:

Tag與關(guān)鍵字之別不僅僅是人機之別,說到底還是人與人的主客觀念之別,都是人的東西,機器只是一種反映,無非:Tag是以主觀之,關(guān)鍵字是以客觀之;Tag是我的,關(guān)鍵字是別人的;Tag用“心”,關(guān)鍵字用“聰明”;Tag是樂,關(guān)鍵字是音;Tag是曲,關(guān)鍵字是詞;Tag是詩歌,關(guān)鍵字是文字;Tag是情緒的,關(guān)鍵字是理智的;Tag是自由的,關(guān)鍵字是必然的;Tag是可愛的,關(guān)鍵字是可信的; Tag是“燈”,關(guān)鍵字是“鏡子”……竊以為二者在幫助我們認(rèn)識自我和認(rèn)識世界時相輔相成,相得益彰,是不二的!

事實上,上次在讀ooof對Isaac的訪談中提到的google策略與語義網(wǎng)策略時已隱約有這方面的感受。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多