介紹一個好用的語言工具—Corpus 。什麼是Corpus?,就字面上來翻譯,它的意思是語言資料庫。它有什麼用? 它可以用來查詢單字,但和字典不同之處在於,它不會列出該單字的解釋,而是列出該資料庫中所有用到該字的句子,並且統計該字在資料庫中出現的次數。

CORPUS OF CONTEMPORARY AMERICAN ENGLISH(COCA)的主畫面

以我常用的CORPUS OF CONTEMPORARY AMERICAN ENGLISH(COCA)為例,當查詢"thirdly" 時,它會搜尋資料庫中所有文章裡面有用到"thirdly"的句子,統計數量並且列出來,幫助我們了解該字如何正確使用。簡單的說,它有點像是一個巨大的例句資料庫,而它資料庫中資料來源?以COCA為例,全部都是從美國真實生活裡面新聞、報章雜誌、小說、論文等等實際的文體出來,所以比一般字典裡面例句更貼近生活。


當然,Corpus沒辦法完全取代字典裡的例句,最大問題在於它無法辨識單字的意義,在查詢一字多義的單字時,它會把所有意義的用法都列出來,而不是精準的列出我們想查詢的意思。以"check"為例,這字有很多意思,像是"檢查"、"停止"、"支票"、"將軍"等等,當我想要查詢它當"支票"時的例句,就沒辦法做很精準的查詢,無形之中降低了它的實用度。但即使如此,Corpus依舊是一個很強大的語言工具。例句資料庫只是它眾多功能中,我比較常用的一個。有興趣的人可以上ONLINE CORPORA查詢,這邊列有它更多的用途。

更多的Online Corpus:
ONLINE CORPORA

圖片說明:
為什麼第一張圖會是林克?這和corpus有什麼關係?
corpus有很多意思,但都和語言相關,和林克相關的?當然沒有。所以到底是怎麼回事?
原來,在美國德州有個城市叫Corpus Christi,當我用Google圖片搜尋時,搜到了和這個城市相關的圖片…等等,就算是這個地方,那和林克也沒關係阿!林克又不住這,他住在薩爾達傳說裡(沒有誤)!所以到底是怎麼回事呢?原來在某論壇裡,有人的頭像用了這張圖,然後他在Location填了Corpus Christi,所以才會造成Google圖片搜尋時的誤判。這樣看來Google圖片搜尋也是會出錯的。題外話,有人知道這是從哪一代薩爾達裡面出來的圖嗎?怎麼看起來這麼黑暗,而且服裝顏色也與傳統的綠色大不相同。

silentlain 發表在 痞客邦 PIXNET 留言(0) 人氣()