問題詳情

45 擷取文獻中每一個詞彙,排除停用詞(stop word),依字典方式排列,記錄其在文獻中的位置,製作成的
索引檔稱之為何?
(A)簽名檔(signature file)
(B)二元樹(binary tree)
(C)聚集檔(cluster file)
(D)倒置檔(inverted file)

參考答案

答案:D
難度:計算中-1
書單:沒有書單,新增

用户評論

酷企鵝♪】評論

倒置檔是大型檢索服務資料庫所採用的基本檔案結構之一,和另一種檔案結構「線形檔(或稱「列印檔」)」(print file)常被相提並論。「線形檔」由資料庫製造商(如:ERIC)製作,以一本書或一篇文章來代表一筆記錄。依屬性排列,去除停字(如:and、of)後,記錄每一剩餘的字分別位於何欄位之第幾個字。線形檔如同沒有書後索引的書,檢索時必須逐一讀取記錄,速度慢。