第三期 88年4月

【專題論述】


轉型中的大學圖書館-求知的美好新世界
 
二十一世紀電子出版品的發展趨勢
 
電子期刊在大學圖書館的利用與發展 
 
Metadata 在電子圖書館所扮演的角色
 
應用數位化文獻的問題探討-以期刊為例
 
電子化圖書館的管理-兼談香港科技大學圖書館
 
電子圖書館時代圖書館員的角色扮演
 
電子圖書館募款制度的可行性探討
 
 
【新知廣場】
網路資源搜尋引擎
 
【圖書館巡禮】
台灣大學圖書館-傳承、超越、邁向未來的知識殿堂 
 
 
【館務紀要】
國立成功大學圖書館八十七年大事記
 
國立成功大學圖書館八十七年回顧 
 
溫馨贈書情-記農學圖書公司贈書始末 
 
 

 
   

 

肆、Openfind (http://www.openfind.com)
  
Openfind 與其他搜尋引擎不同的是能夠讓使用者搜尋不同語文的資料,並具有相當程度的容錯能力。就 Openfind 發展者自我定位來看,Openfind 較 Yahoo 與 AltaVista 這兩個網路資源搜尋引擎不同的是,Yahoo 與 AltaVista 是以搜尋以羅馬語文為基礎的網路資源,在非羅馬文字語文的網路資源上,檢索能力並不突出,Openfind 則是突破這樣的限制,使得資料檢索達到所謂的全球性資源搜尋。以查詢國內「圖書館」網頁資料為例,在 AltaVista 中應以 “library” 為檢索字彙,並將網頁語文限定在「中文」來進行搜尋,無法直接以「圖書館」來檢索,相對的在 Openfind 中可以直接以「圖書館」查詢。除了資料檢索語文範圍的擴展外,Openfind 的檢索功能除精確比對外,還包括模糊比對的功能,也就是即使檢索字詞有所出入,檢索程式會儘可能找尋符合的資料 (圖 7)。

圖 7:Openfind 首頁

伍、Openfind 檢索功能特色
一、支援不同語言:
  
與字元比對不同,利用所謂的 Openindex 技巧,Openfind 可搜尋非字元基礎語文的資料,也因此提估了非羅馬文字的檢索。

二、模糊比對:
  
拼字向來在檢索的正確比對上是一大問題,在以往的比對技巧上首要條件是正確輸入檢索語彙,若輸入的資料與資料庫中現有索引資訊有所出入,檢索系統所回覆的檢索結果多是「查無此資料」,但在 Openfind 搜尋系統中的「模糊比對」功能突破這樣的限制,也就是系統會依照所輸入的字串檢索,儘可能的搜尋符合的資料 (圖 8)。

圖 8:容錯檢索,例如輸入 phothology,仍可找出 pathology 的資料

三、網頁與網址檢索
  
Openfind 結合 Yahoo 網站檢索與 AltaVista 網頁檢索模式!透過 Yahoo 檢索者可以找到與檢索主題相符合的網址,例如可找出與 Digital Library 有關的網頁;AltaVista 所提供的是就所輸入的字串檢索出可能的網頁。
  Openfind 的設計是先提供檢索者檢索符合資料的瀏覽,提供檢索結果文件內容符合地方的相關資料,以供查詢者判斷所獲得的資料是否符合所需,網站資訊之後提供網頁中包括所輸詞彙的網頁檢索結果。同時在資料輸出時可依網頁名稱或者網址排序 (圖 9、10)。

圖 9:Openfind 先整合列出與 digital library 相關的網站

圖 10:Openfind 在網站資料後列出其他符合檢索相關網頁

四、資料檢索
(一) 單一關鍵字
  
輸入單一字詞,系統會找出包括輸入字詞的網頁,如 metadata。
(二) 多重關鍵字
  
對單一字元的語文檢索,如英文、法文等,檢索時可輸入兩個以上的檢索語彙,系統將檢索出包含且字詞順序與所輸入的檢索字詞相同的網頁,如 Digital Library,可找出 “The Magazine of Digital Library Research”,也會找出 “International Digital Electronic Access Library”,或是 “Job Search from Library Journal Digital”。
(三) 布林邏輯運算
  利用布林邏輯運算「AND」(&)、「OR」(∣)「NOT」(!),使檢索結果更為精確或是包含各種可能的資料,例如要查詢「數位電子圖書館」如何運用 metadata 處理電子資源,可輸入這樣的檢索策略,metadata AND digital library。

  1. AND:查詢 Consortium for the Computer Interchange of Museum Information (CIMI) 這個單位利用 Dublin Core 的相關資料,可輸入這樣的檢索指令 (圖 11),
    dublin core and cimi
    Dublin core& cimi
  2. OR:查詢與數位圖書館,digital library 或電子圖書館,electronic library 相關的資料,可輸入這樣的檢索指令,
    Digital library or electronic library
    Digital library│electronic library
  3. AND NOT:想了解 CIMI 以外的單位如何運用 Dublin Core 的資料,
    Dublin core not cimi
    Dublin core! Cimi

圖 11:布林邏輯運算 AND

(四) 符號的運用

  1. 多重關鍵字計分查詢,逗號分割查詢法
      若想要放寬字詞順序限制,增加檢索回收,可輸入數個關鍵字,各關鍵詞以逗號分隔,系統會就所輸入的關鍵字進行檢索,再依照文件中所包含的字詞數,給予權重分數,字詞間的相關位置不受到策略輸入的限制 (圖 12)。
      關鍵語句、布林邏輯運算語逗號三種不同檢索模式在利用上是可彼此互換的,運用上可考慮檢索結果範圍,以不同方式放寬或緊縮檢索條件。例如 “digital library” 所要查詢的是名稱或網頁內容包括 “digital library” 這個字串的資料;“digital and library” 則是搜尋包括這兩個關鍵字的資料,期間的順序可不予已考慮;“digital, library” 則是以兩者其一即可的概念來搜尋網路資源。(表 1)
  2. 加減號的運用
      利用加減符號的運用,搜尋或剔除刀括輸入字詞的網頁。例如要查詢有關都柏林大學 (University College Dublin) 或都柏林 (City Dublin) 這個城市的資料,若單純輸入 “Dublin” 系統除了回覆 “Dublin” 的資料外,也會搜尋出 “Dublin Core” 的資料。若要剔除有關於 “Dublin Core” 的網頁資料,可以輸入 “+Dublin, -dublin core” 這樣的檢索策略,系統會考慮保留有關 “dublin” 的資料,但刪除 “Dublin Core” 的資料 (圖 13)

圖 12:逗號檢索的運用,digital, library

策略
digital library digital and library digital, library
結果
網站網頁數
740(5)
740(5)
4,993(5)
相關網頁
2,793
7,960
518,274
網站結果
786
808
51,353

表 1:以三種不同檢索策略查詢 digital library 相關資料的檢索結果

圖 13:利用減號提高檢索結果的精確率

(五) 自然語彙檢索 (natural language)
  以口語化方式輸入檢索問題,系統依照所輸入的資料擷取關鍵字查詢可能符合的網頁資料,但系統所回覆的結果,可能因分析上的誤差而產生與預期相差甚遠的檢索結果。例如以「網際網路對圖書館的影響」為檢索語彙,系統回應 4707 篇的檢索結果,但其中不少語所希望檢索到的資料符合程度偏低,例如「西方思潮對近代中國圖書館事業的影響」、「名人談網:愛心與網路」。另一個值得注意的是,Openfind 目前在檢索上還未能辨識「剔除字」在「自然語彙」檢索中可能的意義,例如 “To Be Or Not To Be” 若單獨檢索,或者是與其他詞語組合時是不具有太多的意義,但是當其視為一個語句時,在檢索上是有不同涵義的。雖說在檢索上「自然語彙」檢索還有相當大的成長空間,但在各個搜尋引擎設計,與對格式化檢索方式不熟悉的使用者來說,以「口語化」方式檢索,Openfind 確也提供了另一個資料檢索的思考方式

1.2.3