陸、Yahoo (http://www.yahoo.com)
Yahoo 大概是國內網路使用者最早利用的國外網路資源搜尋引擎,以分類目錄的形式整理網路資源。與 AltaVista 相類似,Yahoo 同時提供一類表供檢索者以瀏覽的方式搜循各類下的網路資料,目前 Yahoo 提供 25,000 大、小類的資歷,同時為方便檢索者找到所需的網路資源,Yahoo 也提供關鍵字查詢功能,讓使用者直接由網頁資料中找尋所需要的資訊。Yahoo 與前面 AltaVista 及 Openfind 不同的是,Yahoo 資源資料庫的建立,除了程式的資料搜尋外,Yahoo 投資了相當的人力在資料選取與分類上。就資料上來說,以相同策略檢索結果量來看,Yahoo 索引的資料量較前兩者少,但就另一方面來看其符合精確程度可能較前兩者高,同時網站所提供的資料品質可能較為平整。另一個較不同的是 Yahoo 在檢索結果的安排上是分別以類別、網站及網頁為單元,各別顯現 (圖 14)。

圖 14:yahoo 網站首頁
利用 Yahoo 時,檢索者可就有興趣的主題,以點選方式瀏覽每一類下相關的資源,或者是利用搜尋功能檢索特定網頁、特定主題的相關網站。Yahoo 所提供的檢索功能可針對 Yahoo 完整資料庫進行搜尋,或者是只針對某一主題類別下進行搜尋。Yahoo 對檢索結果的處理方式是先將類表中符合的類別整理出來,查詢者可就類別,瀏覽各所屬網站;檢索者也可直接點選類別後的各個網站選項。Yahoo 就所檢索到的網頁,依其檢索詞彙出現的頻率、詞彙符合以及檢索詞彙出現所在,為每一網頁內容相關性評分,再將檢索結果依照相關性排序。
柒、Yahoo 檢索特色
一、檢索環境設定
為了能夠符合不同檢索需求,Yahoo 設計的一個檢索環境設定的功能,查詢者可依所想要檢索網路資源的範圍,如網頁、討論群,檢索比對方式、類別與網頁檢索、網頁架構時間,等做不同的設定。若只想要所搜尋到的網頁包括所有輸入的詞彙,可選擇 “matches on all words (AND)” 的比對方式 (search method);若僅想搜尋近一個月內所架設的網頁資料,可由有 7 個選項的時間表中選取適當的時間範圍 (圖 15)。

圖 15:檢索環境設定
二、「單一關鍵字」與「關鍵語句」
除了可就設定選項處理各輸入關鍵字外,必要時可利用雙引號 “ ” ,進行關鍵語句的檢索。例如所要查詢的資料是有關於「圖書館教育」的資料,若單純輸入 library education,兩者間關係為「且」,可由 Yahoo 資料庫中找到 1,839 個網頁,其中不單是找到與「圖書館教育」有關的資料,還會找到許多「教育圖書館」(education library) 的資訊,並不符合檢索需求 (圖 16);若配合雙引號的利用,則獲得符合程度較高的結果可能性為大。(表 2)

圖 16:關鍵字檢索 - library education
策略 |
Library
education |
"library
education" |
結果 |
類別符合結果 |
6 |
1 |
網站符合結果 |
1839 |
12 |
表 2:「關鍵字」與「關鍵語」的檢索
三、符號的運用
(一) 加減號的運用
為了確保字詞的出現與否,與 AltaVista 及 Openfind 相同的,Yahoo 以提供利用加減符號與關鍵字的組合使檢索結果更符合需求。例如 dublin-dublin core,可查詢到與 Dublin 有關的資料,但 Yahoo 會自動刪除與 Dublin Core 有關的網頁;而 +Dublin+core 的檢索策略則可能確定所獲得資料包括 Dublin 與 Core 這兩個詞彙 (圖 17)。

圖 17:減號的運用
(二) 切截字元
* 與字根的配合,可擴展檢索結果所包括的範圍,以 cap* 查詢,不單可找到 cap 的資料,也可找到 cape、capital 等的相關網頁。以 cap* 檢索,Yahoo 回覆 11,445 個網站。
四、欄位限定
在檢索欄位限定上,檢索者可單就文獻名稱或是網址部分進行查詢。
(一) 文獻名稱
t:Dublin core,Yahoo 類表中有一符合類別、5 個網站、以及 264 個網頁名稱包括dublin core。
(二) 文獻位址
u:dubline core,Yahoo 資料庫中僅有兩個網站符合,
˙Dublin Core Metadata-a 15-ele-ment metadata element set intended to facilitate the discovery of electronic resources.
http://purl.oclc.org/metadata/dublin_core/
˙OCLC/NCSA Metadata Workshop report
http://www.oclc.org:5046/conferences/metadata/dublin_core_report.html
五、檢索結果的整理
若對檢索環境未多加限制,Yahoo 會就類別與網站本身進行符合比對,結果顯示則分為三部份,一是類別、一是網站以及網業。以搜尋 “Dublin Core” 為例,所獲得的結果包括了在 Yahoo 25,000 不同類別中的 “Dublin Core” 專欄、列於專欄下的 5 個網站,如 Dublin Core Metadata、以及 2,557 個網頁 (圖 18)。

圖 18:檢索結果顯示
捌、綜合比較
AltaVista、Openfind、Yahoo 三個搜尋引擎各有其特色,檢索與使用上都可協助資料搜尋者找到一些相關的資訊。以下就資料量、檢索功能、結果處理等做一分析比較。
一、檢索資料量
這三個資源搜尋網站並未就所收錄的資料量提供一個詳細數據,因此資料量的比較儘能就實際檢索範圍結果,查詢 Dublin Core 的相關資料,做一簡單的比較說明。在三個搜尋站中都是以關鍵句型式進行檢索,也就是說兩個字必須以輸入順序與格式同時存在網頁中。(表 3)
結果 |
altavista |
openfind |
yahoo |
網站 |
|
67(935) |
5 |
網頁 |
6,716 |
2,437 |
2,557 |
表 3:檢索結果摘要
(一) AltaVista
在 AltaVista 索引中共有 5,214 網頁包含 Dublin Core 這個字串,AltaVista 可將 Dublin Core 視為一關鍵語句進行檢索,但由於 AltaVista 未做歸類與整合的整理,5,214 個檢索結果的重複率相當高。
(二) Openfind
Openfind 視 Dublin Core 為一關鍵句,先就網站與網頁名稱部分進行搜尋,列出系統判斷最相關的檢索結果,以及各網站或名稱下的網頁文件數。
進一步可查看更多的檢索結果,Openfind 共找到 67 個網站,按相關網頁數排序,67 個網站下共 935 個網頁,其他網頁 2,437。
(三) Yahoo
Yahoo 的檢索結果,依分類表找到一相關類別,電腦與網際網路 (Computer and Internet),資訊與文件 (Information and Documentation),元件資料 (Metadata) 下;Yahoo 資料庫中 5 個相關網站,2,557 網頁名稱或網址符合檢索條件。
二、功能分析
AltaVista、Openfind、Yahoo 這 3 個搜尋引擎在功能設計上各有其特色,可就資料的整理方式、關鍵字詞的處理、運算子與符號的運用等不同層面來看。就資料整理方面來看,除了檢索外,AltaVista 和 Yahoo 還提供檢索者以類表的方式瀏覽不同主題的網路資源;字詞處理方面,3 個搜尋引擎都能同時處理單一關鍵字、多重關鍵字以及關鍵詞語的查詢模式。為強化檢索的精確性與資料的回收率,布林邏輯運算子及符號的運用,在 AltaVista、Openfind 與 Yahoo 的檢索策略中均可整合運用;除此外 AltaVista 與 Yahoo 還提供以限制欄位的方式進行查詢。相對來說 Openfind 雖不強調這些運算方式的利用,但 Openfind 在跨語文以及模糊比對檢索上確實是 3 者間最特殊的。至於檢索範圍與結果的處理,Altavista 僅就網頁部分查詢、Openfind 區分網站與網頁、Yahoo 則是就類別、網站與網頁等 3 個不同層次做處理。(表 4)
檢索功能 |
Altavista |
Openfind |
Yahoo |
分類 |
13 類 |
No |
14 類 |
搜尋 |
Yes |
Yes |
Yes |
關鍵字 |
單一、多重 |
單一、多重 |
單一、多重 |
語句檢索 |
Yes |
Yes |
Yes |
布林邏輯運算 |
And、or、not、near |
&、∣、! |
and、or |
符號 |
+、-、* |
+、-、, |
+、-、* |
條件限制 |
9 種 |
no |
2 種 |
模糊比對 |
No |
Yes |
no |
自然語言 |
No |
Yes |
no |
範圍與結果 |
網頁 |
網站與網頁 |
類別、網站與網頁 |
表 4:功能比較簡表
玖、結語
搜尋引擎的發展有助於網路資源的搜尋與利用,雖然說在檢索的精準度上各個搜尋引擎網站還有相當大的發展空間,但從發展之初到現在,搜尋引擎的幫助與自身功能設計的成長,在二次資訊爆炸時代的今天,確實是掌握網路資源上不可或缺的利器。
第 1.2.3 頁
|