網路資源搜尋引擎
Search Engine
羅思嘉
成功大學圖書館
【摘要】
網路資源的搜尋一直是資訊檢索者所需獨自面對與克服的問題,尤其隨著網路資源的增加資料搜尋的問題也更形顯著,不少網路搜尋系統紛紛在此情況下應運而生。過去有不少介紹台灣網路資源搜尋引擎的相關文章,本文將就 AltaVista、Openfind、Yahoo 等國際常用網路資源搜尋引擎做一介紹。
【摘要】
It has been a great challenge to the Network user to find the information thy want on the Internet. The search engines have been played a major role in locating the information o the Net. There are several articles about the Search Engines foe the Internet sources in Taiwan were published in the past. This article is focus on three wide used search engines, AltaVista、Openfind、Yahoo.
【關鍵詞】:搜尋引擎、網際網路、Altavista、Openfind、Yahoo
【Keywords】:Search Engine、Internet、Altavista、Openfind、Yahoo
壹、前言
在網路資源利用上資料的搜尋一直是資訊檢索者所需獨自面對與克服的問題,尤其是隨著網路資源的增加資料搜尋的問題也更形顯著。之所以將資料搜尋問題稱之為資訊使用者必須獨自面對與克服的問題,其因素在於資料的範圍及多樣化,與以往資料庫的資訊檢索不同,是一個無邊界的資料搜尋。面臨這樣的問題,不同學科範圍的研究者試圖提出不同的解決方案,有以圖書館資料編目方式處理網路資源的,有另以一套分類體系收集組織網路資源的,也有提供一套簡潔著錄原則讓網頁資源提供者附加於資料上以利搜尋,或是將網路資源建成一個資料庫以網頁內容或標題為主題透過搜尋引擎查詢資料者;這些不同方式在資料蒐集上各有其特點。本文將就三種不同的資訊搜尋引擎做一介紹與比較,AltaVista、Openfind、Yahoo。
貳、AltaVista (http://www.altavista.com)
AltaVista 是以索引檢索的方式提供網路資源搜尋功能,AltaVista 透過網路使用者自行登錄以及利用軟體到網路上搜尋新增的網頁資料。資料的檢索可分為兩種,簡易檢索與進階查詢。簡易檢索部分系統提供一個單一對話方塊,可輸入檢索詞彙或詞句,點選查詢 (search) 按鍵或按 <Enter> 鍵後系統進行檢查,系統壹檢索網頁的關聯性排序顯現,必要時可以語文限定所找出的資料。當所需要的資料在時間、或者是需要利用布林邏輯運算子組合不同檢索策略時,AltaVista 透過進階檢索提供不同的檢索功能。
除了檢索外,AltaVista 也提供一個分類表,以瀏覽的方式查詢所要的資料。AltaVista 共將資料分為 13 類,汽車 (Automotive)、商業經濟 (Business& Finance)、電腦與網際網路 (Computer& Internet)、醫療保健 (Health& Fitness)、嗜好興趣 (Hobbies& Interests)、家庭 (Home& Family)、媒體與娛樂 (Media& Amusements)、人物與聊天 (People& Chat)、參考工具與教育 (Reference& Education)、購物與服務 (Shopping& Services)、社會與政治 (Society& Politics)、運動與娛樂 (Sports& Recreation)、旅遊與假期 (Travel& Vacations) (圖一)。

圖一:分類瀏覽夾
參、AltaVista檢索特色
一、「單字檢索」與「語句檢索」
AltaVista 檢索系統在進階模式中提供檢索者兩種語彙檢索功能,一是「單字查詢」,可輸入單一字詞或多個字詞,系統將所輸入的每一個字詞都是為獨立字詞,單獨查詢,如在進階模式下鍵入 library education,系統查詢網頁包括 library 或 education 兩個詞彙 (圖 2);另一個則是「語句檢索」,若以雙引號加在檢索詞前後,系統會將輸入的字串視為一連結語句,依所輸入的順序與彼此間的相對位置進行查詢,如輸入 “library education”,系統會找出名稱與網頁中包含 library education 這個字串的資料,簡易模式中系統自動將檢索視為「語句檢索」(圖 3)。

圖 2:找尋網頁中包含 library 或 education 的資料,系統找到 14,629,555 檢索結果

圖 3:系統將 library education 視為一體字串進行檢索,檢索出 7,677 筆資料
除了使檢索更精確外,「語句檢索」對一些名句的檢索有所助益,例如 “To Be Or Not To Be”,在「單字檢索」中 ‘to’、’be’、’or’、’not’ 都屬於剔除字,在檢索上不具意義,但“To Be Or Not To Be” 組合起來是具有意義的資料檢索,透過「語句檢索」就可將包括 “To Be Or Not To Be” 這句話的網頁資料顯現出來。
二、布林邏輯運算
AltaVista 提供 AND、OR、NOT、NEAR 等不同步林邏輯運算子,AND 表示網頁中必須同時包括所輸入的字串,但字詞不一定要同時連結出現;OR 則是包括任一輸入字串即可;AND NOT 排除所不要的字串;NEAR 則是不單要包括所輸入的字詞,且字間的距離不超過 10 個字詞。
(一) AND:查詢 Consortium for the Computer Interchange of Museum Information (CIMI) 這個單位利用 Dublin Core 的相關資料,可輸入這樣的檢索指令, “dublin core” and cimi (圖 4)。

圖 4:利用布林邏輯運算查詢 CIMI 利用 Dublin Core 的相關資料
(二) OR:查詢與數位圖書館,digital library 或電子圖書館,electronic library 相關的資料,可輸入這樣的檢索指令, “digital library” or “electronic library”。
(三) AND NOT:想了解 CIMI 以外的單位如何運用 Dublin Core 的資料, “dublin core” and not cimi。
(四) NEAR:收集有關電子期刊的資料,electronic near journal。
三、條件限制
AltaVista 搜尋功能除了布林邏輯運算與語句組合外,檢索策略也可加入不同的條件限制使的檢索結果更符合需求。限制條件可分為兩種,一是欄位限定,一是選單限定。簡易與進階檢索兩種介面均提供來欄位限定,同時欄位限定可當成單一條件檢索;不同檢索介面提供不同選單條件限制查詢,同時是配合其他檢索條件一起查詢。
(一) 欄位
AltaVista 提供 9 種不同的限制條件欄位:
- anchor,查詢附超連結的特定字串。
- applet,尋找使用 Java 程式的網頁。
- domain,查詢某一網域的資料,domain:uk。
- host,查詢特定網站上的資料,host:www.lib.ncku.tw。
- image,以網頁影像連結為查詢依據,image:chopin。
- link,查簡資料連結到特定網址的網頁,link:www.lib.ncku.edu.tw,查詢那些網頁連結到成大圖書館的網頁。
- text,檢索網頁內容,例如 text:“information society”,找尋內文中包括「資訊社會」的資料 (圖 5)。

圖 5:檢索網頁內容正文包括 information society 字串的資料
- title,就網頁名稱欄進行資料查詢,title:“dublin core”,檢索網頁名稱中包括 dublin core 字串的網頁。
- url,網路網址查詢,如鍵入 url:ncku 查詢 AltaVista 資料庫有哪些可能由成大所編的網頁。
(一) 選單
在選單限制部分,AltaVista 提供語文以及網頁日期年代的限制,語文包括中文、英文、法文等 25 種語文;日期則可輸入所希望檢索時間的區段。
四、符號的運用
為符合不同的檢索需求,AltaVista 提供了一些符號運用功能來強化檢索結果,一是利用加 (+)、減 (-) 符號來確保所找出的網頁資料使否包括或剔除特定字詞,如輸入 “Library Education” –PhD,表示查詢有關「圖書館教育」方面的資料,但不要有關博士課程方面的資訊;另一則是利用星號 (*) 來進行字串切截檢索,digital library*,可 digital library、digital libraries 等資料均符合檢索策略。
五、修飾檢索策略 (Refine)
為了使檢索結果更符合需求,AltaVista 會將就檢索結果再進一步分析初相關的概念,檢索者可依需求選擇所要包括或者剔除的概念字詞 (圖 6)。

圖 6:可再利用 metadata、USMARC 等概念進一步篩選更合適的檢索結果
第 1.2.3 頁
|