Google化與圖書資訊業的前景
張甲 史丹佛大學圖書館數圖系統服務部系統軟體研發員
壹、前言
近年來,圖書館普遍面臨經費縮減之窘境,以美國研究圖書館學會 (Association of Research Libraries,簡稱ARL) 對四十所會員館1982至2002年經費成長情況之統計為例 (圖一),圖書館分配到的經費正逐年下降,且自2000年以後更為嚴重;另外,再從對美國私立大學經費分配情況所進行的調查,亦可發現圖書館經費僅約全校經費的1.3%,且大部分是用在薪資、館舍及設備維護上,真正用於採購圖書及期刊資料的比例相當低,僅佔全校總額的0.1% 及0.2% (圖二);這些警訊似乎正提醒著圖書館「當學校考慮發展願景時,圖書館可能不會被列為主要對象」,因此,圖書館應有所自覺,並加以思考如何為圖書館找出好的對策。


自1900年以來,期刊數量約以3.3% 穩定成長,而1960年代更達到4.7%,目前仍持續增加中(圖三),同時,資料庫數量也不斷激增(圖四),從1972年代的七種、1992年代的八千種,至2003年時已超過二萬種以上,短短十年間成長近三倍,因此,在經費逐年減少之際,圖書館開始面臨資訊服務資源不足問題。另一方面,大學對於協助研究發展的計算機及網路設備經費的分配上,也與圖書館的經費差距越來越大 (圖五),推究其原因,是由於讀者開始習慣使用網路及搜尋引擎檢索資訊資源,對圖書館之使用率遠低於搜尋引擎,因此,學校將更多經費投入於網路及計算機設備上,而使得圖書館的作用開始減弱。



根據對美國研究圖書館資源使用調查結果顯示,讀者每天利用Yahoo、Google或非圖書館提供之檢索訊息比例近70%,而利用圖書館網頁檢索圖書館資源約20%、使用圖書館提供的資源約10% (圖六),這樣的結果透露著讀者使用圖書館做為檢索資源途徑的比例遠低於搜尋引擎,儘管在近70% 的高度比例中,包括著網路購物及價格比較等行為,但利用網路查找資訊已成為一種全民現象,圖書館也已變成次要檢索資源的途徑,有鑑於此,圖書館界開始關心Google對圖書資訊業前景的影響。

貳、Google化現象
Google化一詞,於2005年春天首次出現在由網路資訊聯盟 (Coalition for Networked Information,簡稱 CNI)主席Clifford A. Lynch與史丹佛大學圖書館館長Michael A. Keller為ACRL第十二屆虛擬國際會議 (ACRL virtual 12th National Conference)所建置的Webcast Registration中,其意味著Google被全民接受的程度,已達到普及化的程度,且深深影響著社會與每個人的生活,同時,也對學術界、圖書館及出版業產生衝擊。
傳統訊息供應鏈是作者完成作品後投稿至出版社,出版社出版後再販售給訂戶(圖書館/機構或個人),而從1960、70年代開始,因出版品愈來愈多,因而發展出線上版二次文獻服務 (A&I Services, Online Vendors),以供檢索期刊或專業報告中的文獻,尤以DIALOG、CA化學文摘最為代表。
發展至今,各種資源大量數位化,資訊變得更容易產生及傳播,傳統單一供應鏈不再存在,同時變得相當複雜 (圖七),圖書館只是眾多資訊供應來源之一。推究其原因,與資訊技術發展、資訊資源使用習慣改變、出版商透過Google提供檢索、開放檢索 (Open Access) 環境興起、作者與讀者避免「第三者」的零距離接觸,以及社會化資訊服務等相關。

一、資訊技術的發展
早先電腦、數據機、硬碟等設備價格及通訊費用昂貴,讀者難以擁有相關設備,因此,圖書館扮演重要的「資訊仲介者」角色,由經過專業訓練的館員代替讀者檢索資料庫,致使二次文獻或資料庫出版商提供的檢索軟體,都是為館員設計的;但隨著資訊技術的發展、資訊教育普及化,以及電腦設備價格與通訊費用平價化後,讀者多已自行擁有相關設備,並通曉檢索方式,無論Google或資料庫的檢索介面設計,都是為讀者而設計。
二、資訊資源使用習慣改變
根據研究最常用以檢索研究資源的工具 (以圖書館員與科學家為對象) 結果顯示,圖書館員最常使用的三種工具分別為Science Direct (42%)、ISI Web of Science (37%)及Medline (31%),但這三種卻只分別得到讀者2% 的支持度;相對地,Google、PubMed及Yahoo分別被科學家列為最常(30%)、次常(11%)及經常 (10%) 利用的工具,有趣的是Google及Yahoo未受到任何館員的青睞;而PubMed則是非常好的範例,它是免費的醫學資料庫,館員及科學家對此資料的使用頻率是相近的,正反應出它的設計適合讀者,也同樣適合館員。

三、出版商透過 Google提供檢索
目前有許多出版社意識到 Google對人們產生的影響,開始將索引提供給Google或讓Google索引其元數據 (metadata);以BioOne生物學全文資料庫為例,BioOne將元數據及索引文獻檔交給Google,並透過Google Scholar提供檢索後,其點及率從原先每天三千次激增至三百萬次,這是二次文獻出版商透過Google免費提供檢索,大量提高使用率的實例;此成功案例提醒了圖書館,如果擁有一個很好的自製資料庫,在與Google合作時,第一要件是需趕緊調整圖書館網路流量,因為任何人將容易地經由Google快速查詢到圖書館網頁。
四、 開放檢索 (Open Access)環境的興起
當搜尋引擎加入資訊供應鏈後,整個流程似乎已見不到圖書館,只存在作者、出版社、搜尋引擎及讀者,不過事實並非如此,圖書館的資訊人員要解決的問題,是如何幫助讀者在多種來源訊息下,迅速且準確地找到資料,甚至包括「開放檢索 (Open Access,簡稱OA)」的資訊;從前OA是指免費電子期刊,圖書館蒐集這些資源,提供讀者使用,但現在不再侷限於免費電子期刊,已擴展為泛指各種免費提供的數位訊息,因此,所有生產資料庫的單位 (包括圖書館),若願意將元數據及所有索引文件向社會公開,即可透過搜尋引擎為所有訊息編制很好的索引,讀者只要透過單一介面就能看到所有資料。要推動開放檢索,對於元數據及所有文件需制定標準,另外,不同性質之出版單位也要制定出一套運作機制,以使圖書館、讀者、出版社及作者均受惠。
五、作者與讀者避免「第三者」的零距離接觸
以往出版社接受作品之出版或刊登,均經編輯審查程序,但也經常因審查週期過長,形成學術研究障礙;數位化學術研究環境,使作者與讀者在研究過程中,即可進行直接交流,對作者而言,能容易且即時地將研究成果公開於網路上,不過,同時衍伸出內容質量良莠不齊的問題,對於任何人在網路上發表的任何作品,又應由誰來審查呢?有鑑於此,「預印本制度(pre-print)」因應而起,亦即在未正式出版前,先於同行間進行學術溝通與交流,以確保正式出版後論文的學術價值。
預印本模式特別合適於數位環境中發展,作者將作品放置於指定網站,讀者可直接閱讀這些作品,並直接跟作者交流及修正,這樣的過程,將使作品更趨完善,而目前相關的系統包括:E-print、加州大學系統的eScholarship Repository及博客(Blogger)。
E-print是為技術進步和學術交流,而進行的預印本電子流通,主要收錄工程和物理學方面科技文獻作品;而eScholarship Repository則包括加州大學系統十個分校、每一系所的專業,包括文科、理科、化學…等,教師完成文章正式發表前,可先上傳至系統,在公開前需先經由系代表組成的委員會進行審閱,經認定有價值者,才會批准並通知公開;如此一來,圖書館提供了一個非常有價值的資料庫,其收錄內容都是教師正在研究中的論文,除可呈現學校整體研究趨勢外,也是研究不斷進步過程中的產物。
而eScholarship Repository中的print-review,是將全加州大學教師的研究成果予以收錄,除呈現學術研究成果外並免費開放檢索;這種做法引起了出版社的抗議,起先態度強硬且認定已在eScholarship Repository發表的論文即不刊登,不過,由於加州大學研究人員水平相當高 (根據統計,全世界所有學術論文中,加州大學教師發表數量約佔20﹪),且加州大學達成若出版社不允許進行eScholarship Repository,該校則不允許教員投稿之共識,如此做法,促使出版社立即妥協。
其實,eScholarship Repository對出版社是正面影響的,通過此關卡進行公開及修正後,正式出版的論文水準提高許多,因此,對學術界及出版界而言是雙贏局面,同時,也是很重要的趨勢,有了eScholarship Repository系統,除可保障研究人員的知識財產權外,研究者有更多領先他人的好機會。
除此之外,「博客」包括Blog、RSS與Wiki,這些都是便於建立個人網站的技術,把個人感興趣的資料組合起來設立網站,讓相同興趣的人可到訪網站、提意見、交流、洽談等,這是很好的溝通工具,也因此明尼蘇達大學圖書館利用其發展學術研究活動;而對大學來說,其中所討論的都是具價值的學術資源,所以,圖書館只需利用目前數位技術及數位資源,稍微動腦筋,即可提供許多新型態的服務,跳脫傳統圖書館束縛,提供讀者更多元化的訊息服務。
六、 社會化的資訊服務
在Google化以前,圖書館界已有許多資訊技術被提出,例如:引文索引是非常有利的工具,其可從量化角度來衡量資訊價值,書目計量學也因此產生,但至今所發揮之真正功能卻相當有限。其原因首在價格問題,並非每一圖書館都有能力訂購ISI引文索引,其次,引文索引的原意是為幫助研究人員透過引用索引的關係,找出研究方向及關聯性,但這項功能未被有效利用,反倒經常被用於升等評級上,以致失去原應有的功能,同時,ISI所進行引文索引之對象是經過選擇,且以歐美出版的期刊為主實未普及化。
搜尋引擎引進引文索引概念後,重視提供免費服務、以人為本的數圖技術,以及囊括資訊研究成果等,Google或Yahoo提供非常有效的方法來幫助研究,其利用Caches技術使得檢索的結果愈來愈理想,所謂Caches技術是以讀者使用經驗為基礎,來判斷資料的相關性,愈多人使用代表相關性愈高,經不斷累進及修正後,其效率遠遠超過人工編制技術,也使得Google深深影響著社會及人們的生活。
另外,部分資訊研究成果免費於網路上提供,也使得使用者更便於利用及參考,至於對需經授權才能使用或取得全文的資料,Google也會適時地將讀者指引回圖書館,所以,Google並非把所有工作都包下來,也無法完全取代圖書館,透過圖書館來提供服務,仍是Google化後的方法之一。
第 1.2 頁
|