圖書館統計標準與
電子圖書館服務使用評量
林呈潢 政治大學圖書館館長
壹、前言
圖書館統計標準與電子圖書館服務的使用評估是我們上年度國家圖書館的研究案,目前這個研究案正在成為國家標準的過程中。如果大家對這樣的標準有疑問,歡迎大家在未來這段時間可以繼續給予指教。今年圖書館年鑑中大學圖書館的調查部份,就是從這個標準裡抽出一些題目請各位幫忙填答的。圖書館同道問了不少問題,顯示大家都很關心這個議題,我們也都一一記錄下來,特別感謝成功大學圖書館的同仁提出很多意見,我們覺得這些都是很值得注意的問題。今天,我先就這些標準草案的內容和各位報告。
有關於統計標準的訂定,其實我們本來就有這樣的標準,只是多年來在數位化的環境之下可能有所不足,每每在填覆各種問卷時,不知如何填覆,所以之前某一個館長就曾經和我開玩笑說:「奇怪,你們的館藏怎麼會比我們多?」我說:「不會呀,我們怎麼會比你們多?」他說:「你們填出來的數據都比我們高,你們的微片是怎麼計算呢?是不是如果一本書有十張微片十張只能算一個Title?」,其實這就是我們常會忽略的問題,微片是以片為單位的。政大有上百萬的微片,因為我們有很多的論文,如西文的博碩士論文、PQDD
的論文,早期我們全部都買微片,買得非常完整,ERIC 裡的資料庫ED(Education Digest),也是從第一期開始買到它沒有發行微片為止,圖書館統計標準早就針對不同館藏媒體訂定計算方法,只是我們都沒有注意它。這也是我們為什麼想修訂這麼一個標準的原因之一。我們希望標準訂定以後,可以用來當作工作人員決策、執行各項服務的依據。
這個作業主要是依據ISO2789:2003以及1993CNS13151的標準,根據這兩個標準再加上圖書館界常用語完成這份報告。
貳、電子圖書館的服務範圍
電子圖書館服務範圍可分為電子化館藏、線上公用目錄、電子文獻傳遞、電子化參考服務、電子化服務的使用者訓練、圖書館提供的網際網路連線…等。以下就其中幾個項目分別說明。
一、電子化館藏
「圖書館館藏」係指圖書館提供讀者的所有資料,包含本館所擁有的文獻及已取得使用權的館外資源。 「電子化館藏」則是指圖書館透過法定程序(可能是買的或贈送的),確保使用者可以永久或短期使用的電子資源。電子化館藏的種類可分為下列幾種:
(一) 資料庫(Database)
以電子化方式儲存數據或紀錄(含事件、書目資料與內文)之集合,具使用者介面及檢索軟體。
1. 全文資料庫:包含專書、報告、期刊論文等原始文本、樂譜、地圖或圖片的資料庫。
2. 索引摘要資料庫:指經持續分析彙整期刊或其他出版品所得之參考書目資料庫。
3. 其他資料庫:包括描述性資訊或數據資料的參考資料庫。
(二) 電子化期刊(Electronic Serials)
將原本紙本期刊改以電子化形式出版,或以電子形式出版的連續性出版品。
(三) 數位文獻(Digital Documents)
指由圖書館自製或取得之特定內容的數位化資料,並列為館藏者。
1. 電子書:指類似紙本書籍形式,其文本可以搜尋之數位化文獻,包含電子化的學位論文。
2. 電子化專利文獻:「專利文獻」是指政府授予發明者獨占使用權或發明認證,含其相關文件,是屬於特殊文獻資料,有紙本、微縮及電子化等不同載體形式。電子化專利併入數位文獻中規範與計算。
3. 網路視聽文獻:指必須使用設備閱讀或聆聽之視覺或聽覺資料,以聲音、圖片為主。計算視聽資料時,可分別統計網路使用或單機使用的數量。某個圖書館曾經問到,網路上或數位化的視聽媒體要歸到哪裏去,如果從這個標準看起來,應該歸在數位文獻裡面。
4. 其他數位文獻:指除了電子書、網路視聽資料或電子化專利以外的數位文獻,如電子化的報告、預(或試)刊本、地圖資料或樂譜等,不是前面規範的資料。在統計上這些數位資料全部歸入其他數位文獻。相關的統計數據不包括資料庫及電子化期刊,它把這兩項抽離出來另外做統計。
二、線上公用目錄
提供讀者館藏資料的數位化、網路化檢索功能之目錄。
三、電子文獻傳遞
圖書館提供之文獻傳遞服務是指透過圖書館之間的合作分享,以擴大讀者使用資料的範圍,滿足讀者的資訊需求。「電子文獻傳遞」則指經由圖書館工作人員,將圖書館館藏文獻,以電子化形式傳遞給使用者或其他圖書館,比如現在最常用的ARIEL,它本身就是一種所謂電子化文獻的傳遞。「電子文獻傳遞」不包含以傳真方式傳遞之服務,用傳真方式傳遞之服務列入一般文獻傳遞。
四、電子化參考服務
電子化資訊諮詢服務是指讀者透過網路機制(如e-mail、圖書館網頁或其他網路通訊方式),提出資訊諮詢。
五、電子化服務的使用者訓練
「使用者訓練」是指圖書館提供之具有學習目標的課程,目的在達到圖書館服務利用的學習成效。「電子化服務的使用者訓練」則是對使用者進行有關電子化圖書館服務的利用指導。
六、透過圖書館提供的網際網路連線
指註冊或通過身分認證之讀者,經由圖書館提供的電腦使用網際網路資源,這是這一項統計的內涵。
電子圖書館的服務範圍可以圖一的方式表示,將不同的服務項目關係用圖表達出來以後,對與電子化服務相關議題,不管在定義或統計都比較好處理。
參、電子圖書館資源和服務統計
電子資源服務常面臨使用統計的問題,不曉得各位的圖書館有沒有做這樣的統計,就是資料庫有多少人使用?是誰在使用?學校老師常常和我們爭論“這個資料庫大家都在用,為什麼要我出錢?例如台灣經濟新報,很貴的一個資料庫,是大家一起用,應該大家一起買,為什麼要我們買?那你告訴我到底誰在用?”現在每個圖書館進到資料庫檢索時,基本上都有一個統計欄位,哪一系哪一學院都由讀者自行點選,不選的話永遠都是預設的第一個單位。我們以前的首頁是把中文系放在第一個,所以常常覺得奇怪,中文系的使用人數為什麼這麼多,是不是應該和中文系的系主任說中文系該多出一點錢?後來中文系向我們抗議,是因為圖書館把中文系當預設值,在大家懶得點選的情況下,中文系就變成使用第一名。現在乾脆把圖書館換成第一個,圖書館永遠就是使用量最高的,換句話說,圖書館就是要負責經費的問題。
一、電子圖書館資源統計
電子圖書館資源統計所指的是電子化館藏的統計,統計項目包括資料庫、電子化期刊以及數位文獻。資料庫可分為全文資料庫、索引摘要資料庫、其他類型資料庫;數位文獻可分為電子書、電子化專利、網路視聽文件。免費的網際網路資源不列入電子化館藏數量中,而單獨蒐集提報。基本上電子化館藏數量剛剛我們都提到,那些透過一定法定程序取得…等等,如果是免費的網際網路資源,單獨有一項統計的提報資料。
圖一:電子化服務關係圖
(一) 資料庫
依照ISO標準的精神,館藏資料庫數量之統計,基本上應以統計個別資料庫數量為原則。亦即「透過同一使用介面所連用的數個授權資料庫,應統計至個別資料庫數量」。以ProQuest系統為例,如該系統內含28個可用之資料庫,則資料庫種數為28種。以各館採購的個別資料庫數量統計,免費贈送的資料庫視同採購的資料庫一併納入統計。資料庫的統計項目,則包含資料庫的總館藏量、館藏增加量、以及館藏淘汰量(含年度不續訂)。
如此麻煩的作法,是希望能和國際的統計接軌,我們現在常看到教育部評鑑大學的評鑑項目中,圖書館的項目是很簡單的,它只問有多少書,每一個學生平均有多少書,電子書不算書,電子期刊也不算期刊,所以我們必須要有一些數據,讓教育部知道評鑑圖書館績效應該用什麼方法來評估。目前對資料庫的使用統計,經常要仰賴資料庫廠商,內容包括有多少人使用及使用量。但數據是真是假?是對是錯?大概只有資料庫廠商知道。
(二) 電子化期刊
電子化期刊的館藏統計,包含在統計提報期間內取得使用權的館內或館外的電子化連續性出版品,依下列情況分別計算其數量:
1. 置於本地伺服器,提供線上使用之現期期刊種數
2. 置於遠端伺服器,提供線上使用之現期期刊種數
3. 置於本地伺服器,提供線上使用之現刊報紙種數
4. 置於遠端伺服器,提供線上使用之現刊報紙種數。
(三) 數位文獻
數位文獻的統計包含電子書、電子化專利、網路視聽資料及其他數位文獻。
1. 電子書
(1) 總館藏量:
a. 電子化館藏中訂購之電子書的數量
b. 各種電子化館藏中電子書的種數
(b) 可以包括 (a),因為我們現在參加聯盟,可能訂了兩百種或五百種,卻可以使用到兩萬種,兩者意義不同。國際上的統計希望知道實際上花多少經費買電子書,因此需要兩種統計數據。
(2) 館藏增加量(當年度增加)
a. 電子化館藏中訂購之電子書增加的數量
b. 各種電子化館藏電子書的增加種數
(3) 館藏淘汰量(當年度減少)
a. 電子化館藏中訂購之電子書淘汰的數量
b. 各種電子化館藏電子書淘汰的種數
二、電子圖書館服務統計
電子圖書館服務的統計主要可分為連線次數、連線時間、連線被拒、檢索(查詢)、紀錄下載、文獻下載、虛擬到館、網際網路連線。這些數據真的很難處理,但是如果我們一直建議教育部不能用那麼單純的方式來評估圖書館,那麼圖書館就要讓人知道我們提供了什麼服務,必須要拿出數據。
(一) 基本使用統計項目
基本使用統計項目包括連線數量、文獻下載的數量、紀錄下載的數量、虛擬到館的數量、連線時間、連線被拒數量、檢索數量、網際網路連線數量等。
1. 連線數量
連線係指使用者成功的連結資料庫或線上公用目錄,是使用者從連線到資料庫或線上公用目錄開始,至結束查詢為止動作的循環,結束的動作不限明確地透過登出動作或因逾時而被強迫登出。連線數量不包括連線到搜尋引擎或入口網站,連線到圖書館網站者,列入虛擬到館。
2. 文獻下載的數量
文獻下載係指將電子化館藏之全文或部分資料傳送給使用者。包含從電子化連續出版品或資料庫的全文文獻下載。從圖書館館藏中下載文獻或部份文獻的統計資訊,可用來證明使用者確實找到與其資訊需求相關的資料。
3. 紀錄下載的數量
紀錄下載係指在連線時完整顯示公用目錄的書目紀錄或資料庫款目。從資料庫或線上公用目錄下載紀錄證明使用者由資料庫或OPAC獲得相關的書目或其他資訊。
4. 虛擬到館的數量
虛擬到館係指使用者透過網路從圖書館外部連結至圖書館網站。虛擬到館可與傳統的實際到館做比較。
5. 連線時間
連線時間的定義係指介於登入和登出資料庫或線上公用目錄所持續的時間。
6. 連線被拒數量
連線被拒係指資料庫或線上公用目錄同時間使用人數超過上限而無法連線。不包括因密碼錯誤導致的登入失敗。此資料可顯示同時上線人數不足的程度。
7. 檢索數量
檢索係指在資料庫或線上公用目錄中進行查詢。每一次檢索需求送至伺服器時該檢索就會被記錄下來。
8. 網際網路連線數量
網際網路連線係指註冊或通過身分認證之使用者,經由圖書館提供的工作站使用網際網路資源。網際網路連線數量只有在使用者進行網際網路檢索時註冊或認證才可計算出來。若無此資料,則此數量可透過使用者調查估計。
(二) 各項電子圖書館服務的使用統計
電子圖書館服務的使用可依下列4項電子圖書館服務,分別計算其使用數據,以了解各項電子化服務的成效。這4項是圖書館提供電子化服務主要的統計數據。如果我們希望教育部能從多方面評鑑大學,圖書館應該在質與服務方面提供數據互做比較,才能鼓勵圖書館,因此電子圖書館服務的數據應該視為績效評估的指標。
1. 線上公用目錄
線上公用目錄的使用統計資料通常可從圖書館系統中獲得,除了連線數量,還應計算檢索數量及紀錄下載數量。
2. 電子化館藏
電子化館藏的統計資料可從圖書館本身的伺服器或從代理商∕供應商獲得。對資料庫而言,除連線數量外,查詢的次數、紀錄與文獻下載的數量都必須計算。對電子化連續性出版品與數位文獻而言,最重要的是文獻下載的數量。對電子書而言,如同紙本圖書一樣,必須要計算其借閱量,可區分為線上閱覽或利用電子閱讀器閱覽以了解使用者的需求。
3. 圖書館網站
圖書館網站的使用統計可藉由使用紀錄、分析軟體獲得。自其他的網站連結進來的虛擬到館紀錄包括每頁的查詢紀錄。可能的話,應剔除使用相關字詞或語彙自一般搜尋引擎查詢進入網站之連線。
4. 網際網路連線
由圖書館內提供的網際網路連線數量,應與圖書館所提供的電子化服務分開計算。此服務提供連線設備,而非圖書館館藏,所收集的數據將因此限制在計算網際網路的連線,而非被檢索到文獻的數量。
肆、電子化資源服務統計的困難
各項電子圖書館服務統計,資訊來源有來自圖書館本身伺服器、資料庫供應商、系統代理商、甚至是另行開發的統計軟體之業者等。不同管道,使得電子化服務的使用難以精確評量。電子化館藏的統計資料,一般都從圖書館本身的
proxy server 上或代理商取得,對資料庫而言,除連線數量外、查詢的次數與記錄、文獻下載的數量,都必須要計算,不能只記錄查資料庫的次數。例如:現在國科會給我們的記錄,都只告訴我們進去多少
section,search 多少次,但中間少一個數據就是 download 多少篇。中研院數位化論文典藏聯盟陳亞寧先生每次報告都會提到下載最多的幾個學校,他常常覺得對我不好意思,因為政大買得最多,使用量卻排在十名外,這可能是各校統計的方式不同造成的,但這個數據仍很重要。
伍、後續計畫與未來目標
後續規劃將圖書館統計修訂建議規範送標準檢驗局審查,以正式公布標準修訂版本,作為各類型圖書館服務統計之一致遵循依據。同時也希望可以建置圖書館統計填表系統,利用線上填表機制,減少文書往來,提高各項統計調查的成效。這個部分目前是交大柯皓仁副館長在執行的計劃。建置系統的目的是希望能讓各單位隨時自行上去做維護,未來可讓大家輕鬆面對來自各方的問卷調查。當然除了這個系統的建置之外,我們還是要建立共識,這些統計與調查資料是需要大家共同協助,一定要建立如何填覆問卷的機制出來。雖然目前不填可能沒有關係,但是如果我們想提高績效,似乎應該拿出數據,但是主辦單位絕不能將個別的資料公開,除非學校願意公開數據,這牽涉到各圖書館對自己數據的隱私權及保障自己權利的問題,這對建立調查的機制也是非常重要的部份。未來則將朝申請國家標準、依據標準發展網路問卷、建立調查機制等方向發展。
(本文為「知識經濟時代之圖書館服務系列六」演講記錄,由郭慧英小姐記錄,並經主講者寓目同意刊登。)
|