網路信息計量學導論
邱均平 武漢大學信息管理學院教授暨中國科學評價研究中心主任
壹、網路信息計量學的概念體系
網路信息計量學的基礎學科,包括書目計量學(又名文獻計量學)、信息計量學(又名情報計量學、資訊計量學),以及科學計量學,以下將針對這些計量學的概念及相關性加以說明。
一、書目計量學、信息計量學、科學計量學的概念及關係
1960 年代之際,圖書館學、文獻學、資訊學和科學學領域,相繼出現三個類似的術語:Bibliometrics(書目計量學)、Informetrics(信息計量學)和 Scientometrics(科學計量學),代表著三個定量性的分支學科。這三個計量學歷經幾十年的努力研究和推動,在大陸已受到高度重視,而其發展過程共分成三個階段。
(一) 大陸第一篇與書目計量學相關的文獻,發表於 1964 年
書目計量學可以應用在很多領域,並提供一個較穩定的數據來源,1963 年美國正式出版的科學引文索引,是將書目計量學轉移應用的一個代表性指標,後有學者將其中文翻譯,成為目前大陸可以查到與文獻計量相關最早的文獻。
(二) 真正有計畫且具規模的發展,始於 1979 年以後,而第一個利用書目計量學方法來進行的大學排行榜,於 1987 年完成
1964-1979 年間,雖有零星文章發表,但規模都不大,1979 年改革開放後,是書目計量學初期發展的階段;而自 1987 年以後,則進入教學、研究和應用全面發展階段。
(三) 書目計量學自 1987 年以後,進入另一新里程碑,其蓬勃發展情況可從下列 7 個方面加以說明:
1. 對一個學科來說,是否有一定的文獻發表量及核心期刊為其重要指標,目前大陸每年發表與書目計量相關的文獻數,增長率約在 20%-30% 間,期刊論文數約 700-800 篇,每年發表的相關文獻量增長快速;而相關核心期刊,則包括「情報學報」、「情報科學」、「圖書情報工作」及「圖書情報知識」等,儼然已形成學科的核心情報源。
2. 1992 年大陸頒布國家標準「學科分類與代碼」(GB.T13745292),將書目計量學列為文獻學的分支學科,確立了它的學科地位,同時在「中國科學學與科技政策研究會」下,設置書目計量學與科學計量學委員會,另凡有資訊學、圖書館學方面的學科專業單位,都開設有書目計量學相關課程,國家每年投注上百億科研經費加以資助,加上很多期刊開闢書目計量學專欄發表研究成果,大大提升其學科地位。
3. 書目計量學共有八大分支領域,例如引文分析、書目工具建設等,相關的研究都獲得相當重要的進展。
4. 引文資料庫是不可或缺的書目計量工具,目前大陸分別建置有科學及社會科學引文索引,提供了系統化且穩定正確的數據來源;而在統計分析方法上,則開發了一些現代化的書目計量分析系統,其統計、排序、計算等計量分析,全部透過電腦系統完成,除了大為提高工作效率外,也提高科學研究的科學性與準確性。
5. 在專業教育方面,美國起步得相當早,第一篇書目計量研究文章發表於 1917 年,但至 1983 年大學才開設相關課程;而大陸自 1979 年開始進行有計畫的研究,1983 年武漢大學即首先開設書目計量學課程,從研究到專業教育的過程相當短暫。而目前全國共有 78 個教學點,包括大學及研究所(碩士及博士)都設有這門核心課程,專業教育發展很快。
6. 根據統計,在大陸境內發表過書目計量學文章的共 5,000 餘人,分析發表文章數量及被引用的情況,找出核心作者並形成核心研究隊伍。其成員年齡結構較合理,老、中、青學者都有,特別是年輕學者比較多;知識與學科結構也合理,包括學統計的、學數理化的、學情報學的、圖書館學、文科甚至外語的,且都具有碩士或博士學位,所以研究隊伍是學科發展的根本保障,關鍵在於人才。
7. 藉由舉辦或參加國際會議進行學術交流,並與國外大學及學者進行研究與交流訪問,大大促進學科發展國際化的水平。
二、三計學的術語定義
書目計量學、信息計量學及科學計量學,簡稱三計學,根據其研究對象、研究方法、研究內容、研究目標分別給予定義:
(一) 書目計量學
以文獻體系和文獻計量特徵為研究對象,採用數學、統計學等計量方法,研究文獻情報的分佈結構、數量關係、變化規律和定量管理,並進而探討科學技術的某些結構、特徵和規律的一門新興分支學科。稱它為分支學科,主要是因它是文獻學、資訊學的分支學科;稱它為新興的學科,因它是 1969 年才由英國的學者普里查德(Alan Pritchard)正式提出;同時也是一個定量型的分支學科。
(二) 信息計量學
英文的 information 早期大陸翻譯成情報,後來翻譯成信息,所以稱為信息計量學或情報計量學,它和書目計量學的關係非常密切,所以將它定義為採用定量方法來描述和研究信息現象、過程和規律的一門分支學科,是數學和統計學與資訊學廣泛交叉而形成的一門分支學科。
(三) 科學計量學
是對科學活動與其過程進行定量研究的分支學科;最早於 1969 年由前蘇聯的一位科學家所提出。
這三個計量學與文獻、情報、科學都是密切相連的,例如:文獻是科學研究的產物,也是科學研究發展的一種象徵;科學研究的成果要由文獻加以紀錄,並透過文獻進行交流與影響,所以文獻與科學密不可分。而情報是以文獻為主,文獻又包括大量情報,兩者的內容有許多共同與交叉的部份,方法是相似的、研究目標也有一些共同處,所以這三個計量學的關係非常密切;簡言之,書目計量學是信息計量學發展的基礎,也是科學計量學發展的基礎,而信息計量學與科學計量學,則是書目計量學發展的方向。
國外學者也有類似看法,美國知名的圖書館學家蘭凱斯特(F. W. Lancaster)曾受邀在武漢大學講學,課程講授到書目計量學時,學生提問「書目計量學與科學計量學的關係為何?」,蘭凱斯特思索後,簡要地以兩句話回答了這個問題,他說:「書目計量學是從文獻的角度,是從書目的角度來進行定量的研究;如果從作者的角度、從科學家的角度來進行研究的,即是科學計量學」。後來美國、歐洲也有些學者提到這幾個學科很難區分,所以在不同場合則採用不同的名稱。例如:在圖書館學領域都採用書目計量學這個名稱,在科學學領域、資訊學領域,就採用科學計量學或信息計量學的名稱。這正反映出這幾個學科的關係非常密切,而它們也有不同的英文名詞,因終究還是不同學科,所以會有個別基本的研究點,但彼此的關係又是相當密切的。
書目計量學是資訊學的一個重要組成部分,資訊學又稱為情報學或情報科學。英國著名圖書館學家布魯克斯(B. C. Brookes),對於資訊學有很多貢獻,可歸納成兩方面,一是從哲學的角度為資訊學下定義;另一則是為資訊學定量化,使它成為一門真正的科學。在資訊學定量化過程中,書目計量學佔有非常大的比重,在整體定量化研究中,書目計量學約佔所有論文數的 1/2,由此可知書目計量學是資訊學、圖書館學定量化方向發展的重要成分,同時也是信息計量學的基礎。
書目計量學不斷朝向信息計量學發展,而隨著數位化及網路化文獻信息的蓬勃發展,信息計量學又不斷朝向網路信息計量學發展;信息計量學是書目計量學的發展方向,尤其現在信息資源的電子化、數位化、網路化,更可對文獻內部的信息或知識加以進行研究,以中文資料庫來說,可以對一個漢字或一個單字進行計量研究。
以武漢大學出版社出版的第一本電子出版物「共產黨和國民黨」為例,這是兩黨的合作關係史,書中所記錄的各種政治活動、人物都可用以進行計量分析,分析結果也發現許多具意義且有趣的結論。例如:代表人物出現次數最多的是蔣介石和毛澤東,出現次數相當,而若用兩個名字共同檢索,可以查得很多歷史事件;另外,對於他們的政治談論或民眾對他們的反應等,也均可加以分析。這樣的分析不僅是針對一篇文獻或一本書,而是以文獻中的知識單元(一個詞、一個單字或關鍵詞等)為計量單位,使得書目計量單元,從一篇篇的文獻演化到文獻中的各個知識單元,這個重要的進展,不僅是一個嶄新的研究領域,更是嶄新的分支學科。
三、網路信息計量學
1997 年以前,伍德魯夫(Woodruff)曾發表有關網路信息測度的一些文章,但以 Webmetrics 表示網路信息計量學,是 1997 年由丹麥學者阿曼德(T. C. Almind)和英格維森(Peter Ingwersen)所提出,最初用意是為表示書目計量學方法理論在網路上的應用。而 1997 年末期有了另一用詞 Cybermetrics,最早出現於由西班牙科學信息文獻中心舉辦的一個電子問答或電子期刊中。
這些詞都是表示對於網路空間的一些計量研究,翻譯成中文 Webmetrics 可譯為網路計量學,而 Cybermetrics 可譯為賽柏計量學,或是電腦計量學。但依據其內容及涵義,研究對象不單網路本身,也不是電腦的物理性、實體計量,而是保存在電腦,並在網路空間傳播使用的信息,所以可譯名為網路信息計量學。
(一) 網路信息計量學的概念定義
網路信息計量學是採用數學、統計學的各種定量研究方法,對於網路信息的組織、存取、分布、傳遞、相互引證及開發利用等,進行定量描述或統計分析,目的在於揭示它們的數量特徵或內在規律的一門新興的分支學科。主要是網路技術、網路管理、信息資源管理、信息計量學等相互結合、交叉滲透而形成的一個交叉性的邊緣學科,也是信息計量學的一個新的發展方向。
網路信息計量學研究的目的,是透過對網路信息的計量研究,將其有序化組織和合理分配,並為網路信息資源加以優化配置及有效利用,同時為網路管理的規範化和科學化提供必要的定量依據。
將網路信息進行有序化組織和合理分配,正如圖書館學、圖書資訊工作把各式各樣的文獻與訊息加以收集,制定一個規則(例如:分類法)進行有序化,將龐大且雜亂無章的訊息變成有序,其目的是為了要更易於使用。而優化配置就是延續配置,延續配置使得訊息資源優化,以使其更能有效的利用,例如:原來半小時才能找到十條訊息,優化配置後,一兩分鐘就能夠找到十條訊息。另外,網路計量學還為網路進行規劃化與科學化的管理,亦即定量化的管理。
(二) 網路信息計量學的研究對象
網路信息計量學是什麼樣的學科?有什麼應用?歸納其研究對象可涵蓋三個層次,包括:網路信息的實際計量問題、網路文獻、文獻信息及其相關特徵信息的計量問題,以及網路結構單元的計量問題等。
網路信息的實際計量是針對網路信息的流量,甚至流動的方向等,進行實際的計量;而網路文獻、文獻信息及其相關特徵信息的計量問題,則是針對網路上的電子期刊、論文、圖書、報告等,將它們的分佈結構、學科主題、關鍵詞、作者信息等加以計量,無論一次、二次或三次文獻,都可以進行計量、研究與分析;至於網路結構單元的計量,則是對於網路結點,網路連線,網路結構單元等信息加以計量,結構單元包括站點及電子郵件等,並針對信息的徵兆、老化、傳遞及單元間相互連結,以及其相互引用情況進行計量研究,例如:「連結分析法」即是新的分析方法,相當於傳統書目計量的引文分析法,可找出 A 網站與 B 網站、C 網頁與 D 網頁之間有什麼關聯性,因此,網路信息、文獻訊息、結構單元等,均屬於網路信息計量學主要的研究對象。
貳、網路信息計量的數據來源、計量方法與工具
網路信息計量數據蒐集之來源,包括:搜尋引擎、網路投票與網路調查、線上版文獻資料庫、線上版引文資料庫、統計網站與專題網站等。
一、搜尋引擎
搜尋引擎是一種檢索工具,更是一種收集數據的工具,例如:Alta Vista 即能夠提供網站連結搜尋功能,為網路信息計量研究提供有效的數據來源;搜尋引擎的檢索結果,往往能提供許多重要的數據來源,並作為抽樣的依據,進而進行相關統計分析,例如:網站評價訊息、信息流量與連結次數等;另外,也可使用於網路連結分析。
二、網路投票與網路調查
「調查」在整個社會科學研究使用得相當普遍,傳統的問卷調查,主要以郵件傳遞方式來進行,網路普及後,「網路調查」則相當常見。網路調查有許多方式,有些是直接把調查表公佈在網站上,網友看了以後感興趣,就會主動進行填寫,回收後加以進行統計分析。
「調查」的另一種傳遞方式,可以電子郵件來進行,電子郵件傳遞的對象往往經過挑選,因此,使用郵件方式進行調查時,其回收率比較高一些,精確度也比較強,因為這是針對經選擇的對象進行分析。
三、線上版文獻資料庫
線上版文獻資料庫主要是將傳統紙本文獻進行標引及數位化後,以資料庫及超連結功能加以組織,所提供的內容可分成全文資料庫、索摘資料庫及目錄資料庫等。
四、線上版引文資料庫
資料庫的類型除了文獻資料庫外,還有一些引文資料庫、專題資料庫等。引文資料庫具備引文推介的功能,除提供文獻發表的信息外,也提供文獻引用的信息,這些訊息是書目計量學與網路計量學的重要數據來源。
五、統計網站
統計數據是對某一領域一定時間範圍內的某一項目或幾項指標進行科學紀錄所得出的一組科學數據,其質量取決於執行統計單位的可信度及權威性,統計數據一般來源於國家政府機構或特定機構對其本身狀況的統計。
統計數據可科學、直接地反映出某領域內各項因素的現實狀況,特別是通過不同領域內的同樣指標的比對,或通過同一領域內某一指標在不同時段的比較,可以清楚地反映出某項因素的發展動向,為科學研究和決策提供依據。
六、專題網站
一些研究中心建置有專題式網站,這些網站一般都涵蓋有關該狹小領域的重要事件與數據,並且許多都建有特有的資訊資料庫。例如:清華大學的廉政建設中心,建置有一個城市廉政建設的網站,專門用以評鑑某一個城市領導人的廉政水平。
而網路信息計量的方法,可分為兩大類,包括:傳統書目計量分析方法在網路上的應用,以及域名分析方法等。
一、傳統的書目計量分析方法,在網路上的應用
這個方法為大家所熟悉,正如統計分析方法、數據模式分析方法、引文分析法、書目分析法等在網路上都可以應用。而隨著網路興起所產生的「連結分析法」,則是網站和網站之間的一種連結,透過連結的數量、類型,甚至內部連結或外部連結等,加以進行分析研究。
二、域名分析方法
域名分析法用以尋找並裁定學科的核心網站,例如:與物理學相關的網站有多少,與化學相關的網站又有多少?而在這些網站中,連結最多的表示是被利用得最多,而且代表它使用得很好。
若能夠歸納出這樣的學科網站,對於物理學研究者來說,只要查詢幾個核心網站就可滿足大部份的需求了,而對圖書資訊工作者,則當需針對特定領域提供訊息服務時,也可快速地找到核心網站,解答並指引讀者的疑問。
網路信息計量的進行,必須使用的相關工具,除上述討論過的搜尋引擎及線上版資料庫外,還需一些應用軟體工具,包括:數據搜集工具及數據分析工具,搜集工具即數據來源工具,搜尋引擎為其中之一。而數據分析則主要是一些統計的應用軟體,亦即處理數據的軟體,例如:SPSS 及 Excel 等,在社會科學領域多利用這些工具進行網路計量的分析。
參、網路信息計量學的應用
隨網路信息計量學應用的範疇,可分為圖書資訊工作、相關領域及網路管理應用等三方面,分述如下:
一、圖書資訊工作,圖書館管理,訊息分析工作領域的應用
此領域的應用實例很多,可稱為「本體領域」的應用,是奠基於圖書館工作、資訊工作的應用。圖書資訊工作者可利用網路信息計量概念,對於網路信息進行分析研究,包括:專利信息的分析與學科信息的分析等,這種分析並可擴大為科學研究,例如:化學學科館員可分析國際間化學發展的動態與趨勢,並提供定量的數據供相關研究者及科學家參考。
二、相關領域的應用
利用網路信息計量來研究科技政策、科技管理,我們稱之為科技學、科技管理、科技預測等,這些研究隸屬於相關領域的應用。
三、網路管理的應用
網站的評鑑是一個很重要的應用領域,評鑑結果對於網站的重要性、網站的建置與管理有很大的助益。當要測定網站時,需同時引入網路影響因子,例如:透過平均點閱率,以歸納出某學科的核心網站,連結一個網頁,它的點閱率是多少相當重要,至於其他影響因子,則包括泛指度和專指度等,這些都是在網站評鑑時可加以應用的,例如:在學術網站中,它的層次結構,分成一級、二級、三級連結,有幾級的連結才能提供使用者所需的信息?如果網站的層次比較少,只分一級兩級,如此一來,專指度就比較低,而如將連結增加到三層、四層,專指度則相對提高。
研究網路層次結構非常有用,除可提高網路效率外,並可對於網路建置、改進、管理,提供很多定量的依據,並在泛指度和專指度間找到一個適當的平衡點,對於網路建置者更需要掌握這方面的知識。
肆、結語
Yahoo 是一個對全世界都發生影響的網站,其總裁曾表示,若問他最需要的是什麼?最缺乏的是什麼?他的答案都是「人才」,當進一步追問最需要的是什麼樣的人才?他的答案是「電腦人才」。
其實 Yahoo 所需要的不單是電腦人才,還需懂資訊組織、資訊管理的人才。為什麼呢?因為最令人頭痛的是對網路上信息的組織,包括:信息的層次結構、信息的學科結構、信息的內容結構等,而所面臨的問題包括到底怎樣才是科學的?怎樣才是效率最高的?才是具社會效率及經濟效率的?而這些疑惑正可利用網路信息計量學研究加以支援。
所以,網路信息計量學的應用實際上歸納起來,一個是在本體領域的應用,一個在相關領域的應用,第三則是在網路管理、網路建設方面的應用。
(本文為知識經濟時代之圖書館服務系列 (九) 資訊計量分析與應用研討會 (95.10.5) 演講紀錄,由蘇麗珍小姐紀錄,並經主講者同意刊登。) |