第二十期 100年11月

【專題論述】


淺談雲端運算在圖書館服務之應用
圖書館與著作權法
 
 
【服務與推廣】
FUN!FUN!FUN!我在成大遇見陳之藩
多元服務新地標 總圖書館一樓東側多元空間及陳之藩教授文物特展區 
 
成大圖書館九十九年圖書館週推廣活動紀實
多媒體中心影展活動九十九年回顧
 
 
【館務紀要】
頂尖大學的圖書館
離情依依-充滿感激
國立成功大學圖書館九十九年回顧
國立成功大學圖書館九十九年大事記 
 
 
 
   

 

淺談雲端運算在圖書館服務之應用



余顯強
世新大學 資訊傳播學系 教授

貳、雲端技術與服務
  雲端的實務如同一般資訊技術,包含服務與技術兩個層面,系統廠商發展雲端的技術,建置雲端的相關平台與環境,許多業者再藉著這些平台與環境,加上各種技術與方法的實作,因而推出許多服務,包括國際企業所發展的關鍵性技術與服務,以及提供個人或單位使用的事務工具服務:雲端的實務如同一般資訊技術,包含服務與技術兩個層面,系統廠商發展雲端的技術,建置雲端的相關平台與環境,許多業者再藉著這些平台與環境,加上各種技術與方法的實作,因而推出許多服務,包括國際企業所發展的關鍵性技術與服務,以及提供個人或單位使用的事務工具服務:雲端的實務如同一般資訊技術,包含服務與技術兩個層面,系統廠商發展雲端的技術,建置雲端的相關平台與環境,許多業者再藉著這些平台與環境,加上各種技術與方法的實作,因而推出許多服務,包括國際企業所發展的關鍵性技術與服務,以及提供個人或單位使用的事務工具服務:雲端的實務如同一般資訊技術,包含服務與技術兩個層面,系統廠商發展雲端的技術,建置雲端的相關平台與環境,許多業者再藉著這些平台與環境,加上各種技術與方法的實作,因而推出許多服務,包括國際企業所發展的關鍵性技術與服務,以及提供個人或單位使用的事務工具服務:

一、企業開發的雲端技術與服務
   雲端運算與資訊服務密不可分,全球已有多個大型商業公司,例如:Google,Microsoft, IBM, Amazon, EMC, Sun⋯等,開發並提供各種雲端運用的技術與商業資訊服務,分別介紹如下:

(一) Google
  除了既是瀏覽器也是雲端作業系統的Ch rome之外,Google在全球建置超過30多個資料中心、利用200多萬台伺服器提供以網路資料搜尋為基礎,結合開發出Gmail與Google Map兩大殺手級之應用成果,並持續發展許多產品與服務。根據統計, 2009年Gmail用戶到訪率為51%,遠高於Yahoo的20% 及Hotmail的18%。2008年Google針對雲端技術所開發的Google App Engine(GAE),提供開發者能夠迅速地建置可靠的網路應用程式,不用考慮網路頻寬、主機管理、維護、擴充等平台使用的問題。除此之外,Google同時推出三大關鍵技術,包括:(1) GoogleFile System (GFS)分散式文件系統,具備儲存效率、可擴充性、可靠性等分散式檔案系統之特性,主要用於處理雲端運算迅速增長的數據處理需求;(2) MapReduce (分散式運算技術),對電腦叢集的大型資料分解成Map及Reduce函式執行分散式運算處理。先透過Map函式將資料分解,再將這些資料經由多台電腦進行平行運算,再透過Reduce對處理完成的資料進行組合, 藉此得到完整運算的結果; ( 3 )BigTable (分散式資料庫) 用來處理PetraBytes級的結構化資料。
  另外,Google也透過併購全球最大部落格網站 Blogger.com、收購最大影音分享網站YouTube及VoIP服務商Gizmo5、GrandCentral等方式,來強化雲端軟體服務(SaaS)的服務能力外,並力推Go ogleApp Engine平台及開放Big Table分散式資料庫做為資料中心來展現其面對雲端市場的企圖心。

(二) Microsoft
  Windows Live是Microsoft早期推出且功能穩定的雲端產品,面對雲端應用的發展,Microsoft也將Windows Live延伸成為軟體加服務(software plus services),透過前端的軟體(software)結合網路的服務(services),提供雲端的應用模式。此外,Microsoft也於2008年10月推出底層架構於其資料中心的Azure作業系統, 結合Microsoft.Net services、SQL services、Live Services三項服務,以及透過網際網路架構建立雲端運算的Azure服務平台,提供服務系統程式開發、代管、管理的雲端功能。除了自有系統軟體的發展,近幾年Microsoft也不斷併購網路相關產業,以強化雲端不同層面應用的競爭力,包括網路廣告公司aQuantive、入口網站龍頭Yahoo,以及今年(2011年)5月10日併購的Skype。其中雖然併購Yahoo的計畫在2008年5月4日宣布放棄,但雙方仍於2009年7月簽定長達10年的合作協定。

(三) IBM
  IBM公司主攻伺服器市場,並以基礎設施雲(IaaS)為基礎進行延伸;2007年11月15日於中國大陸上海宣布藍雲 (Blue Cloud)計畫,當時並預計於2008年將雲端運算帶入商業應用市場。所謂藍雲 (BlueCloud)計畫包含BaldeCenter、Tivoli負載監控管理軟體、Apache Hadoop平行處理規劃機制、Xen、PowerVM的開放式Linux架構,其目標是希望藉由大型的Server Pool加以取代以往Local Server及Server Farm的運作模式。

(四) Amazon
  2006年開放Ama zon Web Ser vices(AWS)技術平台供企業用戶使用,AWS原本是提供零售商銷售之用,但因為零售書商營運有淡旺季,使得淡季時有近45%運算能力與儲存空間被閒置,因此,彈性開放供一般企業使用。AWS包含三大雲端服務:儲存空間(Si mple Storage Ser vice,S3)、彈性運算(Elastic Compute Cloud,EC2),以及應用於分散式元件之間資料傳遞框架服務的簡單佇列服務( SimpleQueue Service, SQS)。

(五) EMC
  成立於1979年的EMC為全球第六大軟體廠商,也是全球最大網路儲存及管理服務供應商,1994年跨入軟體研發,推出遠端資料同步軟體 (SRDF),自2000年起涉入資源管理、內容管理、儲存管理、虛擬軟體、資訊安全等五大業務領域,企圖轉型為資訊服務廠商。EMC提供的網路儲存主要分為NAS及SAN兩種,NAS為檔案形式,適合大型檔案資料的應用,而SAN則為區域塊狀形式,適用於資料庫及線上交易應用。由於虛擬化是雲端資訊技術的主流、資訊安全是雲端運算的重點,因此2004年EMC進一步併購了全球伺服器虛擬化技術領導廠商VMware、2006年併購網路資安軟體廠商RSA,更於2009年11月與Cisco公司合作成立雲端運算環境策略聯盟 (Virtual Computing Environmentcoa lition,VCE),並合資成立Acadia公司,負責企業私有雲的建立。

(六) Sun
  Sun Microsystems是全球第四大伺服器製造商,基於先從中小企業布局,再到大型企業領域的目標, 推動可執行OpenSolaris作業系統、Java及MySQL資料庫系統的Sun Cloud的開放式平台。2009年4月Oracle併購了Sun,加上原本Sun於2008年所併購的MySQL資料庫系統,使得Oracle對全球資料庫系統市場與軟體開發技術具有更大的影響力。

  除商業公司企業紛紛投入雲端技術與應用的發展之外,非營利機構如開放式原碼中最具代表的Apache SoftwareFoundation也推出重量級開放原碼的Hadoop雲端計畫。Hadoop平台透過分散式檔案系統、分散式運算及分散式資料庫等核心技術及處理動態資料手稿語言、分散式管理系統、分散式檔案基礎架構、應用於平行預算的程式語言等子技術。
  Hadoop雲端計畫是由Google提出並公開文件的MapReduce演算法,讓 OpenSource社群自由發展,而由Doug Cutting將MapReduce實做到Apache Open SourceProject 之搜尋引擎, 解決先前發展Lucene、Solr、Nutch等搜尋引擎開發計劃時,所遇到大量資料儲存的瓶頸。當Doug Cutting被延攬到Yahoo後更成立Hadoop專案,並使Yahoo成為此一開放原碼的關鍵貢獻者。Hadoop平台透過分散式檔案系統、分散式運算及分散式資料庫等核心技術及處理動態資料手稿語言、分散式管理系統、分散式檔案基礎架構、應用於平行運算的程式語言等子技術(註14)。

二、企業應用雲端服務的案例
  若要探討雲端服務在圖書館服務的應用,由於符合雲端技術的實例並不多見,因此可以由一些國際使用雲端服務較具特色的案例,來反思圖書館在典藏、服務模式與系統導入等可應用雲端服務模式的參考情境:

<案例一> 紐約時報(New York Times)欲將1851-1922年間報紙掃描的高解析圖像,依據圖像的集合各別轉成PDF檔(註15)
  機構進行數位典藏時,若需將已掃描成圖檔的紙本文件,轉換成其他電子文件的格式,例如PDF,除了需要另外投入大量的人力與設備進行轉換作業,同時還必須考量在有限經費與時間壓力下完成。紐約時報,欲將1851至1922年長達72年大量報紙已掃描完成的圖檔格式轉成PDF,面對處理大量資訊的工程,若採取自行購買相關設備與軟體的方式,必然耗資不斐;因此,紐約時報採用租賃Amazon的EC2與S3雲端服務,藉由後端100台虛擬伺服器的運作,花費12小時及美金890元的費用就順利完成,這就是雲端服務帶給企業極大好處的成功案例,尤其針對臨時性需求更是極佳的選擇方案。

<案例二> 華盛頓郵報(Washington Post)欲將美國國家檔案局公開的文件儘速產生索引以便公開於網站供大眾檢索(註16)
  美國國家檔案局的檔案都分有保存年限,若不屬於機密文件逾時即允許公開。2008年美國國家檔案局應要求公開1993至2001年間希拉蕊在白宮共計17,481頁的日記檔案。華盛頓郵報希望搶得商機,率先將全部公開的資料上傳至網路上供眾檢索。但由於檔案格式為PDF檔,無法直接於網站內進行全部文件的內容檢索,必須將每一份PDF檔案進行內容分析與建立索引。依據華盛頓郵報本身的電腦轉換能力,PDF檔案每一頁需要花費30分鐘處理,為爭取時效,華盛頓郵報基於這種臨時性的需求, 便將執行的工作委由Amazon的EC2運算營運環境,藉由後端200台虛擬伺服器的運作,包括處理關鍵字程式的開發,與高速處理運算的效能這兩項成功關鍵,於9小時內便順利處理完成。

<案例三>商品清單(wishlist)外掛程式Giftag結合Google服務功能的雙贏案例(註17)
  Giftag提供使用者在瀏覽網頁時可以將喜愛的商品加入,並由其維護這些商品清單的瀏覽器外掛程式。Giftag經常被應用在網路購物車服務上,使用者將選自不同網站的購物清單暫存於個人電腦中,一旦決定採購再抓取原已儲存之資料,分別連回不同網站進行結帳,也就是說此種購物車不專屬於特定網站,而是專屬於「使用者」;使用者可輕鬆地推著購物車悠遊於各商務網站間。由於每日需要應付數百萬使用需求與大量資訊存取流量,致使伺服器不堪負荷之狀況,尤其是特殊購物節日(例如:聖誕節購物旺季)所產生巨量的使用負荷。為了解決伺服器端系統運算與處理需求的變化情形,Giftag導入Google雲端的解決方案,透過GAE平台回應使用者的需求,利用Google資料庫儲存相關資料,再結合Gmail作為客戶帳號管理,並透過Google的搜尋引擎提供查詢,使得服務功能更多、觸角更廣,雙方得利,這也是雲端結合外部應用程式加以簡化自我系統需求,並能擴大服務層面的成功案例。對於圖書館的應用思維,便是可以跳脫傳統系統部署(On-premise)的建置模式,改為依據實際需求(On-demand)彈性結合雲端工具的的參考方向。

<案例四>Häagen-Dazs導入客戶關係管理(Customer Relationship Management,CRM)系統(註18, 19)
  Häagen-Dazs是一家全球連鎖型企業,原先全世界各經銷商每年的產品庫存或銷售報表,均是以Excel表單及Access資料庫加以管理,再轉錄到美國總公司的系統中,在管理上難以協同運作及彈性調整。後經導入客戶關係管理, 採用Salesforce公司的雲端解決方案,不到6個月就重新部署完成。由於像ERP、CRM之類的系統,導入往往需花費很長的時間,包括主機建置、營運參數與商業邏輯的設定、教育訓練、舊系統資料移轉等,但透過雲端服務的模式則單純許多,Häagen-Dazs只需將需求提供給Salesforce公司並支援規劃,在系統上設定相關軟體,各銷售點的人可隨時連線輸入資料,美國總公司馬上得知資料,非常便利且作業更具即時性。對於上線經常需要花費許久過渡期的圖書館自動化系統導入過程,透過雲端快速建置專屬於已有運作環境的特性,提供圖書館方能夠在軟硬體建置之前,即可進行訓練、測試、移轉等作業。不僅提供圖書館方能夠立即檢測新系統功能的符合狀況,並且能夠更快速地熟悉操作,減低導入或轉換新自動化系統的過渡時期。

三、應用於一般事務的雲端服務
  雲端服務不僅運用在改善企業的營運績效與簡化系統維運的負荷,雲端運算也產生越來越多基於網路而發展的個人化服務。這些服務使用方便,有些需要付費、有些則完全免費。服務運行在雲端,使用者便不須購買高效能的電腦來執行種類繁多的軟體,省去安裝、維護、升級,減低使用成本與安全漏洞的風險。除了必須保持網路連線,且網路頻寬必須足夠的條件之外,雲端運算提供使用者不再侷限只能使用個人電腦上有安裝的軟體,而可以透過網路隨時運用各種不同種類和功能的服務:

(一) 電子郵件
  一般人習慣存取ema il的模式,在過去多是使用Microsoft Outlook、OutlookExpress, 或是各類網路服務提供者(Internet Service Provider, ISP)的web mail等工具,但是這一類傳統的email服務並不具備如Google Gmail、Microsoft LiveHotmail、Yahoo!Mail及行動裝置MobileMe Mail等之 Web email動態資源調配的雲端服務特性。

(二)行事曆
  如Google Calendar、Yahoo!Calendar、30Boxes、CalendarHub、Calendars Net、Famundo、CalendarHub、Hunt Calendars、商務使用付費的eStudioCalendar,以及可在自己網站增加行事曆功能的Jotlet、社群、學校、機關團體使用付費的Tr umba⋯等都是雲端服務,網路行事曆除了提供如同一般文書工具軟體的行事曆功能之外,不僅提供使用者可隨時隨地透過網路設定、檢視、提醒個人的行程,亦可開放讓其他人獲知自己的行程狀況,或結合專案管理,進行群組協同處理的工作。

(三)相片管理
  雲端相片管理服務,包括:相片儲存與分享 (如:Flickr、Shutterfly)、相片編修 (如:Adobe Photoshop Express)、個人相簿(如:FotoFlexer、Google Picasa、Phixr、Picnik、Picture2Life,以及需收費但可支援較大圖檔的Snipshot)。以Google的Picasa 為例,它與行事曆功能一樣,有私用及群組分享空間,加上安全性高,因此不僅存放相片還可做為其他用途,例如:當使用具GPS的相機拍攝,當下相機所紀錄的資訊,可進一步結合Google map,Gmail或其它編修功能,紀錄並呈現出相片拍攝地點及相關資訊。

(四)網路桌面(網路OS)
  網路桌面即是網路的OS,提供使用者在任何一部能夠上網的設備,便能透過瀏覽器進入個人的作業系統執行系統內已安裝的服務,而達到了作業系統可攜性的使用彈性,解決傳統上作業系統必須被限制在安裝的電腦設備的不便性。如ajaxWindows、Deskjump、Desktoptwo、eyeOS、G.ho.st、Glide、mivio、Oos、StarForce、YouOS等。網路桌面與一般作業系統的桌面一樣,以Glide為例,它除了提供30G免費空間及內建相片編修軟體外,還可經由付費機制結合其他需求的系統;另外也提供一些類似PowerPoint的簡報軟體,甚至群組會議功能等。但較可惜的是另一個免費資源Deskjump的網站也已消失,提醒了雲端服務的另一個隱憂:公司基於營運獲利的考量,服務可能隨時取消,對於使用該公司服務的個人或機構而言,無論資料是否還能取得,但所需的作業必會受到極大的影響。

(五)辦公室作業
  雲端辦公室作業的應用,包括:文書處理、簡報與試算表(如:Google Docs、Presentations & Spreadsheets、ZohoWriter、Zoho Show、Preezo)及實況播送的會議與簡報 (如:CiscoWebEx )。Microsoft也面臨雲端辦公室作業的需求,推出Microsoft Office Live相關的服務,包括完全相容於Office的Workspace,以及提供成員參與即時會議、訓練課程和活動的會議⋯等。

1.2.3