fjrigjwwe9r0t_Info:InfoContent 一、內容管理的概念
隨著數(shù)字出版技術的迅猛發(fā)展,繼ERP之后,與出版行業(yè)關系更為密切、也更被出版行業(yè)所關注的是CM,即內容管理(Content Management),也叫數(shù)字內容管理。歐盟“Info2000計劃”中把內容產(chǎn)業(yè)的主體定義為“那些制造、開發(fā)、包裝和銷售信息產(chǎn)品及其服務的產(chǎn)業(yè)。”內容產(chǎn)業(yè)的范圍包括各種媒介上所傳播的印刷品內容(報紙、書籍、雜志等),音像電子出版物內容(聯(lián)機數(shù)據(jù)庫、音像制品、電子游戲等)、影視傳播內容 (電視、錄像、廣播和影院)等。
對于內容管理,目前尚無統(tǒng)一定義。一般認為它包括這樣幾個方面:網(wǎng)站內容管理、出版(或媒體)內容管理、企業(yè)內容管理等。同時,內容管理還廣泛應用于數(shù)字資產(chǎn)管理(DAM)、電子政務、數(shù)字圖書館、企業(yè)信息門戶(EIP)等。鑒于本文的研究領域,本文所說的內容管理是指出版物的內容管理,也可以稱為狹義的“知識管理”。
由于出版物不同與其他產(chǎn)品,出版物具有知識內容,是純粹的內容產(chǎn)品,因此內容管理在出版業(yè),意味著對產(chǎn)品內容的統(tǒng)一管理。包括對圖書、雜志、報紙、音像、電子產(chǎn)品內容的管理。隨著跨媒體出版的日益臨近,內容管理對出版單位變得尤為重要。今后的出版,肯定要突破單一媒體形式,出版社將演變?yōu)閮热萏峁┥?Content Providers),對內容一次加工完成,以不同媒體形式出版――紙質媒體、光介質媒體、網(wǎng)絡媒體、移動媒體等,這是一個方向,這也就是所謂的跨媒體出版。
因此可以說,內容管理的目的是把非結構化的出版信息,制作成圖書、報刊、光盤、網(wǎng)頁等產(chǎn)品,供用戶以各種媒體形式進行閱讀、檢索、查詢、分析和共享。在這種形式下,傳統(tǒng)的讀者(Readers)或受眾(audience),逐漸演變?yōu)閮热菹M者(Content Consumers) ,因此內容管理解決方案必須為出版社的知識產(chǎn)品提供從原創(chuàng),到編輯加工,到生產(chǎn)制作,到傳輸發(fā)布,再到閱讀消費等的一體化服務。
內容管理不是某種單獨技術的創(chuàng)新,而是許多先進技術的綜合應用。套用現(xiàn)在流行的用語,就叫“集成創(chuàng)新”。內容管理解決方案重點解決各種非結構化或半結構化的數(shù)字資源的采集、管理、利用、傳遞和增值,并能有機集成到結構化數(shù)據(jù)的商業(yè)智能(BI)環(huán)境中,如ERP,CRM等。
二、內容管理的幾個關鍵技術
1.信息檢索技術:信息檢索技術包括信息的分類、標引、檢索、評價、反饋等過程。從歷史上看,信息檢索經(jīng)歷了手工檢索、計算機檢索到目前網(wǎng)絡化、智能化檢索等多個發(fā)展階段。隨著互聯(lián)網(wǎng)的發(fā)展,信息檢索技術向3W的搜索引擎方向發(fā)展。目前最前沿的信息檢索技術包括以下幾個方面:關鍵詞檢索(全文檢索)、分類導航檢索、同義詞(異構詞)檢索、聚類信息檢索、截詞檢索、精確檢索、字段檢索、網(wǎng)站超鏈檢索、庫間跳轉檢索、多庫同時檢索、布爾檢索、數(shù)字檢索、二次檢索(多次逼近檢索)、自動分詞、自然語言檢索、定題檢索、手機檢索等。出版物內容管理面對的是出版單位的大量文稿數(shù)據(jù),在文稿的整理入庫過程中,必須使用先進的信息檢索技術對文稿進行分類、標引、重組,進而建立出版物內容的知識庫體系。
2.數(shù)據(jù)庫技術:目前市場上流行的大型數(shù)據(jù)庫產(chǎn)品有:DB2、Informix、SQL Server、Oracle、Sybase、MySql等。有別于小型數(shù)據(jù)庫,大型數(shù)據(jù)庫系統(tǒng)在功能、安全性和擴展性方面提供了更好的解決方案。以 Oracle數(shù)據(jù)庫為例,目前的Oracle數(shù)據(jù)庫,在合理規(guī)劃下,數(shù)據(jù)大小理論上可以無限。所謂合理規(guī)劃包括:數(shù)據(jù)文件限制與操作系統(tǒng)的文件大小、數(shù)據(jù)庫的表容量、每個表的最大數(shù)據(jù)量等的設計,具體容量是數(shù)據(jù)庫設計后的計算值。正是因為有了這樣成熟的數(shù)據(jù)庫技術,使出版單位的海量文稿信息的異地存儲、檢索、導入、導出、修改成為可能。
3.數(shù)據(jù)挖掘技術:數(shù)據(jù)挖掘(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。隨著信息技術的高速發(fā)展,出版單位積累的數(shù)據(jù)量急劇增長,如何從海量數(shù)據(jù)中提取有用知識成為當務之急。在內容管理系統(tǒng)中,出版單位可定制目錄或位置,由數(shù)據(jù)挖掘器自動判斷該位置數(shù)據(jù)內容的變化,根據(jù)判斷結果自動對新數(shù)據(jù)進行入庫處理。
4.動態(tài)集群網(wǎng)絡技術(Power-All Networks):對于出版單位所具有的信息存儲和跨媒體出版特點來說,傳統(tǒng)的服務器設備和網(wǎng)絡環(huán)境已完全能夠滿足需求。本文在此僅僅是介紹一種新的更廉價、更集成的硬件技術,即“動態(tài)集群網(wǎng)絡技術”。所謂動態(tài)集群網(wǎng)絡技術,就是把整個局域網(wǎng)或多個局域網(wǎng)(每個局域網(wǎng)中的單個和多個硬件)壓縮成一個單一的物理部件,由一個物理硬件系統(tǒng)來執(zhí)行多元動態(tài),形成動態(tài)網(wǎng)絡。在動態(tài)網(wǎng)絡中,軟件會仿效局域網(wǎng)或多個局域網(wǎng)的單獨組件。由于這種動態(tài)集群服務器將 Web、Mail、VPN、RADIUS、IDS等多類服務集合于一體,使購買和維護成本大幅下降。這種服務器在存儲管理上,可以存儲容量超過 1PB(1000TB)的上萬億個文件。
三、編輯流程的數(shù)字化
與內容管理密切相關的是編輯流程管理的數(shù)字化,包括出版物選題策劃的數(shù)字化、報刊采編系統(tǒng)的數(shù)字化、編務管理的數(shù)字化、審批管理(三審、三校、專家外審)的數(shù)字化、稿費管理的數(shù)字化等。
無論選題策劃還是編輯加工,都離不開統(tǒng)一的數(shù)字化平臺。因此編輯管理的核心是編輯流程的數(shù)字化。編輯流程的數(shù)字化是指編輯人員在軟件中,實現(xiàn)從選題的申報、采編計劃的提出,到來稿的登記、編輯加工、校對、審批,再到稿件的發(fā)排、發(fā)布、生成紙質媒體、光介質媒體、網(wǎng)絡媒體,以及稿費的發(fā)放等的全業(yè)務環(huán)節(jié)的數(shù)字化管理。這其中,包括許多細節(jié)的內容,僅以選題申報單為例,其主要字段就包括稿件類型、稿件來源、稿件語種、征訂方式、發(fā)行渠道、發(fā)貨方式、目標讀者、資助金額、復制數(shù)量、成本預算、盈虧預測、建議單價、建議總價、復制數(shù)量、裝幀設計、著譯者簡介、預計交稿時間、預計發(fā)稿量、預計出版時間等。
在編輯流程管理中,編輯還可以通過主題詞標引軟件快速對稿件進行標引,這比手工操作,既快捷又準確。
編務管理的數(shù)字化,則包括編務人員在軟件中對通過的選題進度實時監(jiān)控,對發(fā)稿計劃、出版計劃、書號分配、樣書(樣刊、樣盤)及稿件檔案等進行管理,對稿酬發(fā)放、版權合同等進行管理,對編輯工作量進行統(tǒng)計等。
編輯加工數(shù)字化后,編輯可以通過軟件提供的編輯器和流程管理系統(tǒng),對稿件進行編輯處理。這包括對原稿的編輯加工,也包括對排好版式的大樣文件進行編輯審核和校對。每一流程執(zhí)行完畢,自動進入下一流程。每位編輯均可直接在稿件上進行修改,撰寫審讀意見,軟件會通過不同顏色的設置來標志不同的審稿級別,并自動記錄稿件加工痕跡。已送交審批的稿件,原則上本級不再能對其進行修改。到主編或總編輯終審完畢,可進入到發(fā)排、數(shù)據(jù)庫生成、網(wǎng)上發(fā)布等環(huán)節(jié)。
如果是B/S系統(tǒng)的軟件,編輯還可以實施遠程審稿、遠程返修、遠程退稿等功能。遠程管理完全按權限執(zhí)行,系統(tǒng)中設置什么級別的權限,編輯就按什么級別的權限處理稿件,如一審、二審、三審等。即使是發(fā)排和輸出膠片,亦可通過軟件的遠程功能,將排好的稿件傳送到印刷廠,由其輸出膠片并照相付印。
出版集團內容管理的技術平臺應該是一個專業(yè)性很強的高性能數(shù)據(jù)庫管理系統(tǒng),是構架在功能強大的、高性能的內容管理平臺之上的應用系統(tǒng)。其采編平臺、加工平臺、分銷平臺等可提供強大的數(shù)據(jù)采集和加工模塊、信息存儲及管理模塊、信息檢索和發(fā)布模塊等,并且擁有強大的工作流引擎。
四、跨媒體出版
從傳統(tǒng)出版?zhèn)髅綐I(yè)看,其經(jīng)營的產(chǎn)品一般都是單一媒體,如圖書、雜志、報紙、音像、電視等。2000年前的互聯(lián)網(wǎng)也僅僅是以單一的“第四媒體”形式出現(xiàn)。但今天,數(shù)字技術改變了一切。隨著內容產(chǎn)業(yè)和內容管理戰(zhàn)略的實施,跨媒體已成為出版?zhèn)髅綐I(yè)的大勢所趨。所謂跨媒體,即橫跨平面媒體(書、報、刊) 、電子音像媒體(CD-ROM,VCD,DVD)、網(wǎng)絡媒體(WebsITe)、甚至分銷渠道(Distributing channel)等的多媒體、多渠道平臺。目前,國際市場上,新聞集團、貝塔斯曼集團、迪斯尼集團等傳媒巨鱷均在通過收購、合并等方式向跨媒體進發(fā)。國內的TOM集團、中信集團、和訊網(wǎng)等也都在向跨媒體進軍。從目前這些跨媒體集團的形成來看,尚處于資本組建階段,還不能形成統(tǒng)一的將所有業(yè)務整合在一起的跨媒體出版平臺。為此,國外著名的技術提供商,如Adobe提出了Network Publishing(網(wǎng)絡出版)的戰(zhàn)略,而Quark則提出了Active Publishing Server(分布式出版)的計劃。
|