fjrigjwwe9r0t_Info:InfoContent 未經過規(guī)范化處理的出版資源,即使是以“數字化”形式存在,也只不過是以數字形式存儲的出版資源而已,這類資源很難在數字出版領域中成為可利用的資源并發(fā) 揮其應有的價值。而目前許多傳統(tǒng)出版單位,正熱衷于將其所掌握的出版資源大規(guī)模地進行數字化工作,而這種不按數字出版規(guī)范處理程序進行的數據加工方式,只 能稱其為出版資源的數字化過程,而其產生的后果只能產生大量的數據垃圾,為數字化資源建設造成極大的浪費。 那么,什么樣的資源才能真正成為數字化的出版資源呢?對照上面提出的問題,我想數字化出版資源起碼要具備以下幾個基本要求: 一、 資源的可用性 可用性是指兩個方面,一是資源的版權有效性,即資源經過數字化加工處理后,出版單位對其是否具有版權意義上的使用權。二是資源自身的價值,是否具有一次加工,多次復用價值。 1.版權的有效性 在傳統(tǒng)出版時代,出版單位獲得的大多是專用出版權, 有的甚至只是非專用出版權,而并沒有獲得改編權以及其他載體形式的出版權,特別是對于數字出版最為重要的網絡傳播權。而這些法律上的授權問題如果不能得到 真正解決,即使出版單位花費大量人力、物力和精力將其作品數字化,卻可能面臨數字環(huán)境下運營的合法問題而無法使用。為此,對具有一定價值且需要進行數字化 的資源或已形成數字化的資源需要二次加工的資源,首先要進行版權授權的認證工作,未獲得有效許可的資源是不能進行二次開發(fā)的。 2.可復用性 并非所有的出版資源都具有可復用性,或者是利用復用性不強。在傳統(tǒng)出版資源中,復用性較強的資源有工具書、教材等長銷類產品,其次是以提供數據分析和信息 服務類的數據庫產品,最后是經典讀物以及瀏覽性讀物。對于不同的資源,其數據處理水平及加工要求也各有不同。 工具書、教材 這是數字化出版資源的核心,對這類資源要在完成同類資源 的大規(guī)模集成后,要進行數據的深度標引,并完成查重排歧,才具有可使用的價值。這也是加工難度最大一項工作,其中涉及如何利用計算機技術進行數據挖掘、信 息整理和知識管理、知識服務等數字出版核心技術。 數據分析和信息服務類的數據庫產品 向面某一領域或特定讀者群的非工具 書或教材類的出版資源,其單一資源的可復用性較弱,但大規(guī)模集成后,可形成一定強度的資源庫,通過積累和沉淀,可形成新形態(tài)的信息產品,如清華同方的資源 庫,這類資源是通過大規(guī)模集成之后形成新的衍生性信息消費產品,可滿足新的消費需求,并促進原來產品的發(fā)行與銷售。其可行性關鍵在于集成度和信息提取度。 并非一兩家傳統(tǒng)出版單位可實現的,一般來說,要形成行業(yè)集成才有可能形成有效的規(guī)模產品,支撐產業(yè)的數字閱讀需求。如在集團層面上集成,則專題性的集成度 不足,難以形成有效消費群。 在技術層面上,由于對內容信息需求的多樣性和復雜性,其底層數據結構及信息提取等問題,需要大量數據庫和網絡信息處理的專業(yè)人才,因此,要在基于新的信息消費產業(yè)鏈的基礎上,進行跨媒體、跨部門、跨行業(yè)、跨領域的優(yōu)質資源整合,才可取得成效。 經典性讀物及大眾閱讀性讀物 這類出版物由于其瀏覽性、實效性強、典藏性和資源性相對較弱,因此,大多以在線發(fā)布,順序瀏覽為主,能滿足公眾利用網絡或手機閱讀終端,實現情節(jié)性淺閱讀的基本需求。 二、 資源的可流通性 出版資源的流通性也要多不同的角度來看,一是數據自身的可流通性、二是載體的兼容性、三是內容的需求性。 1.數據的可流通性 要達到在不同載體上一次加工多次利用的目的,首先要解決字符的規(guī)范性問題。而國內目前各出版單位所擁有的“數字化資源”,大多是基于GB18030的字符 集,這個字符集所收漢字263個,難發(fā)滿足出版用字的需求。因此資源中存在大量非標造字,不具有可流通性。要想提高資源的流通性,必須將資源構架的的基礎 上,也就是超大字符集的基礎上,并實現現有資源用字符的五同問題,即:文同字(同字異形的認同))、字同形(同形異構的認同)、形同碼(同形異碼的認 同),碼同位(同字異碼的碼位歸并),符同碼(各類符號系統(tǒng)在符號集中的同一性)。只有在超大字符集的基礎上,解決了五同問題,數據才真正具有可流通性。 2.載體的可兼容性 要想出版資源在不同載體形式上發(fā)布,重點需要解決 不同媒體形態(tài)資源的存儲格式和精度問題。媒體格式一定要采用國際通用標準,如采用非國際標準的企業(yè)格式,將造成載體間兼容性的瓶頸,使得資源無法有效傳播 和利用。精度問題也是數字化資源中存在的一個嚴重問題,特別是圖片資源,往往由于前期采集精度不足,導致可用性大大降低,以至不可用。因此,對具有利用價 值的圖片資源,特別是珍貴資源,要按全張印刷的精度采集,并分層存儲。 3. 內容的需求性 數字出版物的傳播方式是被動傳播,即資源存儲在運營環(huán)境中是靜態(tài)的,如無用戶需求導致的閱讀點擊行為的產生,則根本不可能實現傳播。因此, 閱讀需求越少的內容信息,越不具有可流通性,要提高資源的流通性,就要認真解決在網絡環(huán)境下讀者需求的動態(tài)采集和用戶需求的定性量化分析,只有解決了需求 描述和描述機制,才能真正做到按需定制,按需生產、按需加工、按需提供,才能真正提高資源的流通性和可用性。 三、可獲取性 由于數字環(huán)境下的資源是以靜態(tài)的形式存在,如何有效地將資源組織起來以 便于讀者的查詢和檢索,如何類聚地提供信息和內容、如何基于用戶的認智規(guī)律,拓展性地組織和關聯信息,并有效地利用多種媒體形態(tài),綜合藝術地動態(tài)推送展示 內容,是提高靜態(tài)內容的動態(tài)流動性所必須解決的問題。 四、可維護性 數字出版資源的特點之一是可不斷地對資源進行動態(tài)地更新維護,以滿足和 響應不同用戶群體的閱讀需求。因此,能否建立起一支強大的,具有強大的信息利用和處理能力的編輯隊伍,不斷對資源進行更新和維護,才是使資源具有生命力和 可持續(xù)展發(fā)生命力最為核心的問題,一個資源如不能及時更新和補充,則需求就會枯竭,用戶就會消失,資源本身的價值就會下降甚至消亡。
|