數位遺產保存的兩大挑戰

洪朝貴

(本文刊載於 科學月刊)

「想像數位考古學家在逐漸暖化的冰原裡發現廿一世紀古文明所遺留下來的資料中心。 他們四處看看, 找到一些零星的英文網頁遺跡。 然後定神一看, 發現資料裡竟然有完整的挪威文學。 突然之間, 廿一世紀的挪威之於廿七世紀的人類, 就像希臘之於文藝復興。 各處的太空殖民地競相以挪威名字命名他們的小孩。 人類新的家園行星上面的首都將命名為奧斯陸。」

聯合國教科文組織 (UNESCO) 在 『Concept of Digital Heritage』 一文當中如此解釋 數位遺產 (Digital Heritage)

數位遺產就是那些 「值得為未來世代保存的、 有長遠價值的電腦產生物」。 數位遺產來自諸多社群/產業/專業領域/地域。 並非所有數位內容都值得長久保存, 但如果我們希望維護數位遺產的連續性, 那麼就應該採取積極的措施來保護其中那些值得長久保存的部分。

我們這個世代所創作的數位遺產, 能否成為未來世代欣賞/研究/評論/紀念/接受啟發/尋求靈感的來源? 想要保留數位遺產, 有許多困難需要克服。 其中至少有兩大待解問題挑戰著社會整體的共識, 不是文化圖資保存單位投入一些資源就能解決的。

一、 法律

從物理的角度來看, 數位遺產較諸其他實體的文化遺產 (例如雕刻、 建築、 手工藝品、 ...) 更容易保存 -- 數位內容很容易零瑕疵無限量複製備份。 又例如電視及廣播等等類比技術所呈現的人類文化遺產, 技術上很容易將之數位化、 複製保存。 但是人類自創的法律卻讓數位遺產保存困難重重。

哈佛大學法學教授 Lawrence Lessig 在他的名著 『自由文化』 一書 ("Collectors" 一章) 當中提醒大家:

儘管廿世紀的文化 (幾乎) 是由電視所呈現的, 今天卻僅有一小部分能夠讓大眾看得見。

類比內容的複製雖然會有一點失真, 但相較於實體文物的複製, 還是簡單很多。 一旦將之轉為數位內容, 第二次以後的複製就不會進一步失真。 但是...

為什麼我們的文化如果記錄在報紙上, 就可以永久保存; 但如果記錄在影片上則不然? 我們怎麼會把世界搞成這樣: 學者研究 「媒體如何影響十九世紀美國」 會比研究 「媒體如何影響廿世紀美國」 要來得更容易?

挪威國立圖書館計畫在2020年之前 將館內所有挪威文書籍數位化, 不論著作權年限是否過期。 (『digitize norwegian books』) 本文首段的科幻場景, 其實就是 The Atlantic 編輯在報導此新聞時對大眾的提醒。 在全球的層次, Internet Archvie / Wayback Machine 計畫試圖每隔一段時間就對全球所有網站進行快照備份。 但是這些計畫都要面對國內及國際智財保護團體的反對。 尤其是美國正透過 「自由貿易協訂」 的外包裝, 強力對各國推動 『侵權的 TPP』 等等強化智財管制的法案, 對於數位遺產保存意識的推動極為不利。

二、 檔案格式

廠商用封閉的檔案格式綁架消費者, 提高 "Barrier of Exit", 原本的目的是為了長期賺消費者的錢; 但它也可能造成數位遺產保存不易的副作用。 昇陽公司創辦人之一 Scott McNealy 在他的演講當中, 用幾個淺顯的例子解釋這個道理:

... 一旦你開始採用 DB2 的語言, 拿它來開發你所有的應用軟體、 訓練你的員工、 開發相關的輔助工具、 ... 你開始把你所有的資料鎖進一個私有專屬的語言, 而這種語言的字典/文法/教科書/...的鑰匙完全掌握在 IBM 的手上。 然後你就玩完了。

這段六分鐘的精采演講的中譯版 『下賊船的代價』 不僅值得所有資訊長參考, 對於數位遺產保存工作者更具有重大的啟發。

這些綁架消費者資料的技術措施經常以 『遙控數位枷鎖』 (Digital Rights Management) 的形式出現。 再加上廠商的 『計畫性報廢』 策略 (例如 MS Office 格式每幾年改變一次以便刺激消費、 強迫升級) 這個格式一旦被廠商淘汰, 數位遺產保存工作者可能就必須一次轉換成千上萬的許多文件。 即使有能力自行開發軟體、 克服這些技術路障, 也必須面臨 『DMCA Anti-Circumvention Provision』 (反規避條款) 的法律層面打壓。

檔案格式的專利同樣也成為數位遺產工作者的法律路障 -- 例如微軟的 docx 格式就有 『ooxml patent』 這樣的疑慮。

所以英國的 Digital Curation Center 在 FAQ (常問問題集) 裡面, 很清楚地解釋了開放檔案格式及開放原始碼軟體對於數位資料常久保存的重要性。

然而今日社會整體 -- 包含各大學及政府機關 -- 所偏好採用的存檔技術, 經常欠缺這種考量。 筆者曾試圖以 『永續經營的資訊政策宣言』 喚醒大眾重視此議題, 可惜沒有成效。

三、 推薦閱讀及結語

除了本文所關注的兩大問題之外, 尚有其他替代技術、 國家政策、 管理規畫... 等等更多面向的議題無法提及。 以下是一些推薦閱讀。

早在 1995 年前後, 美國就曾聚集了業者、 博物館、 圖書館、 學界、 政府等等各界人士共同研究, 由 Garrett 與 Waters 等人共同撰寫了一篇報告: 『Preserving Digital Information』 , 對於數位內容的保存, 提出許多架構性的宏觀建議。 例如報告當中指出底層軟硬體載具必然會更迭, 因此數位內容的 「遷移」 (migration) 很重要。

對於從事數位遺產保留的工作人員而言, 澳洲國家圖書館 (National Library of Australia) 的 『Digital Preservation Overview』 頁面是一個很好的閱讀起點。 不只是概觀層次的規畫值得參考, 也有一些連結指向具體的技術資訊, 例如記錄各種硬體儲存媒體的百科全書 『Mediapedia』

數位遺產的重點不在於創造產值; 就算它有產值, 受惠者也是未來世代。 數位遺產的重點在於文化價值、 在於向後世及其他國家宣揚我們這個時空這個小島的文化。 今日的臺灣, 多數政策圍繞著 (幫少數人而不是幫大眾) 「拼經濟」 的思維而設計, 以致出現 『故宮鼓勵作古先人爬出墳墓繼續創作』 的荒謬 "文化資產保護" 政策。 想要實現數位遺產的保存與發揚光大, 改變這個價值觀或許才是臺灣社會所面臨的最大第零步挑戰。

(請以文中 『關鍵詞』 搜尋更多參考資料)