首頁 | 關於udndata  
關於udndata

  緣起
      聯合知識庫為聯合線上公司於2000年4月籌備,2001年2月19日正式成立的新媒體。聯合報系所發行的聯合報、經濟日報、民生報(民生報資料至2006/11/30止)、聯合晚報及星報(星報資料至2006/10/31止)等五大報在過去五十年來共發行了一百卅萬個報紙版面、一千多萬則新聞、七十餘億個字。這些新聞資產正是台灣民眾過去五十年生活的共同記憶,它不止是文字資料,而是歷史的軌跡與驗證。

    如何將這些重要的社會資產與全體華文社會共享,一直是聯合報系長期以來認真思考的議題,當網際網路普及後藉由數位化的科技,這個理想得以實現。聯合知識庫的成立不僅提供了新聞資料的檢索更衍生了數位典藏歷史的社會責任,活化報系五十年的新聞資料,完整而詳實地呈現台灣近代珍貴史料,累積社會事實,傳遞文化變遷的軌跡,成為新世紀知識的庫藏中心,並提供完善的知識管理工具,落實打造知識社會的基礎工程。

   
  報紙數位化工程
 

    當聯合報系政策決定執行報系五十年來報紙數位化的跨世紀工程時,首先面臨的問題是五十年來報紙的紙質、排版、印刷歷經多次技術革新,且擁有非常龐大的資料量,目前市場上並沒有單一自動化的技術可以滿足報系數位化工程的需求。聯合知識庫整合了多種技術開發出高效率的資料回溯系統,首先委託毅欣公司進行整版掃瞄,再將字體、字型變化較多,電腦不易辨識的標題用人工輸入,接著以圖文切割的方式將報紙版面上的內容分區切塊透過全景軟體公司為聯合知識庫打造的多核心光學影像辨識系統(OCR)將影像檔轉換為文字檔儲存,在此階段文字的正確率已可達到百分之九十八以上,為了提高正確率全景公司還提供集字校對與逐字校對工具,透過兩次「半人工、半自動」的循環校對後正確率提高到百分之九十九點九一。此項龐大的數位化工程除了藉助以上各技術來源外,並由聯合報系印務部及校對中心同仁支援完成。

    聯合知識庫目前提供聯合報系包括已回溯完成聯、經、晚三報;及民(民生報資料至2006/11/30止)、星(星報資料至2006/10/31止)、Upaper等六報共千萬餘則新聞資料。

   
  影像圖片儲存
 

    在多媒體發達的時代,電腦的儲存、記憶體設備,已趨向便宜普及化,使用者的資訊需求也由單純的文字,進而發展至更精緻的圖片,聯合知識庫除了致力於文字資料的回溯之外,也於2004年2月推出影像圖庫的服務,由多位專業的編輯將報系珍貴的照片資料數位化,重新整理分類,提供使用者更多的資訊。未來,影像圖庫的目標則是將聯合報系五十年來的珍貴史料照片,以人工掃描重新整理的方式將之數位化,用圖像的方式更具體呈現出台灣社會、歷史人物的原貌。

    新聞圖庫目前擁有自1990年1月至今的聯合報、經濟日報、民生報(民生報資料至2006/11/30止)、聯合晚報、星報(星報資料至2006/10/31止),所有數位化新聞圖片資料,共計收藏450萬餘張,每張照片都有高畫素,並已取得授權,可作為刊物印刷、網站素材及個人收藏。專題「檔案照片」 則精選自1951年至1970年之數位化新聞照片,約1萬餘張,正持續新增當中。

     
關於我們 | 圖文轉載授權 | 行銷業務| 著作權聲明 | 隱私權聲明 | udndata介紹 | 客服