媒體資料庫平台 ─ 聯合知識庫之概況與展望
•聯合知識庫

概述

2001年上線的聯合知識庫,包含聯合報、經濟日報、民生報、聯合晚報、星報、UPAPER、歐洲日報、北美世界日報資料內容縱深57年,目前已逾970萬筆新聞、350萬張圖片、150萬頁全版影像,可提供全文檢索、欄位條件查詢、專卷、剪報等資料庫服務,是全球最大的繁體中文新聞資料庫。到目前為止,聯合知識庫歷史新聞的回溯,民生報部分還未全部完成。

除了聯合報系新聞,聯合知識庫並建置跨媒體資料庫平台,整合台灣優質雜誌媒體內容。目前已陸續加入聯合知識庫的雜誌及內容年份,包括商業周刊12年、遠見雜誌21年、動腦雜誌30年、天下雜誌26年、康健雜誌8年、Cheers9年、科學人雜誌 7 年。15種媒體刊物、近千萬筆的新聞報導、評論,鳥瞰台灣微觀刻畫出逾半世紀的政局變遷、財經發展、社會演化、風土民情、商管職場、個人健康教養等各類訊息知識,一應俱全,並隨紙

聯合知識庫資料概況

出處

起迄日期

資料筆數

聯合報

1951-09-16 迄今

424萬筆

經濟日報

1967-04-20 迄今

270萬筆

民生報

1988-01-01∼2006-11-30

147萬筆

聯合晚報

1988-02-22 迄今

92萬筆

Upaper

2007-03-26 迄今

18590筆

星報

1999-09-01∼2006-10-31

18萬筆

美洲世界日報

2000-02-23 迄今

9萬筆

歐洲日報

2000-02-01 迄今

12萬筆

動腦雜誌

1977-07-05 迄今

9422筆

科學人雜誌

2002-01-01 迄今

2608筆

遠見雜誌

1986-07-01 迄今

12216筆

商業周刊

1995-06-26 迄今

11543筆

天下雜誌

1981-06-01 迄今

15474筆

康健雜誌

1998-09-01 迄今

4430筆

Cheers雜誌

2000-10-01 迄今

4187筆

2008.04.29

本出版持續更新。利用聯合知識庫平台,使用者以一組關鍵字串檢索,即可同時蒐羅多種不同媒體專業內容,並可利用剪報夾分類管理,堪稱知識數位管理之利器。

功能

聯合知識庫除了一般資料庫的全文檢索功能,還有媒體資料庫特有的特定欄位(例如版名、標題等等)查詢。另外還有可在編輯精選的專卷中查詢,以及提供使用者知識管理的剪報功能。相關功能簡述如下:

1 、全文檢索功能與欄位查詢:

全文檢索是聯合知識庫的基本功能,利用多主機、多核心、分散式的運算,平行處理機制,能打破鉅量資料的建庫及檢索瓶頸,快速地回應查詢結果。聯合知識庫全文檢索可設定查詢條件,包括資料的日期範圍、來源及選擇查詢結果的呈現形式、呈現筆數及排序方式,更提供特定欄位搜尋;使用者可針對標題、版名、版次來做查詢,還提供智慧查詢的工具,協助您快速找到精準的資料。下列查詢技巧可供您參考:

(1) and、or、not布林運算
聯合知識庫的查詢系統,可利用and(+)、or(/)、not(-) 這三個運算元做布林運算以協助資料搜尋;用 and 可加強精密度,用 or 可增加廣度,用 not 則可排除特定條件。舉例來說:
and的用法:查詢包含「單車」與「環島」同時出現的文章,您可用
「單車+環島」或「單車and環島」或「單車 環島」或「單車AND環島」
or的用法:查詢所有和「單車」相關的新聞,您可用 「單車/自行車/腳踏車/鐵馬/孔明車/卡打車」或「單車or自行車or腳踏車or鐵馬or孔明車or卡打車」
not的用法:查詢「自行車」但不要「電動自行車」的資料,您可用「自行車-電動自行車」或「自行車not電動自行車」
and、or、not布林運算的綜合應用:查詢「單車環島」或「橫越台灣」或「橫越中國」或「橫越美國」的相關資料:
(單車/自行車/腳踏車/鐵馬/孔明車/卡打車)+(環島/橫越台灣/橫越中國/橫越美國)
   
(2)縮小範圍查詢:
以輸入檢索字串的方法來查詢,常會查到動輒數千筆甚至上萬筆的資料,此時建議您「縮小查詢的範圍」,找到更精準的資料:
以專門用語取代一般用語做為檢索詞。
縮小查詢日期範圍。
用布林運算來增加查詢資料的精密度。
以智慧查詢縮小查詢範圍,可以用進階查詢、相關詞、相關分類、相關專卷任選一種查詢方式來縮小查詢的範圍。
   
(3)特定欄位查詢:
聯合知識庫收納聯合報系新聞,除了全文檢索,還可依報紙特性對欄位(報紙名稱、標題、內文、作者、版面名稱、見報日期等)下條件檢索。例如要查某日某個個版面的新聞,並沒有共同的主題,或查到的資料太多想要更精準的結果,都使用特定欄位查詢:
標題查詢:通常查詢名人新聞時,因名人見報率很高,內文有帶到他名字的新聞都會被查出,內容就顯得較雜亂;此時如果我們只查標題有提到名字的新聞,則會出現內容較精準的資料。例如要查王建民的資料,我們可以用:標題=(建民/阿民/建仔/小王)+王建民,為檢索條件來查詢。
版名查詢:如果要查看某一版全部的新聞,可以用版名查詢的方式一網打盡。例如:版名=教育。我們也可以用版名做為新聞分類的一種方式,例如我們想查出高血壓有關醫療保健方面的知識,就可以用:標題=高血壓+版名=(健康/健康平台/醫藥新聞/健康生活/身•性•靈/醫學探針/彩經.身性靈/醫藥保健/杏林天地),為檢索條件來查詢。
版次查詢:例如聯合報、經濟日報、聯合晚報的頭版版次均為A1,所以如果需要查詢各報頭版的新聞內容,我們就可以用「版次=A1」的方式來查詢。
以特定欄位查詢時" = "左邊代表欄位名稱、右邊代表要找的內容,如果要找的字串是兩個以上,或者要做andornot的運算組合的時候,需在檢索字串前後加上 " ( ) " ,這樣才能找到所需的正確資料;在做版名、版次特定欄位搜尋時,輸入的版名、版次一定要完全正確,才查詢得到資料。
   
(4)萬用字元查詢:
在聯合知識庫的查詢系統中," ? "代表萬用字元, 例如在搜尋字串中輸入「減?茶」查詢可找出減脂茶、減肥茶、減腹茶...等,所有"減"在前、"茶"在後,並相距一個字的詞所有的文章都會被找出來。
   
(5)智慧查詢:
您在設定好檢索詞、日期範圍、資料來源…後按下「智慧查詢」即可到智慧查詢包括以下四種查詢方式:
    進階查詢:可以用一個或數個「檢索字串」對所有欄位或特定欄位(標題、版名)查詢,並可加上「and」、「or」、「not」等布林運算來鎖定查詢的範圍。目前我們提供三個可輸入搜尋字串的欄位,其中第一個欄位會把您在「字串檢索區」所下的「搜尋字串」載入對所有欄位進行搜尋,第二、三個欄位則可對特定欄位搜尋,如果您覺得仍不敷使用您可在每一欄位中再以「+、/、-」(以上符號請以半形輸入)代表「and、or、not」來下「搜尋字串」。
    相關詞:系統會自動分析出與您所下的「搜尋字串」相關的詞彙,透過相關詞的點選(可複選)可以幫助您,找到特定角度的資料。
相關分類:這項功能是系統可以幫助您將您所下的「搜尋字串」自動分析出許多細項的群組,或相關的群組,方便您縮小查詢的範圍,也提醒您一些不同角度的思考。
相關專卷:聯合知識庫的工作同仁會做好一些專卷供您查詢,在您鍵入「搜尋字串」時,系統便會自動的帶出相關的專卷,如果其中正好有您所需的資訊,您便可直接閱讀專卷,以節省您尋找資料的時間。

2、專卷查詢

聯合知識庫內有依人物、新聞議題製作的專卷,可提供比一般檢索更精確的資料。使用者透過可模糊比對的「卷名字串搜尋」或用「專卷分類表」逐層瀏覽,可以輕易找到想閱讀的專卷。例如:「人物側寫」或「財經人物」專卷是編輯精選的人物新聞,使用者在專卷內在「縮小範圍查詢」欄內輸入姓名,找到紹該人物的報導就不會像全文檢索那麼龐雜。

專卷還提供最新推薦及熱門專卷供使用者參考。專卷並提供個人化服務,讓使用者收藏最愛專卷,便於日後檢閱。

3、圖庫查詢

聯合知識庫影像圖庫典藏超過300萬張聯合報系見報、未見報新聞照片,及中國圖片庫的大陸風光圖片,提供使用者查詢,申請使用授權。使用者可以做圖說的全文檢索,或透過分類來瀏覽照片。聯合知識庫圖庫也製作影像專題,同樣可用卷名查詢與分類查詢檢索。影像圖庫內容包含了RGB及CMYK兩種格式的圖片,讓使用者可依不同需要選擇。

4、我的剪報及自動剪報系統

「我的剪報」是一項個人化資料管理工具,讓您將自己感興趣的議題資訊存在自己的網路剪報夾中,方便您隨時閱覽。剪報夾除了可以「新增」,還提供「分卷」、「刪除」、「更名」等管理功能。

自動剪報系統專為企業會員打造,可以多人使用。聯合知識庫企業會員管理者可以設定檢索策略,每日兩次新聞進庫後,系統透過設定好的檢索策略,自動匯入符合條件的新聞到剪報夾,企業會員只需打開剪報夾就可閱讀新聞,不需要每次重新設定檢索條件撈取資料。自動剪報系統還可寄出剪報的新聞信到訂 者的電子信箱,堪稱兼具人工智慧的數位助理。

「我的新聞信」功能近似自動剪報系統,但是專屬個人會員可以採購的服務。


進階應用.付費概況>>