2007年8月29日 星期三

如何使用全文檢索的進階功能?

目前聯合目錄的全文檢索功能提供布林查詢。

  1. 交集查詢: 可使用 AND 將兩個關鍵字以交集查詢,AND 必須為大寫且前後須要以一個空格(Space)相隔。若兩個關鍵字以空格相隔,將會被視為交集查詢。(例:范寬 AND 繪畫)(例:范寬 繪畫)
  2. 聯集查詢: 可使用 OR 將兩個關鍵字以聯集查詢,OR 必須為大寫且前後須要以一個空格(Space)相隔。(例:范寬 OR 郭熙)
  3. 排除查詢: 可使用 NOT 將兩個關鍵字中的後者以排除查詢,NOT 必須為大寫且前後須要以一個空格(Space)相隔。(例:范寬 NOT 郭熙)
  4. 特殊字元查詢: 特殊字元包括 + - && ! ( ) { } [ ] ^ " ~ * ? : \ 等,若要查詢特殊字元請在特殊字元前加上\。例如若要查詢(1+1):2,則為例:\(1\+1\)\:2

格式規範

時間格式規範

一、西曆格式:YYYY-MM-DD
  1. 以「年」、「月」、「日」為順序,中間以「-」連結(ISO 8601);
  2. 如果是西元前,則在年的前面加「-」(如:西元前1000年4月1日,以「-1000-04-01」表示)。
二、中曆格式:朝代,帝號,年號,年,月,日
  1. 可以只填寫朝代,或依次增加其他項目(如只填朝代、帝號、年號)其他空值的部份請以半形逗號「,」隔開;
  2. 朝代名不加「朝」字、「代」字。例如,請直書「秦」,而不用「秦代」或「秦朝」;
  3. 如果有跨朝代的時間或較大範圍的時間,如「秦漢之際」或「先秦」等名詞,請在「朝代」的部份著錄統一的名詞,並且提供完整的明細表。
時代名 西元年
先秦 1100~221 B.C.
秦漢之際 210~202 B.C.
東漢末年 147~220
三、大區間年代:

請提供「時代」與「西元」的對照表

  1. 所謂的大區間年代指的是地質時代、考古時代與定義較模糊的時代而言;
  2. 地質年代的分類為「宙」(EON)、「代」(ERA)、「紀」(PERIOD)、「世」(EPOCH)四層;
  3. 考古年代分為舊石器時代早、中、晚期與新石器時代早、中、晚期,其下不再細分;
  4. 由於學界各家說法不一,請提供各時代的對照表,以便技術人員匯入資料;
  5. 如果時代以「十八世紀上半葉」、「十八世紀中期」等字眼,請另外附表說明「上半葉」或「中期」的定義。

地理格式規範

一、有經緯度位置相關資料者,請在地理位置名稱後填入經緯度座標。

經緯度格式:dd.dddd

範例A:地理位置(東經北緯)

地理位置 幸福村
Xmax 30.0000
Xmin 30.0000
Ymax 35.0000
Ymin 35.0000

範例B:地理區域(西經南緯)

地理位置 快樂國
Xmax -10.0000
Xmin -25.0000
Ymax -5.0000
Ymin -15.0000
  1. 地理位置指的是一個「點」的位置,地理區域則是指一個「範圍」的位置;
  2. 「Xmax」、「Xmin」之「X」為「經度」;「Ymax」、「Ymin」之「Y」為「緯度」;
  3. 「X」「Y」均有正負值。「X」正值為東經,「X」負值為西經;「Y」正值為北緯,「Y」負值為南緯。正值可以不註明,負值請在dd.dddd前面加「-」;
  4. 「Xmax」定義為「經度最大值」,「Xmin」定義為「經度最小值」;「Ymax」、「Ymin」同經度;
  5. 如果是地理位置的話(如範例A),「Xmax」與「Xmin」同值,「Ymax」與「Ymin」同值;
  6. dd.dddd代表經緯度最多可以有四位小數;
  7. 「Xmax」、「Xmin」、「Ymax」、「Ymin」請分別以四個欄位表示。
二、無經緯度位置相關資料者,請提供完整的地名(甚至是地址)。
  1. 由於藏品性質的原因,許多著錄在metadata中的地名是古地名。如有這種情形發生時,請附上該古地名的相關年代,以便未來開發轉換古今地名相關工具;
  2. 如果只有大範圍的地理區,如北大西洋、台灣沿海,希望各計畫能自行定義地理位置,提供經緯度範圍對照表。

匯入一筆完整的資料到聯合目錄

各計畫匯入聯合目錄的資料,以XML(「可擴展標示語言」,eXtensible Markup Language)的方式來表示。一筆完整的資料XML必須包含四個部分:分類架構、對應(聯合目錄所採用的)DC欄位的metadata、至少一張圖檔(或為其他種類型的藏品數位檔,數量上也可接受更多)、可連回原始資料庫的連結。如此才能夠讓資料在聯合目錄上進行分類呈現、使用者對資料內容有大體的認知、具有圖像式的概念、以及能回到原始資料庫閱覽更詳細的內容。
有關聯合目錄所需的數位檔等級,請參見下表:

項目聯合目錄所需數位檔等級
數位影像尺寸為500×500pix以上之JPEG格式檔案。
視訊檔格式為WMV、WMA、flv,320×240/15fps以上,資料傳輸率為150~300Kbps之視訊檔。
音訊檔格式為WMA或MP3,資料傳輸率為64~128Kbps之音訊檔。

匯入方式

目前將藏品摘要資訊匯入聯合目錄共有3種方式:
一、由各計畫直接匯出聯合目錄所需的XML
依照聯合目錄提供的XML格式,由負責維護計畫的系統人員來操作進行匯出資料。推薦具有一般資料庫維護人員的單位採用。
二、由各計畫匯出excel或csv格式的資料表(限公開徵選計畫)。
在考量到部分公開徵選計畫經費與人力皆不充足的情況下,現階段聯合目錄工作小組會評估公開徵選計畫的情形,而接受其提供excel或csv格式的metadata資料表,並在配合相關資料之下,協助公開徵選計畫匯出XML。
三、建立遵循OAI-PMH(Open Archives Initiative -Protocol for Metadata Harvesting)的Data Provider
架設OAI系統可用的data provider,架設完成後,由聯合目錄技術人員到data provider提取資料。這種架構需要雙方的技術人員直接進行溝通,花較多的時間來確認雙方系統之間能自動進行資料匯出、匯入的作業。但完成之後,日後的資料匯入將可自動完成,於未來定期更新資料較為方便。因此推薦長期執行計畫、具有專門技術人員、或有常駐機構能持續維護資料庫的單位採用。

各計畫匯入聯合目錄的步驟

首先由聯合目錄的工作人員確認各個內容單位要如何將典藏系統的Metadata匯出一部份欄位資訊到聯合目錄,產出「資料庫Metadata欄位與DC欄位對應表」範本;原則上各資料庫的展示、欄位,不必因數位典藏聯合目錄而作更動執行方式;
各計畫在聯合目錄的介面上,以何種分類瀏覽方式來呈現,由聯合目錄的工作人員協助進行,並產出「分類目錄清單」;
接著,內容單位與實際執行匯出XML的資訊人員,討論如何由實際的資料庫欄位依據「資料庫Metadata欄位與DC欄位對應表」的規範將聯合目錄XML匯出(並包含分類架構、原始網站及圖檔連結等管理性資訊);
實際匯出XML
由內容單位與工作小組校對檢視XML的格式是否正確,若無誤則完成匯出工作,否則經過修正後重新再匯出。