領域詮釋資料擷取方法及其系統 | 專利查詢 | 國科會計畫補助科研產業化平台

專利類型

發明

專利國別 (專利申請國家)

中華民國

專利申請案號

099106440

專利證號

I 423053

專利獲證名稱

領域詮釋資料擷取方法及其系統

專利所屬機關 (申請機關)

國立暨南國際大學

獲證日期

2014/01/11

技術說明

一種領域詮釋資料（domain metadata）擷取方法，包含下列步驟：A）接收與一領域相關的複數個領域相關網頁；B）分析該等領域相關網頁之網頁語法，以得到複數個第一詮釋資料屬性（attribute）；C）基於一統計式語言模型，自該等領域相關網頁得到複數個關鍵片語（keyphrase），並以該等關鍵片語作為複數個第二詮釋資料屬性；D）根據該等第一、二詮釋資料屬性對應至一組都柏林核心集欄位（Dublin Core Field）的結果，由該等領域相關網頁擷取出複數筆領域相關的詮釋資料；以及E）將該等領域相關的詮釋資料輸出至一載體。 A Domain Metadata Extraction Method includes: A) Collect domain-related web pages. B) Analyze the query forms of web pages for extract search parameters as domain attributes. C) A statistical language model for extracting key phrases (as secondary metadata attributes) from domain pages. D) Map domain attributes (steps B and C) into 15 Dublin Core fields and collect domain-related pages from domain sites through querying by attributes. E) Store extracted metadata into storages or databases.

備註

連絡單位 (專責單位/部門名稱)

研究發展處創業育成中心

連絡電話

049-2910960

網址

http://www.rnd.ncnu.edu.tw/incubator