領域詮釋資料擷取方法及其系統 | 專利查詢

領域詮釋資料擷取方法及其系統


專利類型

發明

專利國別 (專利申請國家)

中華民國

專利申請案號

099106440

專利證號

I 423053

專利獲證名稱

領域詮釋資料擷取方法及其系統

專利所屬機關 (申請機關)

國立暨南國際大學

獲證日期

2014/01/11

技術說明

一種領域詮釋資料(domain metadata)擷取方法,包含下列步驟:A)接收與一領域相關的複數個領域相關網頁;B)分析該等領域相關網頁之網頁語法,以得到複數個第一詮釋資料屬性(attribute);C)基於一統計式語言模型,自該等領域相關網頁得到複數個關鍵片語(keyphrase),並以該等關鍵片語作為複數個第二詮釋資料屬性;D)根據該等第一、二詮釋資料屬性對應至一組都柏林核心集欄位(Dublin Core Field)的結果,由該等領域相關網頁擷取出複數筆領域相關的詮釋資料;以及E)將該等領域相關的詮釋資料輸出至一載體。 A Domain Metadata Extraction Method includes: A) Collect domain-related web pages. B) Analyze the query forms of web pages for extract search parameters as domain attributes. C) A statistical language model for extracting key phrases (as secondary metadata attributes) from domain pages. D) Map domain attributes (steps B and C) into 15 Dublin Core fields and collect domain-related pages from domain sites through querying by attributes. E) Store extracted metadata into storages or databases.

備註

連絡單位 (專責單位/部門名稱)

研究發展處創業育成中心

連絡電話

049-2910960


版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院