發明
中華民國
099106440
I 423053
領域詮釋資料擷取方法及其系統
國立暨南國際大學
2014/01/11
一種領域詮釋資料(domain metadata)擷取方法,包含下列步驟:A)接收與一領域相關的複數個領域相關網頁;B)分析該等領域相關網頁之網頁語法,以得到複數個第一詮釋資料屬性(attribute);C)基於一統計式語言模型,自該等領域相關網頁得到複數個關鍵片語(keyphrase),並以該等關鍵片語作為複數個第二詮釋資料屬性;D)根據該等第一、二詮釋資料屬性對應至一組都柏林核心集欄位(Dublin Core Field)的結果,由該等領域相關網頁擷取出複數筆領域相關的詮釋資料;以及E)將該等領域相關的詮釋資料輸出至一載體。 A Domain Metadata Extraction Method includes: A) Collect domain-related web pages. B) Analyze the query forms of web pages for extract search parameters as domain attributes. C) A statistical language model for extracting key phrases (as secondary metadata attributes) from domain pages. D) Map domain attributes (steps B and C) into 15 Dublin Core fields and collect domain-related pages from domain sites through querying by attributes. E) Store extracted metadata into storages or databases.
研究發展處創業育成中心
049-2910960
版權所有 © 國家科學及技術委員會 National Science and Technology Council All Rights Reserved.
建議使用IE 11或以上版本瀏覽器,最佳瀏覽解析度為1024x768以上|政府網站資料開放宣告
主辦單位:國家科學及技術委員會 執行單位:台灣經濟研究院 網站維護:台灣經濟研究院