龍捲風中文搜尋增益集
產品介紹
根據研究報告指出,企業內有93%的資訊是以數位方式儲存,為了有效利用企業儲存的資訊,許多企業使用Microsoft SharePoint Server(MOSS)或Microsoft SQL Server(SQL Server)的搜尋功能來輔助管理公司內部資源。
你大概有過下列的經驗:
- 部份中文字的資料,會因為搜尋時輸入的關鍵字不同而找不到。
- 可能因為沒有輸入正確的關鍵字,或者文件本身寫錯字,想要的文件總是很難被找到。
- 面對繁體資料和簡體資料,總是需要分別進行搜尋,真希望可以只找一次就好。
由於MOSS與SQL Server是以拉丁語系為基礎所設計的產品,面對大量中文資料時,往往因為中文特性與拉丁語系有別而使得搜尋結果有所影響。龍捲風中文搜尋增益集(Tornado Search Center)正是為了解決這樣的問題而生。依據中文字形、音、義的特性,提供符合搜尋需求的多項功能,強化MOSS或SQL Server對中文的檢索能力。
Tornado Search Center適用於有下列需求者:
- 對於MOSS或SQL Server的中文資料搜尋能力有更高的需求
- 擁有大量文件內容包含二種以上語系,特別是繁簡中文混雜者
- 希望搜尋引擎可以更有彈性,能夠自行進行參數調整
產品特色
字詞搜尋彈性切換
- 中文只有字而無詞的界線,因此斷詞效果的好壞,嚴重影響到關鍵字所能查出的結果。龍捲風中文搜尋增益集提供中文字詞彈性切換的方式,讓您在輸入字的同時也可找到詞。
中文同音功能
- 中文字有許多可相互替代的詞彙或同音字。如:【台灣vs.臺灣】、【壹貳參vs.一二三】、【受信vs.授信】等等。透過內建的「中文同音字庫」,可順利解決使用者只知發音而不確定正確字彙,或是臨時忘記字的困擾。
中文同形容錯功能
- 中文字有許多看似相像但意義完全不同的字,如:【遠東 vs. 遠柬】、【掃描vs.埽描】。透過內建的「中文同形字庫」,可順利解決使用者在透過輸入法或將傳真、紙本文件以OCR辨識後產生字形錯誤所帶來的困擾。
中文書寫用語容錯功能
- 基於中文的文字特性,很多專有名詞及詞彙依情況不同,衍生出通用的簡稱,或是文字次序對調。透過龍捲風中文搜尋增益集的語言分析能力,可將使用者輸入的關鍵詞彙以近似詞的方式擴大檢索範圍,找出所有可能相關的資料。
彈性化的搜尋參數調整
- 除了可設定是否提供字、詞、同音、同形容錯功能外,亦可由使用者依照自己對資訊的需求程度,利用「搜尋參數」的方式來達到搜尋的效果。在搜尋時,系統會識別輸入關鍵字中的 「ChiSpec:」(中文搜尋功能) 字串,於其後再套用下列功能參數:
- W:啟用字索引
- H:啟用同音容錯功能
- S:啟用同形容錯功能
- P:啟用詞索引功能
符合中文特性的人性化搜尋介面
- 龍捲風中文搜尋增益集提供一系列可自由置換的人性化搜尋介面,使用者可依照需求全系列使用或是自由組合搜尋介面,功能介面包括:
- 熱門關鍵字:
將使用者所查詢的關鍵字記錄下來以統計熱門關鍵字,並可自訂熱門關鍵字的統計時間區間。 - 簡繁對譯:
自動將使用者所輸入的關鍵字做簡體字和繁體字的轉換,供使用者再次利用轉換結果查詢。 - 建議詞:
根據使用者輸入的關鍵字,提供其他建議的關鍵字。 - 概念延伸詞:
以使用者輸入的關鍵字為基礎分別延伸出相關詞、同音詞、同義詞,並有相對頁面的呈現。 - 智慧型排序:
以使用者所輸入的關鍵字計算出每項搜尋結果的重要性再依其排序。
