龍捲風OCR IFilter增益集

產品介紹

企業每日接收、產生與儲存大量的資訊,為了應用方便,許多企業使用Microsoft SharePoint Server(MOSS)或Microsoft SQL Server(SQL Server)的搜尋功能來輔助管理公司內部資源。然而卻因為MOSS與SQL Server在搜尋功能的限制,造成了企業部份非文字資料的漏失。

你可能遇過下列的情況:

  • 只使用SQL Server的搜尋功能,所以無法找到存放在image欄位中的圖形化文字檔案。
  • 部份中文字的資料,會因為搜尋時輸入的關鍵字不同而找不到了。

龍捲風OCR IFilter增益集(Tornado OCR IFilter Add-in)專為中文字特性設計,強化MOSS或SQL Server對中文搜尋的能力,並提供特殊的圖形解析能力,讓使用者只需將紙本文件的電子檔,如.jpg檔放入MOSS或SQL Server中建立索引,即可在搜尋時查找到文件內容。


Tornado OCR IFilter Add-in適用於有下列需求者:

  1. 企業內部有大量具保存價值的紙本文件,卻苦於不便於管理
  2. 想要將圖形檔案也納入全文檢索的範圍內
  3. 對於MOSS或SQL Server的中文資料搜尋能力有更高的需求



產品特色


支援多種圖形檔案類型

OCR辨識支援PDF、BMP、JPEG、TIFF等四種檔案類型,龍捲風OCR IFilter增益集會擷取這些類型檔案的文字部份,交給搜尋機制以建立索引。

開放OCR辨識參數調整

進行OCR辨識時所採用的語系,可為「繁體中文」、「簡體中文」、「英文」三種,使用者可依所需自行設定語系,但請注意同時只能採用一種語系。
進行OCR辨識時,能依紙本文件語系指定經由OCR辨識得到的文字編碼。可為 GB、BIG5、JIS、S-JIS、GBK 或 KSC,但請注意一次只能採用一種語系。




| More