搜尋新象
找回企業遺失的紙本文件
隨著時間的進步,企業搜尋能夠支援的檔案格式愈來愈多,除了一般常見的網頁外,支援 Office 與 Acrobat 早已是基本的要求,更進階的包括:郵件、AutoCAD工程圖與Flash動畫檔案…等,這使得企業內能被掌握的資源愈來愈多,但每天會接觸到的紙本文件卻沒有被整合,讓員工不斷地在檔案櫃與掃描圖檔中不斷的翻找。
即使是最先進的企業,紙本文件也未曾少過:供應商傳真來的報價單、往來政府機關溝通的公文、客戶簽回的訂單、訴訟上的證明文件…,每一張都是公司寶貴的資產。過去透過人工尋找文件的方法有著效率低、易出錯與人力成本高的缺點,其實可以透過設計良好的搜尋引擎來解決問題。
龍捲風的最新產品 「Tornado Search 5.0紙本辨識模組」搭配「Tornado Search 5.0搜尋引擎」的使用,提供企業透過以下特色來解決問題:
- 內建 OCR 辨識
企業透過具有數位化紙本功能的各式設備,包括:掃描器、多功能事務機、傳真機等,將影像檔案放至於企業內部的伺服器。「Tornado Search 5.0紙本辨識模組」內建的 OCR 辨識功能,可以對這些影像檔案自動進行後處理,將影像檔案中的圖形文字解析成文字,並直接在 「Tornado Search 5.0 搜尋引擎」中建立索引,讓員工在彈指之間,即可找到所需的紙本文件,相對於以往員工不斷的在檔案櫃與掃描圖檔中不斷翻找的傳統方式,節省了數十倍,甚至上百倍的時間。
- 專利字形容錯技術
OCR 一直是個令企業又愛又恨的文件電子化工具,可快速將影像文件辨識成可再利用的文字,取代了以往企業需要密集人力進行看稿輸入的麻煩;但 OCR 無法 100% 辨識正確,卻又讓企業透過系統尋找辨識完成的文件時,常發生無法找到的窘境。
龍捲風的研發團隊在累積了十年的搜尋技術後,創造出了能補足 OCR 缺憾的專利字形容錯技術。透過此技術,企業無須對 OCR 後的結果進行人工的逐字比對校正,只需按照平常使用搜尋引擎的方式,將想找的關鍵字鍵入,字形容錯功能就會以OCR 可能發生辨識錯誤的字形進行搜尋,確保需要的文件都能夠被找到。
附圖的情境剛好可以說明字形容錯功能的實際運作。使用者想要以關鍵字「請柬」來尋找文件,而系統裡面有三份 OCR 過的文件,兩份為 OCR 正確辨識為「請柬」的文件;一份為 OCR錯誤辨識為「請『東』」的文件。使用一般的搜尋引擎或檔案搜尋方式,僅能找到前兩份正確辨識的文件,而另一份文件會被遺漏,讓使用者無法獲取完整的資訊;反之,「Tornado Search 5.0搜尋引擎」除了能夠搜尋到正確辨識的前兩份資料外,透過字形容錯的技術,將原先查詢的「柬」擴散為「東」、「束」、「朿」等同形字進行搜尋,也能把錯誤辨識為「請『東』」的文件找出來,完整的尋回三份文件。
企業花費相當多的資源與設備把紙本文件電子化後,目的在於文件電子化後方便再利用,替企業創造出更多的價值。倘若無法完整的把所需的文件快速且完整的取出,則文件電子化對企業來說只不過是一筆徒具形式又浪費資源的投資罷了。

龍捲風焦點
MOSS 2007 + 龍捲風OCR IFilter增益集 + MFP
輕鬆做到Green IT 無紙化的系統提供效率又環保
隨著環保意識的提高,Green IT的議題也愈來愈發燒,但是口號喊喊,該如何落實呢?最直接並且立竿見影的方式,就從辨公室的無紙化開始。通常企業每日的營運工作,一定會產出大量的紙本文件,而通常會被企業重視與保留下來的紙本文件,就是最為重要的文件,例如:合約,或是客戶簽合的報價單…...等。這些文件因為具有不可否認性的特質,所以才會以紙本的方式作為保留。而將這類文件達成無紙化最簡單的方法,就是利用MFP描掃紙本文件轉存成圖型檔案。將紙本文件轉為數位化的文件檔案之後,接著就面臨了如何管理此檔案和調用檔案的問題了。
紙本文件面臨的管理難題
文件的儲存、擷取、搜尋與調閱一直是件不容易的作業程序。一但將紙本文件電子化後,就可透過MOSS 2007來管理這些文件,利用MOSS 2007提供的一系列的管理功能對這些文件做到文件與流程管理。而解決了文件管理後,另外的問題就是文件的取得是否精確,以及快速的擷取與調閱,如此才能夠滿足使用者針對即時性的文件需求或臨時性的決策作業,所面臨到的時間問題。一般的使用者取得文件最快的方法,就是利用MOSS 2007提供的全文檢索功能,透過使用者下達關鍵字查詢,以從搜尋結果中取得欲取用的文件,這樣的擷取方式針對容易辨識的文字資料可以獲得解決方案,但是,針對企業內所保留下來的重要紙本文件,MOSS 2007無法解析圖型檔案內的文字,此時又該如何快速調閱呢?
完美解決圖像式檔案的辨識搜尋問題
解決紙本文件搜尋的問題, 龍捲風OCR IFilter增益集提供了一套完整的解決方案。IFilter為MOSS 2007全文檢索在做編目時所採用的資料解析元件,如:欲解析PDF檔案時就必須採用PDF IFilter。而龍捲風OCR IFilter增益集可讓MOSS 2007在做執行全文檢索時,可對圖型檔案做編目,龍捲風OCR IFilter增益集目前支援的檔案格式為:PDF、JPG、BMP、TIF四種,但OCR在中文辨識率一直都是約莫60%~70%,而辨識錯誤的文字就無法被檢出,傳統上來說我們會利用人員校正的方式校正OCR的辨識結果,但如此便會浪費許多的人力與時間,而龍捲風OCR IFilter增益集提供在做搜尋時啟動字形容錯的功能,可解決OCR辨識錯誤的問題。
假設一圖型文件內的文字為「液晶電視」,經由OCR辨識後可能辨識為「液品電視」,如此使用者便無法使用關鍵字「液晶」找到此文件,但若啟動了龍捲風OCR IFilter增益集的同形容錯功能,儘管OCR辨識錯誤,使用者也能利用此功能找出被辨識錯誤的「液品電視」,在不用人力介入的情形下而找到此份文件。利用MOSS 2007 + 龍捲風OCR IFilter增益集 +MFP,在不用浪費多餘人力和時間的情況下就可輕鬆達到辦公室無紙化,真正實踐Green IT節能減碳的精神。

龍捲風活動
龍捲風徵文活動「下載試用奪獎金」評選結果出爐
感謝大家對於龍捲風徵文活動「下載試用奪獎金」的支持與熱烈迴響。目前活動已經圓滿結束,一個月的活動時間共有34位試用下載的徵文稿件加入比賽,試用者的投稿內容創意無限,讓TS 5.0的應用更加無遠弗屆。而比賽結果經由龍捲風科技總經理、技術長、產品經理與技術產品經理的評選後,前三名獎金獲選人已經出爐,在此恭喜所有得獎者!
| 名次 |
得獎者 |
| 第一名 |
藍色小舖帳號:starshine / 汪先生 |
| 第二名 |
藍色小舖帳號:Megan / 鄒先生 |
| 第三名 |
藍色小舖帳號:holdpeace / 張先生 |
| 佳作 |
藍色小舖帳號:小橙 / 廖先生 |
|
藍色小舖帳號:Iven |
|
藍色小舖帳號:Vivid |
|
藍色小舖帳號:夜色光影 |
|
藍色小舖帳號:hy / 游先生 |
|
藍色小舖帳號:Fat |
|
藍色小舖帳號:TeYoU / 黃先生 |
龍捲風科技將會依據各位在藍色小舖的註冊資訊,主動聯絡獲獎者,進行後續獎金頒發事宜。(若一個月內屢次聯絡不到,則視同放棄此項獎金。)
攜手參與IBM 中小企業「逆勢崛起」論壇
龍捲風科技與歐磊科技以知識檢索系統為科技加值
受到世界性經濟景氣循環衰退的負面發展變化,台灣企業也面臨需從高油價、高物價的趨勢,以及微利時代來臨的衝擊下突破困境、脫穎而出,重拾企業藍海的關鍵時期。這正是台灣 IBM 此次力邀企業與學界翹楚共聚一堂,進行『2008 IBM科技加值.中小企業逆勢崛起』論壇的主要原因。此次龍捲風科技特別與其經銷夥伴歐磊科技合作,以 TS 5.0 搜尋解決方案作為參與論壇的主軸,現場除了有解決方案的實機展示之外,也特別在製造業系列的議程討論中,以搜尋解決方案為精神與大家分享「永續經營的資訊運籌」的觀念。