搜尋新象
監控敏感資料,確保公司知識財產安全
由於資料外洩對企業的影響甚鉅,且大多數是由內部人員流出,近兩年來對應資料外洩防護(DLP, Data Loss Prevention)的方案也如雨後春筍般不斷地被提出。傳統DLP的施行是以限制人員對不同機密層級的文件擁有不同的存取動作的方式,避免敏感資料隨意透過各式外接儲存媒體、通訊軟體或E-mail傳送至企業以外的地方。但內部人員還是可能透過符合授權的方式讀取檔案,再使用相機或含有相機功能的手機對螢幕進行拍攝,存放於自己的電腦並透過網路向外發送,這是傳統的DLP 無法攔截的行為。
龍捲風搜尋引擎對字詞強大的處理能力,最適合用來監控企業內部的各種不當內容。管理者可透過整合龍捲風搜尋引擎的監控程式,將企業認為敏感或不當的內容特徵進行設定,讓監控程式自動對企業內部的資訊設備內容進行掃描,主要可監控以下兩類內容:
- 電子文檔
企業內部的MS Office與Adobe Acrobat 文件最常被用來記錄公司內部的各式資訊,內部成員可能因為方便或其他惡意的原因複製一份在自己的電腦中,或者擺放在主機內共享的區域,增加資料外洩的風險。
管理者可在整合龍捲風搜尋引擎的監控程式內定義所謂的監控條件,像是在基層員工的電腦內監控「機密」、「客戶個人資料」等資訊;在共享區域監控「限內部閱讀」、「限個人閱讀」等資訊。監控程式將依據管理者的設定,快速地將監控區域的文件內容與所謂的敏感資料內容進行比對,一旦偵測到有符合敏感資料的文件,將立即通知管理者存有敏感資料的設備,管理者可以即時對設備內的文件進行反應。
- 影像檔案
雖然文件電子化已經推展了很久,但不可否認,紙本依舊是商務往來主要,甚至是重要的文件型式,像是:傳真、訂單、合約、申請書等。許多企業會將這些紙本文件掃描成影像檔案,作為調閱與備份之用。一般的監控程式對於影像檔案的「內容」是無法監控的,內部成員也因此可以透過合法的授權「閱讀」文件,利用數位相機拍攝相片後大方地儲存在自己的電腦內,造成資料外洩的風險。
整合龍捲風搜尋引擎的監控程式,會自動透過OCR擷取影像中的文字資訊,搭配龍捲風獨家專利的「字形容錯」技術,即使OCR辨識出的內容有誤,也能夠將疑似敏感資料的文件列出,如同電子文檔般完整監控。
企業應付資安問題的對策,不能僅僅是在內部成員已經著手進行資料外洩時,才開始防堵。主動對公司內部的資訊設備進行掃描,找出所有存放的敏感資料,便能搶先對可疑情況進行處理,達到防微杜漸之效。

產品巡禮
搜尋引擎可以為你做更多 – Tornado Search 5.1
搜尋引擎能做什麼
提到「搜尋引擎」,相信大家一定都不陌生,像是Google或Yahoo就是大家熟知的搜尋引擎業者。只要在搜尋引擎上輸入關鍵字,就能從全世界上億個網頁中找到自己關心的資料,這樣找資料的方式實在很方便。同樣地,公司裡有著成千上萬個檔案,我們幾乎無法確切知道哪些檔案是自己需要的,甚至有更多由別人產生的檔案是我們所不知道的。當我們想要尋找某些檔案的時候,卻只能透過檔案總管,循著資料夾辛苦地翻找,浪費的時間不知道可用來回覆多少封重要的E-mail,或是早點把手中的其他事情做完。如果能像用 Google或Yahoo那樣的搜尋方式來找公司檔案,不就能讓工作變得更有效率?
專屬企業的知識搜尋利器
Tornado Search就是一個讓大家可以輕鬆找資料的好工具,是專門為企業設計的搜尋引擎。不論是公司內大家互相交換的硬碟空間、個人電腦分享給大家的檔案、內部系統連接的資料庫、公司網站或外部時常關注資訊的網站,統統可以透過輸入關鍵字的方式一次找到。每個人只能搜尋自己有權限的檔案當然,公司機密文件是不該被基層員工看見的。Tornado Search只會將個人有權限檢視的檔案顯示在搜尋結果內,個人沒有權限觀看的檔案,甚至連檔名都看不見,自然不會有任何機密洩漏的危機。所以可能業務部員工Jason以「專利」這個關鍵字搜尋,可找到50個檔案,但業務部主管George以同樣「專利」這個關鍵字卻能搜尋到80個檔案。Tornado Search依據不同身份提供不同檔案,確保了敏感資料的安全。
搜尋結果依照不同成員的權限提供檔
搜尋結果分類快速縮小查詢範圍
假設上司希望得到公司內部跟「專利」有關的資訊,我們只需要在Tornado Search中輸入關鍵字「專利」,不到一秒的時間,所有與「專利」有關的檔案全部會顯示出來。但搜尋結果可能有上千筆,該如何更快地從上千筆資料中過濾出我們需要的資料呢?
新版的Tornado Search提供「搜尋結果分類」功能,會依照公司內部原有的資料夾結構提供分類顯示。如:平常我們將與「專利」相關的資料放在「專利」資料夾下,還建立「發明」、「新型」與「新式樣」三個子資料夾。當我們搜尋「專利」相關的資料時,搜尋結果就會以樹狀的方式顯示出對應的結構,我們可以直接點選特定的分類(如:新式樣),快速篩選出所要的資料。

搜尋結果依照資料夾的結構提供分類
搜尋結果分類快速縮小查詢範圍
假設上司希望得到公司內部跟「專利」有關的資訊,我們只需要在Tornado Search中輸入關鍵字「專利」,不到一秒的時間,所有與「專利」有關的檔案全部會顯示出來。但搜尋結果可能有上千筆,該如何更快地從上千筆資料中過濾出我們需要的資料呢?
新版的Tornado Search提供「搜尋結果分類」功能,會依照公司內部原有的資料夾結構提供分類顯示。如:平常我們將與「專利」相關的資料放在「專利」資料夾下,還建立「發明」、「新型」與「新式樣」三個子資料夾。當我們搜尋「專利」相關的資料時,搜尋結果就會以樹狀的方式顯示出對應的結構,我們可以直接點選特定的分類(如:新式樣),快速篩選出所要的資料。
提供關聯文件,尋找相似文件更方便
以往我們透過搜尋引擎找到某份文件後,似乎就是搜尋的終點了。但更多時候,我們在找到一份有用的文件後,還希望能得到更多與該文件有關或相似的文件,協助我們擴大對某個領域的了解,進行知識的累積。
Tornado Search提供「關聯文件」這樣的好工具來讓我們探索知識。在搜尋結果內的每一份文件都提供了一個關聯文件的連結,若對任一份文件感到興趣,或覺得該文件對我非常有用,還是希望再得到更多類似的文件,都可透過點選「關聯文件」啟動視覺化的關聯文件探索器,利用視覺化的方式迅速了解有哪些相似的文件,而且能夠直接預覽任一文件的摘要,或決定是否直接閱讀該文件。當然我們也可以用滑鼠不斷點選任一份文件以取得更多的關聯文件,透過彼此相連的文件架構出的知識網路,跨越了傳統資料搜尋的範疇,輕鬆累積知識、探索知識。

互動式的關聯文件探索器
概念延伸詞延伸更多的知識查詢
多數的時候,我們搜尋是為了找一種「概念」,所以查詢的關鍵字可能每個人都不同,甚至同一個人在不同的時間也會下不同的關鍵字,自然搜尋結果也會有所出入。面對這樣的情況,Tornado Search會聰明地給予提示。
假設我們在Tornado Search內輸入關鍵字「知識」進行搜尋,系統會提供三種概念延伸詞,包括:
- 相關詞
提供與關鍵字有關的詞組,方便使用者針對相關資訊做更進一步的查詢。如:知識份子、知識庫、知識性、…
- 同音詞
提供與關鍵字近似音的詞組,讓使用者在使用注音輸入法輸入錯誤的字詞時,可以立即校正查詢。如:只是
- 同義詞
提供與關鍵字有相同意義的詞組,方便尋找同義異詞的資料。如:學問、學識、…
其中同義詞還能提供彈性修改的功能,讓使用者依照不同的專業領域修改對應的同義詞,讓系統的提示更符合使用者的需求。
不只找資料,還能拓展知識
Tornado Search跳脫了以往搜尋引擎只是尋找網頁資料這種簡單的應用,可以把眾多相關資料都串連起來,加上簡單免學習的操作方式,等於是個人知識的統整系統。對於公司來說,除了能減少員工在資料搜尋上的時間,讓員工更專注在自己的核心業務上,節省人事支出外,更可方便管理、運用公司內部的檔案,讓企業資源得以發揮更大的效益。
龍捲風焦點
開創不景氣下的企業競爭力 - 「龍捲風知識檢索系統」強化企業知識財產管理能力,迎接景氣復甦
景氣寒冬一波波,多數企業在不景氣之際紛紛採取大幅瘦身的方式因應。但是如何能在節省成本之際,亦能確保員工的知識與經驗可以完整保留,甚或是順利轉移至交接同仁身上,卻是企業主目前最為兩難的問題。企業中文搜尋與管理解決方案的領導廠商龍捲風科技,推出嶄新面貌的「Tornado Search 5.1 龍捲風知識檢索系統」,結合搜尋引擎的技術及知識管理的方法,協助企業用最簡單的方式,管理、呈現及再利用公司長久累積的知識資產,讓企業主在維持最低成本營運的同時,更能有效掌握公司內部的知識財產。
龍捲風科技總經理賴政昌表示:「對大多數企業而言,過去在景氣好的時候並沒有在知識管理上進行有效的投資,值此不景氣的當下,如何去因應與應變,是企業存亡的重要關鍵。還好大部分的企業,過去都有提供共用磁碟機及備份資源,讓同仁隨意儲存工作上的成果及資料。其實,這些同仁過去懶得整理的不同格式大量資料,都隱藏著企業主多年來的投資成果及知識資產,只要有良好的工具開始進行整理應用,就是一個簡易的知識管理平台,讓企業主在這兩難之際,找到好的解決方案。」
Tornado Search 5.1龍捲風知識檢索系統,可以針對本機檔案、網頁及資料庫等多種資料源建立索引庫,支援檔案格式包括:網頁(html, php, asp, aspx, jsp , cfm)、Microsoft Office(doc, docx, xls, xlsx, ppt, pptx)、可攜式文件(pdf)、Flash(swf)、AutoCAD(dwg, dxf)、壓縮檔(zip, rar)、郵件(eml)、資料交換格式(xml, rss)、一般文字(txt)等,員工可以快速針對共用磁碟機及備份資源搜尋資料進行工作,不需花費太多時間找尋資料。另外新增的關聯文件地圖功能,讓使用者經由一份文件,迅速找到其他關聯性高的相關文件,可以連續閱讀不漏失。搜尋結果分類功能則可方便使用者在數以千計的搜尋結果內縮小範圍,讓員工得以善加利用企業內部既有知識財產,提高工作效率。
龍捲風科技總經理賴政昌繼續說明:「在不景氣之下企業可運用的工具已經不多,應當好好審視這些知識財產,思考如何加以應用來創造競爭力。要充分活用公司內部既存知識,企業搜尋絕對是最佳的協助利器。而Tornado Search 5.1龍捲風知識檢索系統,除了保存原來對於本機檔案、網頁及資料庫等多種資料源的搜尋之外,在新的版本內,更可針對企業內常見的紙本文件、電子郵件檔案,以及AutoCAD 3D工程圖進行搜尋。因此企業主不需擔心內部文件是以何種形式儲存,也不需擔心檔案擺放在不同的伺服器或資料夾下,只要使用TS 5.1搜尋,均可馬上找到資料。另外,TS 5.1最新的關聯文件功能,可利用關鍵字自動找出並展開相關性高的資料,讓同仁只需要搜尋一次,就能找到所有有相關性的文件去參照。利用這些既存的知識財產加以活用,或是快速轉移至交接同仁身上,讓企業營運與作業得以接軌,始為企業在不景氣時代中,生存與開創競爭力的不敗之道。」
耐特普羅資訊儲存事業行銷處總經理李沛祥說明:「身為儲存與備份市場的領導廠商,我們也發現企業在儲存設備上搜尋資料時碰到的問題,譬如資料量的增加會影響搜尋的效能,甚或影響儲存設備的執行、使用者放了許多重覆內容的資料,佔用了企業共用的儲存空間、使用者放了許多不該放、不被允許的內容在共用的儲存區中,造成機密外洩或資安的問題等等,這些都是儲存設備使用後延伸的問題。我們很高興看到龍捲風知識檢索系統 TS 5.1,針對上述問題都可以輕鬆解決,並且產生附加價值。」
不景氣時代的來臨,使大多企業面臨生存關卡,以開源節流與裁員縮編的方式來維持最低成本營運;相反地,若能夠善用企業內部的既有知識財產,避免知識斷層與知識流失,才能創造出景氣寒冬下的堅毅競爭力。而龍捲風科技的知識檢索系統 TS 5.1,正可協助企業在不景氣之下,仍可保存實力,甚或創造意想不到的競爭優勢。為了讓更多企業用戶能夠輕鬆取得「Tornado Search 5.1龍捲風知識檢索系統」,也讓既有的客戶可以輕鬆升級,請即刻至龍捲風試用下載網站http://reg.tornado.com.tw/ts50downloadform/form20080828.jsp,馬上體驗「Tornado Search 5.1 龍捲風知識檢索系統」的強大功能。
「Tornado Search 5.1龍捲風知識檢索系統」產品特色
- 整合不同資料源,一手掌握所有資訊
Tornado Search 5.1可針對本機檔案、網頁及資料庫等多種資料源建立索引庫,無論是網站上的資訊,或者是企業內部伺服器的資 料,均能以全文檢索的方式搜尋資料。支援檔案格式包括:網頁(html, php, asp, aspx, jsp , cfm)、Microsoft Office (doc, docx, xls, xlsx, ppt, pptx)、可攜式文件(pdf)、Flash(swf)、AutoCAD(dwg, dxf)、壓縮檔(zip, rar)、郵件(eml)、資料交換格式(xml, rss)、一般文字(txt)、各種關聯式資料庫,包括 Oracle、SQL Server、 MySQL……等企業常用資料庫,以及群組軟體Notes等,結構性與非結構性資訊一網打盡,完全納入搜尋範圍中。
- 關聯文件地圖與搜尋結果分類,迅速的找到最完整的資料
Tornado Search 5.1會自動分析每份文件內容,標示出高關聯性的文件,讓使用者能夠連續閱讀彼此相關的文件,加上Tornado Search 5.1會根據索引庫、檔案目錄、網站等不同的資料類型進行分類,方便使用者在數以千計的搜尋結果內縮小範圍,迅速的由點 而面的了解完整的知識脈絡。

- 人性化查詢方式,輕鬆取得所需資訊
Tornado Search 5.1提供多種查詢方式,如簡繁中文與全半形轉換、英文自動拼字與詞性代換,關鍵字自動完成、自動AND查詢、 模糊查詢等,根據使用者行為來設計,讓使用者在輸入關鍵字詞時輕鬆無負擔,所需資訊唾手可得。此外,Tornado Search 5.1在 搜尋結果旁顯示了同義詞、相關詞、同音詞等項,方便使用者用近似的觀念去延伸、擴大搜尋結果。
- 彈性化管理功能設計,滿足企業各式要求
管理者可在Tornado Search 5.1管理介面中制定多項規則,使搜尋結果更加符合企業需求,如排除字元的增減,能有效降低過多不 必要的搜尋結果出現;同義詞、熱門關鍵字、熱門文件及熱門主題的設定,則可彈性依據企業需求,強化重點資訊,並輔助使用者進 行搜尋。此外,漸進式索引與自動化排程的設定,更可讓管理者自由選擇適當時間為索引庫進行更新,即時掌握資訊不漏失。
- 安全認證,完整防護
為了保護珍貴的企業資訊,Tornado Search 5.1整合了NTLM安全認證,可根據使用者權限,提供不同的搜尋結果。此外,也針對 XSS (Cross Site Scripting)的攻擊,提供了安全防護,避免惡意的入侵與資訊完整性的破壞。
2009年無所不搜新境界 - 龍捲風科技率先發佈「多媒體搜尋」創新技術
搜尋引擎不再只侷限於文字檔案資料的搜尋!企業中文搜尋與管理解決方案的領導廠商龍捲風科技繼資料搜尋、網頁搜尋、資料庫搜尋、紙本文件搜尋等等應用之後,面對全新的2009年,再度提出「多媒體搜尋」 (Video Search)的技術解決方案,展現其堅強的技術與能力。而此項全新的搜尋技術,無須像既有的系統一樣花費大量人力去註記場記或是詮釋資料(Meta Data),而是針對多媒體影像中的相關文字進行搜尋,直接調閱多媒體內容,可以應用於片庫管理、數位典藏、線上教學、語言學習、專家系統、側錄監控等等使用者的實際作業中,終結長年來多媒體產業無法精確搜尋影像資料的困難。
龍捲風科技總經理賴政昌表示:「龍捲風科技身為企業中文搜尋的領導廠商,對於使用者在日常生活或商業營運中大量接觸到的各式檔案格式,我們都想要讓搜尋引擎的技術發揮效能,希望可以讓使用者不需要為了搜尋花費太多人力與時間。去年我們陸續發佈了對於資料搜尋、網頁搜尋、資料庫搜尋、紙本文件搜尋甚或是MOSS 搜尋的相關解決方案,也在在證明了,這些解決方案對於改善我們客戶在資料處理與資訊流通上有很大的幫助,並大幅提升了知識工作者的效率。然而,在以上的搜尋方案中,我們發現多媒體產業其實是被疏於照顧的一角。如何讓3D的工程製圖,或是動態的影像檔案,在龐大的數位資料庫中可以快速精準地被找出,即是未來企業搜尋市場的關鍵重點。也因此龍捲風科技積極朝多媒體搜尋的方向努力,讓龍捲風搜尋引擎技術做到無所不搜的境界。」龍捲風科技技術長楊立偉說明:「龍捲風科技的多媒體搜尋技術,可以針對影片中的文字區域進行偵測,過濾掉無意義的雜訊與文字切割後,進行字幕擷取與辨識。所以像是電視台的影像字幕、標題、快訊、跑馬燈等資訊,都可以利用龍捲風科技創新的多媒體搜尋技術、自動摘要與自動關鍵字,加上獨家的中文容錯檢索技術,在短時間內被找出來。如此一來,使用者就不需要花費太多的人力與時間對影音與視訊檔案進行人工註記,讓這些難以調閱的影像文件都可以進行全文檢索,提供多媒體產業一個全新有效的管理方式。」
龍捲風科技總經理賴政昌繼續說明:「龍捲風科技多媒體搜尋技術的研發,不管是對於電視台、線上教學系統、語言學習系統、數位典藏相關或視訊剪輯領域等多媒體產業,都開啟了一種創新的資料管理方式,我們也相信未來將逐漸改變多媒體產業的營運作業模式,讓動態影像的調閱與搜尋不再是一件難題,也讓搜尋更加貼近每一位使用者的日常作業中。」
多媒體搜尋技術,正是未來企業中文搜尋的發展趨勢,也是搜尋產業的未來方向。而龍捲風科技身為企業中文搜尋的領導廠商,率先發佈此項技術與應用模式,也證明了龍捲風科技堅強的技術與實力,未來亦將帶領企業中文搜尋市場創造更多樣化的創新應用,開啟企業搜尋潮流另一章。欲了解更多關於龍捲風科技與相關產品資訊,請至龍捲風科技網站http://www.tornado.com.tw。
Tornado Search龍捲風知識檢索系統 操作Demo影片下載
Tornado Search龍捲風知識檢索系統操作Demo影片開放下載!針對索引庫管理、版面設定、系統管理、熱門排行等等共10項常見功能,提供詳盡的實機操作說明,歡迎下載。http://www.tornado.com.tw/support/dl/livedemo
專家觀點
企業資料內容安全防護之鑰 – 搜尋引擎
鄒坤霖
企業資訊安全已從過去的防毒演進到了資料安全防護(Data Loss Prevention, DLP)層級,亦即藉由對資料權限的控管,以及各種端點(end point)對外的溝通管道,做全面性的過濾及存取限制,來達到重要資料不外洩的目的。
但DLP目前能做的還是基於「檔案」本身的權限控管,MIS基於「檔案路徑」、「分享資料夾」、「Storage volume」、部門、職級、角色等分類,來制定企業資料存取的安全政策,「理論上」可以有效防堵敏感或重要資料的外洩。但通常,敏感性的資訊常常不僅僅以檔案型式存在,而會在人為不經意的情況下,散落在E-Mail的內文、某個員工自行製作的PowerPoint檔、引用至某份不重要的Word文件中,甚至在MSN的對話中。
因為判別資料本身是否機密或敏感,重點不在於檔案屬性,而是「內容」本身。在沒有針對「內容」本身做關鍵字搜尋比對的技術前,權限管理是在無法人工逐一比對下的最佳解決方案。但如果,企業資料防護能像病毒碼比對引擎一樣,對企業對內對外所有流通的檔案、E_mail、訊息等都做掃瞄比對,那麼具敏感性關鍵字的資料內容,將能夠在第一時間被防堵外洩,而不會發生公司員工將內部E-Mail轉給外面人看的狀況。
要做到企業資料內容防護解決方案,首要的前題就是擁有一顆高速關鍵字搜尋比對引擎,不論在端點或是閘道,都能快速針對所有流通的內容進行過濾。尤其對於中文,各類同音、同義字的資料庫建立就像病毒碼的更新一樣重要,因為員工將資料外傳時,打錯字(同音)或用另外說法(同義)都時常發生,甚至是打錯字不同音的狀況都有,這都要依賴搜尋比對引擎本身的人工智慧成熟度。此外,對於許多紙本文件電子化後的PDF檔、TIFF等圖形檔,亦應具備判讀能力,方能將各類資料內容都納入管理,而非僅僅具備文字內容的文件檔。
資料流通時才做比對,是被動型的資料防護。配合上主動型資料內容搜尋、比對、定義權限、自動依企業安全政策歸類,才能有效減少端點及閘道的運算資源,避免生產力的下降。所謂主動型的防護,就是各端點(不論是desktop, laptop, server, PDA, mobile phone….)在資料新增或異動時,搭載其上的Agent即可立刻根據最新的企業安全政策(隨時同步),做出比對及標記,在伺服器端的資料還可與目錄服務的權限控管機制整合,讓具備敏感內容的文件檔案,立刻受到控管,而不論該檔案是否位於public或是受管制的分享目錄中,這樣才能有效的全面控管散落於各處但又具敏感資料的文件。
作者目前為SOHO族,銷售中小企業資安系統及IT整體委外服務連鎖平台,具MCSE及ERP顧問師認證,從事資訊服務行銷業務工作13年,歷任CA, Microsoft, Phoenix等公司,熟悉各類資訊產品及商業模式。
創意應用
龍捲風徵文活動「下載試用奪獎金」創意文章分享
新發現-原來搜尋可以這樣用!不可思議的最佳應用
藍色小舖帳號:starshine 汪先生
在這個資訊爆炸,網路文章每日以等比程度暴增的情況下,要用搜尋引擎來尋找自己想要的資料,已經不是那麼容易的事。根據IDC(國際數位資訊)的調查指出,光是2007一整年,全球所產生的資料量就高達255 EB(Exa-byte, 1 EB = 1024 PB, 1 PB = 1024 TB, 1 TB = 1024 GB),估計到了2010年,網路總資料量將會成長到988 EB!
龐大的垃圾資料充斥,導致我們使用Google、Yahoo!等搜尋引擎時,除了要輸入多個關鍵字組合來模擬自己真正的需求,多半也只會瀏覽搜尋結果的前幾頁。然而因為搜尋的精確度無法有效提昇,使得許多「搜尋資料」的時間,都被浪費在「過濾資料」這個行為上。
換個角度想,既然網路工具無法幫我們作有效的訊息過濾,那若是我們自己來作呢?假設平日已經有了一個自己信賴、資料量又豐富的專業網站,也許我們要搜尋相關資料時,便可以直接利用該網站的站內搜尋,來獲得自己想要的訊息。但這樣子的作法又嫌太不彈性,如果網站沒有搜尋功能怎麼辦?如果我們有五、六個想同時搜尋的網站該如何?如果有五、六十個呢?
龍捲風TS 5.0知識檢索系統,就有辦法解決這樣的情況!讓我們在無所不包的網路資訊海中,準確又快速地取得我們想要的資料!
對於喜愛旅遊的人來說,網路上豐富的旅遊筆記與心得,絕對是出遊前必備的參考資料之一,尤其是愛走郊山、古道的朋友,對於《Tony的自然人文旅記》,想必並不陌生。其他諸如《壹蘋果》的旅遊報導、《CTIN台灣旅遊聯盟》、《背包客棧》以及政府的《Taiwan觀光資訊網》,都提供了豐富的旅遊資訊。然而當我們在Google輸入像是「瑞芳」、「南方澳」之類的景點時,跑出來的結果卻可能充斥著漁會、車站、工業區甚至是電影官方宣傳網等等我們不甚感興趣、或是與旅遊主題毫無關聯的網站。此時,利用TS 5.0可以對遠端網頁作索引的強大功能,我們只需分別選擇數個著名的旅遊網站建立索引,之後就可以輕輕鬆鬆地在自家電腦的索引庫中作搜尋,並且準確地得到想要的旅遊資訊了!
用Google搜尋「瑞芳」,發現從第5筆開始都不是我們要的旅遊資料:

如果用TS 5.0搜尋我們先選好的資料庫,搜尋結果全部都是符合需求的網頁:

同樣的道理,我們可以挑選數個專門介紹硬體的網站作索引,這樣搜尋自己想要的產品評比資料時,就不會看到滿坑滿谷的拍賣網頁;對自己喜愛並信任的軟體城網站作索引,就不怕搜尋結果被大陸的惡意連結塞爆;甚至想要對幾個賣場作快速的比價,透過類似的方法也是可以辦到的。
使用Yahoo!、Pchome、燦坤三個網路商家做資料庫索引,可以建構出一個3C商品搜尋器:

強大的進階搜尋功能,還可以用網頁標題來二次過濾索引庫內的資料。舉例來說,現今一般的網路賣場,均會在販售物品頁面的標題上標示出該商品的品名,我們在搜尋特定商品時,只需在標題上輸入關鍵字,就可以避免掉許多無意義的結果。例如:在標題輸入「冰箱」,則我們找到的都會是冰箱的商品頁面,但若是在一般關鍵字輸入,則可能會找到許多包含有「冰箱」宣傳字樣的其他商品頁面。
若是較為注重資料的即時性,也可以使用排程功能,設定索引的自動更新,不論是要每隔一週、一天、一小時,都可以透過簡單的設定迅速完成。讓TS 5.0來負擔檢查與擷取檔案內容的工作,我們只要知道自己「想要什麼資料」就可以了!

另外,由於每個索引庫各自獨立,我們得以方便地選擇想要搜尋的範圍,而不用苦惱需要用哪些關鍵字來過濾掉不符合要求的網頁。要找什麼,就選什麼!
那麼,除了強大的遠端網頁索引功能,TS 5.0在本機上可以有什麼厲害的應用呢?
對於研究人員來說,pdf格式的論文散落桌面和其他各資料夾,並不是一件新鮮事,往往研究到一半,想找重要相關的論文來參考,卻找了半天都找不到。TS 5.0可以搜尋doc/docx、xls/xlsx、ppt/pptx以及pdf等檔案的內文,只要輸入關鍵字,需要的檔案立刻就無所遁形!這對於習慣把同一份工作的相關資料到處亂擺的人來說,不啻是一大福音。
同樣的內文搜尋,可以應用到搜尋程式碼/註解,方便程式開發者維護龐大的資料庫或網站程式集。一般使用者則可以利用這個功能來搜尋與朋友的對話紀錄(MSN、GTalk…)、工作筆記、日記等等,也都是不錯的應用。
當然,Google Desktop也有類似的本機搜尋功能,但是在進階搜尋的選擇上,TS 5.0顯然比Google Desktop強大許多,不僅可以針對標題、作者、檔案大小等欄位進行過濾,還可以選擇日期區間。相較之下,Google Desktop的進階搜尋就顯得陽春且不便許多了。當然更不用提TS 5.0還具備了概念延伸詞的貼心功能,甚至可以選擇要搜尋的索引庫,讓搜索本機的資料也更有彈性。
搜尋出來的結果,TS 5.0還可以讓它依照檔案大小、日期等屬性重新排序。「對於數個不同版本文件散亂各處的情形,要如何判別何者才是最後修改的檔案?」相信應該很多人會有這樣的需求。
TS 5.0的進階搜尋,可以過濾標題、檔案大小、和日期區間等許多屬性:

綜合而論,不管是對IT專業人員,或是一般電腦使用者,TS 5.0的搜尋功能都有辦法讓蒐集資料變得更方便且迅速。其實,閱讀資料就已經是件很耗費心神的事情,假如能省去一些搜尋資料的苦工,相信在工作或生活上都能變得更有效率,何樂而不為?若是平日就常常依賴大量(網路)資料的人,一定得要試試看「龍捲風TS 5.0知識檢索系統」。
喜歡的功能:
在搜尋結果後面,會列出與搜尋關鍵字相關度的數字。我覺得這個設計讓使用者看列表時可以一目了然,很清楚地知道這則內容與我要查的字詞有多少關聯。此外,日期、作者、檔案大小等資訊,也標示地相當清楚。
關鍵字在網頁中出現的數目一目了然:

不喜歡的功能:
概念延伸詞的設計我覺得很不錯,但是在同義詞的部份,好像會把中英互譯也直接顯示出來,有時候會產生很多沒有意義的翻譯詞,我覺得比較沒有必要。在同音詞的欄位中,有時候也會出現蠻無關的詞彙,例如輸入「礁溪」會跑出「嬌妻」,我想這部份應該還有改進的空間。
同義詞的中英直譯詞過多:

其他建議:
在測試之後發現,TS 5.0似乎無法搜尋zip Archive內的文件內容。由於不少使用者習慣將大量文件檔壓縮存放,也許可以考慮增加搜尋壓縮檔內文件的功能,應該會更具實用價值。另外也建議支援搜尋JPG等圖檔的EXIF、MP3檔案的TAG、以及php、asp、cpp、html等檔案的內文(不然以現在只能搜尋txt的限制,搜尋程式碼是有點麻煩),相信對多媒體使用漸增的電腦族群及程式設計師都會有所幫助。
本文來源:http://blog.yam.com/thstarshine/article/17930370