龍捲風科技 Tornado Tech 官方網站已全新改版

系統將自動導引至新版官網,非常感謝您的配合!

本頁將於秒後自動跳轉至文章頁面


新版 龍捲風科技 Tornado Tech 官網

以語意技術自動處理非結構文字資料的利器

Processing unstructured data with Text mining technology



產品介紹

在巨量資料(Big Data)時代,透過成熟的資料分析探勘技術,由各式累積龐大的交易紀錄中,獲取可貴的產業資訊,包含產品銷售趨勢、客戶消費關聯、購買習慣等。這些分析結果的資料來源,都是來自結構化(structured)的系統訊息與交易紀錄,而這只是巨量資料寶礦的一角。在資料寶礦的另一端,潛藏著包含消費者意願、事件陳述、彙整資訊等,這些在產業趨勢觀察或市場分析上都是極具價值的非結構性文字資料(unstructured / textual)。若能藉由語意技術的分析理解,自動擷取出內容中重要的人事時地物,對文件歸類彙整,主動偵測消費者意見(例如來自論壇、客服信箱等)中的評論態度、找出社群熱門議題,並將這些重要資訊轉化成標記欄位。這些原本礙於仰賴人工過濾歸類,無法大量處理與分析的非結構化資料,就能夠進行處理與應用,進一步變成掌握客戶意見、社群議題的主要利器。


Tornado Text Miner是基於十多年中文語言處理經驗,發展先進自然語言處理技術,運用最新的人工智慧演算法,持續地以各種最新論壇、社群、新聞文章進行語言模型的優化,使語言模型具備適應新的詞彙用法能力。Tornado Text Miner從中文斷詞處理、權威詞擷取、人事時地物偵測、情緒態度偵測、到文件相似度分析,由詞彙分析、語句意向到文章群組歸類,是一個全面的文字處理分析引擎。


產品特色

Tornado Text Miner是一套成熟的軟體產品,可直接應用在大量非結構文字資料上,將之轉換為標記欄位資料。同時,產品提供了完整的API與開發界面,可以很容易地與其它系統做整合,串接結構化與非結構化的資料處理流程。


Tornado Text Miner 產品特色如下:

  • Targeting:文件實體(人事時地物)標記
    TextMiner可由一般文字描述中,不須額外標記處理與編輯詞庫,自動標記出文章內所出現的實體項目,包含:人物(人名、綽號)、組織、事件、時間與地點等。實體資訊可作為文件個資檢測、刑案資料分析(人事時地物關聯分析)重要資訊。

  • Extracting:去蕪存菁,關鍵詞彙及段落萃取
    TextMiner 具備文件摘要技術,不論是單篇文章或是多篇的文章群組,系統可自動摘要重點段落,並萃取文章代表概念。即使是大量文件,也可迅速消化,掌握重點!

  • Sensing:文章表情感知,潛在意見挖掘
    TextMiner 語意引擎可以進行語言態度感測,對輸入的內文提供正負面情緒指標。透過情緒指標可以監測特定事件在社群上的反應狀況,即時看見社群好負評的動態。亦可在指標強度高的文章中,反向擷取文章概念,發現潛在意見。

  • Connecting:關聯群聚
    當系統存在大量的非結構化文字檔案,分析元件可以進行相似文件分群,將文件依照內文概念進行自動歸類。在檢索文件時,同時提供相關內容的資料供使用者檢視。此外,可產出這些文件的關聯權威詞組,透過權威詞的關聯進行概念擴展的檢索。



客戶案例

國科會 國家實驗研究院

決策情報擷取及創新能量與國家競爭力系統

研究報告依自訂主題自動分類
自動擷取及語意分析,獲取標的資料;媒合議題相關研究資源

經濟部 商業發展研究院

中國餐飲網路社群口碑匯流分析平台

匯集 90 個城市及近百萬家店資
萃取口碑關鍵字、正負面情緒、詞彙關聯性;結構化並量化分析

方探科技

FUNTIME 線上旅遊資訊及導購入口

旅遊搜尋入口功能強化
匯整網路上商品、旅遊情報、及網友評論,依景點或主題進行分類

內政部 刑事警察局

犯罪資料分析,偵查、防治

非結構化資料分析應用,建立完整有效情資庫
結構化人、手法、號碼、地址、車牌等資訊,並分析其關聯性