達觀數(shù)據(jù)孫亞彬:如何做好非結(jié)構(gòu)化數(shù)據(jù)文本智能審閱市場
雖然是創(chuàng)業(yè)型公司,但因為在盛大、騰訊等知名科技公司所做的深厚積累,達觀數(shù)據(jù)備受市場青睞。目前,公司的主營業(yè)務(wù)立足于非結(jié)構(gòu)化數(shù)據(jù)處理中的文本處理。2017年,公司營收同比增長3-4倍,達到盈虧平衡。作為數(shù)據(jù)界的“復(fù)旦系”,達觀數(shù)據(jù)是如何立足于數(shù)據(jù)市場的
致力于非結(jié)構(gòu)化數(shù)據(jù)文本智能審閱市場
“雖然是一家創(chuàng)業(yè)型的公司,但實際上在專業(yè)領(lǐng)域達觀數(shù)據(jù)已經(jīng)有了深厚積累。我們創(chuàng)始人陳運文博士,最早是在盛大文學(xué),包括全國百分之七八十的小說文學(xué)網(wǎng)站數(shù)據(jù)的體系搭建都是由陳博團隊所領(lǐng)導(dǎo)的,這也成為騰訊文學(xué)的前身。后來,陳博帶領(lǐng)著這個團隊一同創(chuàng)辦了達觀數(shù)據(jù)。所以,雖然是創(chuàng)業(yè)型公司,我們在專業(yè)的挖掘上還是有深厚的積累。”對于達觀數(shù)據(jù)的創(chuàng)立背景,公司市場總監(jiān)孫亞彬如是表示。
目前,達觀數(shù)據(jù)的業(yè)務(wù)主要立足于非結(jié)構(gòu)化的文本數(shù)據(jù)處理。對于何謂非結(jié)構(gòu)化文本,孫亞彬解釋說:“我們通常所理解的數(shù)據(jù)分析公司,大部分是處理結(jié)構(gòu)化的數(shù)據(jù)。但事實上還有大量的,占到總量60%以上的非結(jié)構(gòu)化數(shù)據(jù),文本是非結(jié)構(gòu)化數(shù)據(jù)中的一種,因為目前市場上大部分產(chǎn)品的處理能力還比較弱,所以還沒能把它很好的挖掘出來!
其舉例說,在銀行的信貸部門,當(dāng)有很多消費者申請借款,無論是提交的申請報告,還是銀行簽訂的合同,都需要進行大量的審計。用人工進行審核會耗費大量的時間和精力,而且因為人的精力有限,工作效率的降低,讓審計的準(zhǔn)確率也隨之降低。但對于基于數(shù)據(jù)處理的機器來說,就可以避免這樣的問題,機器的效率會快很多,準(zhǔn)確率也可以達到更高的水平。在達觀為國內(nèi)知名保險公司提供的財務(wù)審閱系統(tǒng)中,財務(wù)信息提取準(zhǔn)確率達高到98%。
“所以,我們提供的系統(tǒng)就是代替人做機械化和重復(fù)性的工作。機器可以自動閱讀文檔內(nèi)容,閱讀合同,我們把關(guān)鍵核心信息進行提取,把可能存在的錯誤內(nèi)容標(biāo)識出來,這樣審核人員就不需要檢查整個文檔,只要看標(biāo)注出來的可能存在的錯誤信息便可,大大減少了人員的處理時間,也提升了整個的工作流程效率!
基于以上業(yè)務(wù),達觀數(shù)據(jù)的文檔智能審閱系統(tǒng)可協(xié)助金融、制造、通信、法律、審計、媒體、政府多個行業(yè)的文字密集企業(yè)完成文檔審閱工作。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025具身智能機器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
推薦專題