訂閱
糾錯(cuò)
加入自媒體

圖數(shù)據(jù)庫市場持續(xù)升溫,未來應(yīng)將走向何方?

發(fā)現(xiàn)新冠病毒的傳播路徑?用圖數(shù)據(jù)庫!

識(shí)別金融欺詐,實(shí)現(xiàn)風(fēng)控處理?用圖數(shù)據(jù)庫!

個(gè)性化商品推薦,給買家更好的購物體驗(yàn)?用圖數(shù)據(jù)庫!

“圖”,為什么這么熱?

圖數(shù)據(jù)庫,其實(shí)并不是什么新鮮事物。隨著大數(shù)據(jù)分析、人工智能等技術(shù)的快速普及,它已經(jīng)開始“飛入尋常百姓家”,在社交推薦、風(fēng)控領(lǐng)域、健康和醫(yī)療,乃至區(qū)塊鏈、公共安全等領(lǐng)域有了諸多成功的落地應(yīng)用。

近兩三年,圖數(shù)據(jù)庫市場一直處于持續(xù)升溫狀態(tài)。在先行一步的國外市場,以Amazon Neptune、Microsoft Cosmos等為代表的傳統(tǒng)大廠,以及以Neo4j、TigerGraph等為代表的新興勢力,還有諸如JanusGraph、Dgraph、Redis Graph等開源產(chǎn)品,交相輝映。在國內(nèi),圖數(shù)據(jù)庫市場也是一派熱鬧景象,大廠有百度HugeGraph、華為GES、騰訊TGDB、阿里GDB、螞蟻GeaBase、字節(jié)跳動(dòng)ByteGraph等,還有星環(huán)科技StellarDB、創(chuàng)鄰科技GalaxyBase、歐若數(shù)網(wǎng)NebulaGraph等也是各具特色,整個(gè)市場競爭日趨激烈。

圖數(shù)據(jù)庫市場的興盛,從宏觀的趨勢和政策層面看,與全球數(shù)字化轉(zhuǎn)型步伐的加快、大數(shù)據(jù)應(yīng)用蔚然成風(fēng),以及中國已將大數(shù)據(jù)作為一項(xiàng)核心戰(zhàn)略密切相關(guān)。尤其是在數(shù)據(jù)作為一種新型生產(chǎn)要素,寫入2020年4月10日發(fā)布的《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》中,加快培育和完善數(shù)據(jù)要素市場,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng),成了當(dāng)前最緊迫的任務(wù)。從微觀的企業(yè)應(yīng)用層面看,越來越多的企業(yè)認(rèn)識(shí)到,數(shù)據(jù)是企業(yè)的戰(zhàn)略資產(chǎn),數(shù)據(jù)的分析、數(shù)據(jù)價(jià)值的挖掘成了決定企業(yè)未來成敗的關(guān)鍵。

當(dāng)前,圖數(shù)據(jù)庫技術(shù)已趨于成熟,并且逐步進(jìn)入了場景化落地階段。圖數(shù)據(jù)庫主要用于圖數(shù)據(jù)的存儲(chǔ)和聯(lián)機(jī)事務(wù)查詢,具備實(shí)時(shí)性。雖然圖數(shù)據(jù)庫可以存儲(chǔ)海量數(shù)據(jù),但并不適合直接用來進(jìn)行海量數(shù)據(jù)的分析計(jì)算。圖數(shù)據(jù)庫無法解決圖計(jì)算領(lǐng)域的所有問題,它是知識(shí)圖譜的基石。而知識(shí)圖譜的構(gòu)建和應(yīng)用,還要結(jié)合不同的圖計(jì)算技術(shù)。目前,知識(shí)圖譜已在搜索推薦、知識(shí)問答、投研分析等領(lǐng)域得到了廣泛使用。知識(shí)圖譜基于自然語言處理模型,將文本數(shù)據(jù)進(jìn)行提煉抽取后,存儲(chǔ)為圖數(shù)據(jù),如此一來,更易于做實(shí)體、關(guān)聯(lián)和圖信息的查詢與分析,以及知識(shí)的統(tǒng)一管理。

雖然人們對(duì)于圖數(shù)據(jù)庫、知識(shí)圖譜等概念和技術(shù)不再陌生,但先進(jìn)技術(shù)的大規(guī)模應(yīng)用總有一個(gè)過程。從整體來看,圖數(shù)據(jù)技術(shù)在行業(yè)應(yīng)用中落地還有一定難度,究其原因:第一,行業(yè)用戶對(duì)圖的概念還不夠熟悉,在技術(shù)選型時(shí)缺乏動(dòng)力和“主心骨”;第二,復(fù)雜的圖應(yīng)用靈活度較高,需要參與人員具有較豐富的算法和數(shù)據(jù)建模經(jīng)驗(yàn),而這正是很多用戶所欠缺的;第三,在面對(duì)不同的業(yè)務(wù)場景時(shí),用戶可能要做大量的業(yè)務(wù)場景梳理、數(shù)據(jù)清洗、標(biāo)注、NLP模型訓(xùn)練工作,有時(shí)還要做很多定制化的工作,復(fù)雜度和成本相對(duì)較高,從而造成了應(yīng)用的障礙。

俗話說,工欲善其事,必先利其器。面對(duì)應(yīng)用的挑戰(zhàn),行業(yè)用戶更迫切需要一個(gè)能力全面的圖數(shù)據(jù)解決方案。首先,它必須具有強(qiáng)大的圖查詢能力,支持快速返回點(diǎn)邊、路徑和子圖查詢;其次要具有強(qiáng)大的圖分析能力,支持運(yùn)行傳統(tǒng)圖算法;再次,還要具備可視化能力,支持展示圖查詢結(jié)果;最后,生態(tài)開放的能力也是不可或缺的,要支持多數(shù)據(jù)源接入和導(dǎo)出。

目前,在圖數(shù)據(jù)庫市場上,產(chǎn)品種類繁多,各廠商也是八仙過海,各顯神通。行業(yè)用戶在選擇時(shí),一定要結(jié)合自己的業(yè)務(wù)需求,選擇一個(gè)功能強(qiáng)大、簡單易用且全面的解決方案。

從金融行業(yè)看“圖”如何落地?

金融行業(yè)是圖數(shù)據(jù)庫應(yīng)用的先鋒行業(yè),不僅從大型國有銀行到股份制銀行都普遍使用了企業(yè)級(jí)分布式圖數(shù)據(jù)庫和知識(shí)圖譜平臺(tái),而且從2021年開始,一些中小型的金融機(jī)構(gòu)也在積極探索和嘗試圖應(yīng)用的商業(yè)化路徑。究其原因,一方面,隨著圖數(shù)據(jù)技術(shù)越來越成熟,圖應(yīng)用的投入成本逐步走低;另一方面,從客戶的業(yè)務(wù)需求來看,處理復(fù)雜關(guān)聯(lián)關(guān)系的需求日趨旺盛,不斷創(chuàng)新的圖數(shù)據(jù)技術(shù)、分析手段,可以給客戶帶來明顯的業(yè)務(wù)價(jià)值和收益,同時(shí)還可以有效解決最為迫切的監(jiān)管與風(fēng)控需求。

從應(yīng)用需求的變化和發(fā)展來看,國內(nèi)金融行業(yè)知識(shí)圖譜最早是從監(jiān)管和大銀行發(fā)展起來的風(fēng)險(xiǎn)圖譜,如反洗錢、反欺詐圖譜應(yīng)用。這一類圖最初是同構(gòu)圖,整個(gè)圖譜Schema可以簡化抽象成只包含一類實(shí)體和一類關(guān)系,處理起來相對(duì)簡單。近些年來,隨著技術(shù)進(jìn)步和應(yīng)用場景的不斷拓展,包含多種實(shí)體或關(guān)系的異構(gòu)圖數(shù)據(jù)源漸成主流,包括工商數(shù)據(jù)、司法數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)、產(chǎn)業(yè)鏈數(shù)據(jù)、價(jià)值鏈數(shù)據(jù)、擔(dān)保鏈數(shù)據(jù),甚至是社交網(wǎng)絡(luò)數(shù)據(jù)等。基于此,未來兩三年,知識(shí)圖譜的主戰(zhàn)場將集中在異構(gòu)知識(shí)圖譜上。

從成本上看,知識(shí)圖譜的應(yīng)用除包括圖數(shù)據(jù)源采購的費(fèi)用以外,圖數(shù)據(jù)庫、知識(shí)圖譜PaaS和圖挖掘應(yīng)用是主要的成本構(gòu)成。也正因?yàn)槿绱?以前,只有大型金融機(jī)構(gòu)才有資金和技術(shù)實(shí)力投入預(yù)研性質(zhì)的開發(fā)或者方案選型。未來,隨著能夠提供全棧知識(shí)圖譜解決方案的廠商逐快速崛起,圖應(yīng)用的商業(yè)化落地成本將隨之有效降低,圖應(yīng)用有可能在金融全行業(yè)中落地開花。

圖數(shù)據(jù)庫與傳統(tǒng)關(guān)系型數(shù)據(jù)庫最大的不同之處在于關(guān)系發(fā)現(xiàn)和關(guān)系查詢。傳統(tǒng)關(guān)系型數(shù)據(jù)庫需要多表關(guān)聯(lián),以及跨表查詢才能實(shí)現(xiàn)關(guān)系的計(jì)算。在復(fù)雜的圖查詢場景中,傳統(tǒng)關(guān)系型數(shù)據(jù)庫可能會(huì)出現(xiàn)嚴(yán)重的性能瓶頸,甚至出現(xiàn)算不出來的現(xiàn)象。而分布式圖數(shù)據(jù)庫可以支持超大規(guī)模萬億點(diǎn)邊計(jì)算存儲(chǔ)場景,基于原生圖存儲(chǔ)技術(shù),充分利用圖拓?fù)浣Y(jié)構(gòu)和數(shù)據(jù)索引,實(shí)現(xiàn)圖上模式挖掘和圖范式查找,效率、準(zhǔn)確性等都得到大幅度提升。

千億級(jí)大圖的查詢是一個(gè)業(yè)界公認(rèn)的難點(diǎn),而從另一個(gè)角度說,也是最好的突破口。當(dāng)初,星環(huán)科技堅(jiān)定地進(jìn)入圖數(shù)據(jù)庫領(lǐng)域,也是希望發(fā)揮自身的技術(shù)優(yōu)勢,在圖數(shù)據(jù)庫領(lǐng)域闖出屬于自己的一片天地。星環(huán)科技從來不打無準(zhǔn)備之仗,其底氣在于,在異構(gòu)知識(shí)圖譜領(lǐng)域已經(jīng)擁有大量技術(shù)儲(chǔ)備,并且面向未來3~5年的技術(shù)發(fā)展,進(jìn)行了充分準(zhǔn)備。事實(shí)勝于雄辯,星環(huán)科技自研的分布式圖數(shù)據(jù)庫StellarDB不僅能夠支持萬億邊規(guī)模的圖數(shù)據(jù)存儲(chǔ),而且具有查詢速度快、分析能力強(qiáng)、穩(wěn)定性高等特點(diǎn),可以支持豐富的圖分析算法,性能表現(xiàn)十分優(yōu)異。

隨著StellarDB快速落地上線,客戶不僅可以穩(wěn)定地為上層業(yè)務(wù)提供查詢業(yè)務(wù),同時(shí)還可降低集群節(jié)點(diǎn)數(shù)量,以及數(shù)據(jù)導(dǎo)入成本。StellarDB具備完整的企業(yè)級(jí)功能,如用戶認(rèn)證、權(quán)限管理、數(shù)據(jù)熱備份、資源控制等,具備高性能的圖查詢能力,包含近20種常見圖算法。StellarDB與大數(shù)據(jù)系統(tǒng)緊密融合,可配合Hadoop、Spark、Kafka等大數(shù)據(jù)系統(tǒng)構(gòu)建復(fù)雜應(yīng)用。StellarDB支持SQL操作和圖數(shù)據(jù)查詢,可處理結(jié)構(gòu)化數(shù)據(jù)和圖數(shù)據(jù)。

星環(huán)科技以領(lǐng)先的圖數(shù)據(jù)技術(shù),為用戶打通了從底層的關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)平臺(tái),到中層的圖數(shù)據(jù)庫,再到上層知識(shí)圖譜應(yīng)用的全棧產(chǎn)品通路,實(shí)現(xiàn)了從最底層獨(dú)立的“點(diǎn)”分析到關(guān)系的“線”分析,再到事件的“面”分析,最終形成行業(yè)全面的“體”分析的全棧智能分析賦能。星環(huán)科技從點(diǎn)到面再到體的一站式分析工具,可以為用戶節(jié)省大量開發(fā)成本和基礎(chǔ)算力,并顯著提升分析性能。

如今,星環(huán)科技StellarDB已經(jīng)在金融等眾多行業(yè)得到了廣泛部署。比如,星環(huán)科技幫助監(jiān)管和頭部金融機(jī)構(gòu)打造了多個(gè)監(jiān)管、集團(tuán)派系知識(shí)圖譜,以及對(duì)公知識(shí)圖譜、零售知識(shí)圖譜等。

國產(chǎn)“圖”,底氣何來?

最近一兩年,國內(nèi)的用戶越來越傾向于選擇國內(nèi)廠商自主研發(fā)的企業(yè)級(jí)分布式圖數(shù)據(jù)庫和知識(shí)圖譜平臺(tái)。究其原因,可以歸納為以下兩個(gè)方面。

首先,中國的圖數(shù)據(jù)庫廠商在技術(shù)上并不遜于國外廠商,在某些技術(shù)細(xì)分領(lǐng)域甚至還超過了國外同類廠商。都說中國是天生的“大數(shù)據(jù)之國”,客戶眾多、數(shù)據(jù)量龐大、業(yè)務(wù)場景繁復(fù),尤其是在金融、社交等領(lǐng)域,時(shí)常會(huì)遇到超大規(guī)模數(shù)據(jù)計(jì)算的場景,圖計(jì)算的網(wǎng)絡(luò)規(guī)模不是普通圖數(shù)據(jù)庫所能承載和解決的。中國的圖數(shù)據(jù)庫廠商從一開始就要面對(duì)諸如超大規(guī)模、超高復(fù)雜性等的挑戰(zhàn),其解決方案百煉成鋼,能夠更好地滿足中國客戶的特殊需求。以星環(huán)科技為例,它立足自主研發(fā),可以支持萬億點(diǎn)邊圖計(jì)算場景,也因此贏得了眾多中國行業(yè)客戶的青睞。

星環(huán)科技的差異化優(yōu)勢突出體現(xiàn)在,能夠提供端到端的圖數(shù)據(jù)解決方案,包括基礎(chǔ)的大數(shù)據(jù)平臺(tái),以及可以高效運(yùn)行的圖數(shù)據(jù)庫、知識(shí)圖譜等產(chǎn)品。星環(huán)科技是同時(shí)具備圖數(shù)據(jù)庫(StellarDB)、知識(shí)圖譜平臺(tái)(Sophon KG)、圖挖掘應(yīng)用開發(fā)能力的企業(yè),其全棧能力可以助力企業(yè)用戶快速構(gòu)建知識(shí)圖譜應(yīng)用,有效降低圖應(yīng)用的門檻。

其次,出于行業(yè)監(jiān)管與合規(guī)的要求,自主可控的國產(chǎn)化產(chǎn)品可以避免用戶在技術(shù)應(yīng)用上被“卡脖子”,擁有更多的選擇,確保安全、可靠、可用。

“圖”的未來

未來,圖數(shù)據(jù)庫應(yīng)用將走向何方?

從技術(shù)上看,多模態(tài)異構(gòu)圖將是市場熱點(diǎn),而知識(shí)圖譜與自然語言處理的深度融合發(fā)展則是必然趨勢。另外,時(shí)序圖、空間圖應(yīng)用,圖神經(jīng)網(wǎng)絡(luò)也是未來的主要方向。

從應(yīng)用的角度看,未來圖應(yīng)用更需要完整的方法論和解決方案。其真正價(jià)值將體現(xiàn)在,利用圖的方法論圍繞諸如金融風(fēng)控、金融投研等領(lǐng)域的知識(shí)圖譜,構(gòu)建整體解決方案。從應(yīng)用趨勢來看,偏SaaS級(jí)的端到端解決方案能夠有效消除用戶的應(yīng)用痛點(diǎn)。對(duì)于圖數(shù)據(jù)庫廠商來說,擁有基于業(yè)務(wù)場景的know-how,也就是行業(yè)解決方案,才是在知識(shí)圖譜領(lǐng)域?qū)崿F(xiàn)破局的法寶。

可以預(yù)見,用戶會(huì)越來越傾向于選擇端到端的整體解決方案,而無需分別購買圖數(shù)據(jù)庫、圖平臺(tái)和建模服務(wù),更無需擔(dān)心底層圖數(shù)據(jù)庫、中層圖建模平臺(tái)和上層圖挖掘應(yīng)用。對(duì)于圖應(yīng)用來說,大型機(jī)構(gòu)會(huì)有非常多的定制化需要,而中小型機(jī)構(gòu)則偏好標(biāo)準(zhǔn)化的解決方案。星環(huán)科技就是這樣一家針對(duì)知識(shí)挖掘應(yīng)用,擁有從底層到頂層完整解決方案的廠商,能夠賦予用戶構(gòu)建完整的圖應(yīng)用生態(tài)的能力。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)