知識圖譜本質上是基于語義網絡而形成的知識庫,即基于語義網絡存在相互有一定關聯關系的集合,這些關系蘊含著現實世界對象之間的關聯。因此,可以把知識圖譜理解為蘊含關聯關系的多維關系圖。
知識圖譜一般從邏輯上可以包含多種類型的節點和多種類型的關聯,這種多類型的節點,通過相互不同類型的關系進行關聯而形成復雜的網絡結構,也就映射著復雜的現實世界。
為了能構建知識圖譜,通常用“點”來表示實體、“邊”表示關系。
比如,在現實當中實體可以表明一些具體的人或概念事物等實體,而關系則可以表達不同實體之間的某種關聯,如某人和某人之間是朋友關系、某人是某企業股東等相關的關系。因此,實體關系在很多場景非常適用,并適合用知識圖譜來表示。
比如,在一個社交網絡圖譜里,人與人之間可以是朋友關系,也可以是同事關系;同時也可以是人和公司之間的關系。一個實體具有很多屬性,且具有各種各樣的關系,從而可以全方位地刻畫整個實體,并通過關聯和屬性的刻畫深刻地描述世界。
構建知識圖譜的過程主要分為實體識別、關系識別、實體歸一、知識解析。
構建知識圖譜的首要步驟,就是要對每個實體進行分類和打標簽,根據一定的規則對實體進行識別和命名,標上相關的標簽,一個實體的標簽可能是一個,也可能是多個,但其中必須有關鍵的標簽指向同一個實體,不同的關鍵標簽指向不同的實體。在識別實體的過程中,同時識別實體之間語義關系,實體和實體語義關系形成知識的范疇。
在構建過程中存在這樣一種情況,不同的關鍵標簽指向不同的實體,但這樣的實體本質是同一的,需要進行實體歸一,可以采取多維實體分區、多模型融合實體等價判定、基本主動學習的關鍵樣本構建等技術,解決知識分歧,進行實體合并,提高知識圖譜的價值密度。
知識解析是在形成的海量知識圖譜數據基礎之上,利用深度神經網絡技術,從不同的層次對實體對象及語義進行解析,從而實現認知層次的語義理解,并與實際的應用場景進行結合,進行知識的計算與推理,獲得較好的應用效果。
1客戶關聯關系知識圖譜的構建
客戶關聯關系是指客戶在經營管理和融資過程之中,因股權分配、進行交易、開展擔保等而產生的股權、交易、擔保等之間的關系,比如一家企業在另一家企業中股權投資比例大于50%,則它們之間存在強股權投資關系;如果低于50%,則它們之間存在弱股權關系。其他如還存在股權投資關系、控制人關系、擔保關系、交易關系、地址關系、事件關系等,其中擔保關系等比較關鍵。
1、主要的客戶關聯關系
股權關系、控制人關系、擔保關系是銀行比較關注的客戶關系,在銀保監會發布的《商業銀行集團客戶授信業務風險管理指引》中,股權關系、控制人關系是集團客戶認定的重要依據,是銀行對客戶風險進行準確評估不可或缺的重要內容。
在銀行信貸具體實踐過程中,需要重視連環擔保、過度擔保蘊含的風險,中小企業為了從銀行獲取授信,采取A對B進行擔保、B對C進行擔保的方式,從而形成連環擔保關系,相互抱團取暖,隱含較大的關聯風險,如其中一家企業出現風險事件,將會影響到擔保圈中的所有企業,牽一發而動全身,給銀行帶來巨大的風險。
中小企業進行信用評級時,由于缺乏規范的經營管理、財務等相關數據不夠規范、不具有有效的抵押物等原因,難以獲得較好的評級結果。一些中小企業急于獲取信貸資金,只有冒著風險進行連環擔保。
在實踐中,擔保圈涉及的債權債務會形成復雜的債權債務關系,有時相當隱蔽,而且擔保圈范圍也在不斷發生變化。銀行需要充分識別、分析客戶之間的擔保關系,特別是以保證方式辦理的融資業務均應納入擔保圈識別、分析和管理范圍。
2、客戶關聯關系的描述
可以使用知識圖譜相關技術來對客戶關聯關系進行描述,知識圖譜的本質其實是一種大規模的語義網絡,它以實體或對象作為節點,通過語義關系進行連接,通過相關算法對實體或對象之間的關聯關系進行挖掘,從而可以深入地分析數據、理解數據,進而進行知識推理和數據挖掘,挖掘和展現實體之間的關系,其在銀行的客戶關聯風險識別、風險監測領域內具有較好的應用。
語義網絡是可以用圖來描述的一種數據結構,它主要由節點和邊組成,可以采用G=(V,E)等相關的方式進行定義,每個節點表示對應現實世界存在的一個實體或對象,而每一條邊表示實體和實體或對象和對象之間的關系。
因此,在客戶關聯關系描述中,可用節點表示單一法人企業,邊表示單一法人企業之間的股權關系、擔保關系等關聯關系,邊的方向可以代表的股權、擔保的控制關系,比如采用帶箭頭的邊,邊的起點表示控股企業或提供擔保的企業,邊的終點表示被控股企業或被擔保企業,并且根據需要進行完善和疊加,股權控制關系的疊加識別,可以實現集團客戶自動識別,擔保關系的疊加識別,可以實現擔保圈的建立和展現,通過多重層次的刻畫和知識疊加,從而獲取蘊含較為完備知識的客戶關系圖譜。
3、客戶關聯關系的知識計算
在全面收集和整合銀行內外部客戶相關數據的基礎之上,對不同的客戶數據進行全面分析和充分理解,根據不同類型的客戶關聯關系,設置不同的處理邏輯,采取不同的處理方式進行處理,以股權控制和擔保關系為例,設置不同的代碼對應相應的類型并在相應的數據類上增加標識,并設置起始標志,以區分不同的關系類型及關聯方向。
客戶因股權、擔保、交易等關系而形成的關系稱為“客戶關聯關系”,而經過分析、整合和去重,可以形成清晰客戶關聯關系圖,主要的步驟如下:
一是確定關鍵企業,訪問圖中的企業,對于所有關聯指向別的企業確定為關鍵企業,這樣采取圖遍歷算法對圖中所有企業進行遍歷,可以獲取所有的關鍵企業,關鍵企業對應的是集團客戶或控股企業。
二是以關鍵企業為起點,選擇一種關聯方式,通過關聯方向不斷地向下搜索,采用深度的遞歸算法,找出此類關聯方式的所有關聯企業,獲得此類關聯關系的關系圖譜,完成后選擇另一種關聯方式,采取同樣的方式進行搜索、識別和標記,獲取相應的關聯關系圖譜,重復上述步驟,直至所有關聯方式選擇完成,從而形成主體部分的客戶關系圖譜,可以稱為“骨干客戶關系圖譜”。
三是在骨干客戶關系圖譜的基礎上繼續搜索具有業務來往的相關企業,從而獲得企業具有業務往來的相關關系圖譜,成為客戶關系圖譜重要的輔助部分,可以稱為“外圍關系圖譜”。
外圍關系圖譜可以認為是在骨干客戶關系圖譜的基礎上進行的一次拓展,實現客戶關聯關系管理的外延,從而更加清晰地分析客戶股權、交易、事件、擔保的核心關系和外延關系,更好地服務銀行對客戶日常經營管理的監測及評級授信的相關工作。
從風險管理角度來看,在骨干客戶關系圖譜的基礎上進行適當地擴展,加入外圍關系圖譜,更有利于銀行建立更加全面的視角,深入分析客戶的潛在風險,特別適用于連環擔保、產業鏈上涉訴、資產重組等關聯企業的經營情形,從而促使銀行更加清晰地看監測企業經營管理的潛在風險,有助于風險管理部門獲得更為全面的風險管理信息。
2客戶關聯關系知識圖譜的應用
當前,銀行在客戶調查過程中,對客戶的關聯關系、客戶風險的準確分析和評估始終是一個難題,由于欺詐依賴于信息不對稱和間接關聯,一些深藏的風險較難顯現,給銀行業務的穩健開展帶來了較大風險。
而基于知識圖譜的客戶關聯關系分析,將不同種類的信息關聯在一起形成一個關聯網絡,這些關聯風險能被較好地揭示出來,使隱蔽欺詐和連環擔保難以隱身,銀行結合實際情況,可在精準客戶畫像、信用風險評價和客戶風險預警等領域進行有益的探索和實踐(如圖1所示)。
1、精準客戶畫像
對客戶關聯關系透徹地分析和展現,需要客戶各個維度的數據,在收集客戶多維數據的基礎上,充分分析潛在的客戶關聯關系,基于股權投資、控制人、擔保、交易、地址、事件等關系,以目標客戶為核心,對客戶及其關聯關系進行全景式地分析和展現,形成相互關聯的鏈狀、圈狀客戶關系全景視圖。
特別在對集團客戶的認定時,全面分析和展現集團子公司之間、子公司與集團外部公司之間的復雜關聯關系,生成客戶股權關系、擔保關系、資金交易等關系圖譜,將客戶的骨干客戶關系和外圍關系準確地展現出來,為準確地進行客戶畫像和風險識別提供重要的支持。
2、信用風險評價
充分融合銀行內部數據、企業的基礎信息、投資關系、工商數據、稅務數據、行業數據、電商數據等各類數據,進一步拓展客戶相關的數據類型,充實到知識圖譜平臺當中,形成比較完整的客戶多維數據和行業景氣數據,建立多層級客戶關聯關系模型,構建科學、嚴謹的企業風險評估體系,利用知識圖譜圖挖掘分析技術,在對違約概率(PD)、違約損失率(LGD)進行計量時,充分考慮客戶關聯關系類指標,使信用風險計量更加準確,為單一法人客戶、集團客戶信用風險評價提供有效支持。
3、客戶風險預警
探索和建立基于關聯關系的客戶風險預警模型,運用對客戶關系異動相對敏感的算法,識別關聯擔保、多頭抵押風險,監督資金用途,及時發現關聯企業之間違背資本真實性原則頻繁調撥資金,利用關聯交易或不合理的轉移定價抽逃資金等違法行為。通過設置容忍度閾值,一旦相關指標超過該閾值,進行風險預警,同時不斷完善模型,提高預警的準確性和及時性,從而有效規避客戶潛在的經營風險與資金風險(圖1)。
圖1 客戶關聯關系知識圖譜的應用
4、反欺詐應用
反欺詐應用建立在對大量數據分析的基礎上,使用傳統的關系型數據存儲對交易行為進行分析,需要進行各類復雜的表間關聯和數據連接,有時數據連接未必能盡如人意,分析起來十分復雜,識別效率可能較低,效果難如人意。
將交易欺詐環節可能涉及對象及其關聯設計成為知識圖譜進行全面展現,交易的關聯信息清晰地快速分層展現出來,其中的欺詐環就較容易識別。比如,輸入某個可疑的手機號,看其關聯層次范圍內涉及的申請人信息,分析申請人是否與其他可疑對象關聯成欺詐環,或與歷史具有欺詐行為的申請人間是否有過關聯等,判定是否存在欺詐行為,及時采取反欺詐措施。
5、反洗錢應用
將知識圖譜技術充分運用到洗錢風險的偵測過程當中,通過融合客戶多維數據,對不同路徑機構中資金轉移、流動、清洗等多個事件建立關聯關系,建立智能大額交易和可疑交易偵測模型,結合創新的圖計算算法以及可視化交互工具,形成針對案件追溯反查和異常交易結構主動發現兩大類原型工具,支持圖形化、可視化洗錢風險識別和排查,提高客戶身份識別的技術和能力,實現客戶盡職調查,實現大額交易和可疑交易及時發現和報告,使銀行能夠較好地履行反洗錢義務。
6、資金監控
銀行內部人員可利用內控某些流程上的漏洞或缺失,在監督失效或相關有權人不知情的情況下,將資金從銀行偷偷轉移,牟取利益。為避免這種情況的發生,可通過建立資金流向相關的知識圖譜,將相關信息相互連通,對賬戶交易情況實時分析,通過賬戶及賬戶間交易,加上資金交易特征,可以挖掘循環交易網絡,進而發現一些隱藏的蛛絲馬跡,找出資金流向失控的環節,并及時控制,避免出現資金損失。