哈爾濱網(wǎng)站建設(shè)外包公司申請自媒體平臺注冊
眾所周知,金融是數(shù)據(jù)化程度最高的行業(yè)之一,也是人工智能和大數(shù)據(jù)技術(shù)重要的應(yīng)用領(lǐng)域。隨著大數(shù)據(jù)收集、存儲、分析和模型技術(shù)日益成熟,大數(shù)據(jù)技術(shù)逐漸應(yīng)用到金融風(fēng)控的各個環(huán)節(jié)。個推作為專業(yè)的數(shù)據(jù)智能服務(wù)商,擁有海量數(shù)據(jù)資源,在智慧金融領(lǐng)域也推出了相應(yīng)的數(shù)據(jù)解決方案-個真,為金融客戶提供智能反欺詐、多維信貸風(fēng)險評估和高意愿用戶智能篩選等全流程的數(shù)據(jù)服務(wù),助力各金融機(jī)構(gòu)全面提升風(fēng)控能力。本文將圍繞大數(shù)據(jù)風(fēng)控,結(jié)合個推實踐,介紹金融風(fēng)控機(jī)器學(xué)習(xí)的基本流程、算法實踐和產(chǎn)品化建設(shè)等內(nèi)容。
風(fēng)控流程 & 多維度特征
大數(shù)據(jù)風(fēng)控的內(nèi)容
數(shù)據(jù)是風(fēng)控的核心要素,大數(shù)據(jù)風(fēng)控實際上就是對數(shù)據(jù)的處理、建模和應(yīng)用的過程。大數(shù)據(jù)風(fēng)控的流程主要分為四個階段:數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)建模、風(fēng)控產(chǎn)品應(yīng)用。對獲取到的海量數(shù)據(jù)進(jìn)行清洗和挖掘,有針對性地對金融特征進(jìn)行深加工;接著通過規(guī)則策略和模型算法的構(gòu)建,對外輸出相應(yīng)的風(fēng)控服務(wù)。
個推以消息推送服務(wù)起家,為數(shù)十萬APP提供高效穩(wěn)定的推送服務(wù),并沉淀了豐富的數(shù)據(jù)資源,覆蓋超過40億終端設(shè)備,數(shù)據(jù)全面、廣泛且有深度。利用設(shè)備基礎(chǔ)信息、線上APP偏好數(shù)據(jù)、線下場景數(shù)據(jù)以及外部補充數(shù)據(jù),個推構(gòu)建了8個維度、350+特征,同時對特征進(jìn)行動態(tài)更新?;緦傩浴①Y產(chǎn)、金融、行為偏好、社會屬性、消費偏好、風(fēng)險和穩(wěn)定性構(gòu)成了個推金融數(shù)據(jù)的八大維度;個推利用數(shù)據(jù)的八大維度,逾350種特征進(jìn)行模型構(gòu)建,并將其應(yīng)用于金融風(fēng)控各環(huán)節(jié)。
金融風(fēng)控機(jī)器學(xué)習(xí)的基本流程
整個風(fēng)控建模流程,在個推大數(shù)據(jù)平臺上完成。首先,對持續(xù)更新的海量一手?jǐn)?shù)據(jù)進(jìn)行收集、清洗、存儲,在數(shù)據(jù)存儲前進(jìn)行ID打通;第二步,對清洗好的原數(shù)據(jù)進(jìn)行特征構(gòu)建;最后,利用多維度特征進(jìn)行金融風(fēng)控模型構(gòu)建,用到的技術(shù)包括協(xié)同推薦算法、LR算法、XGBoost、營銷模型、多頭模型和信用分模型等。
建模流程
如何高效構(gòu)建特征,是風(fēng)控建模中一個至關(guān)重要的問題。在實踐中,個推會對特征進(jìn)行穩(wěn)定性分析、臟數(shù)據(jù)/異常數(shù)據(jù)處理、特征分箱、特征聚合和特征有效性驗證。特征評估指標(biāo)則包括IV值、Gain值、單調(diào)性、穩(wěn)定性和飽和度等。
風(fēng)控場景機(jī)器學(xué)習(xí)的算法實踐
利用上述多維度特征和建模能力,增能于貸前、貸中和貸后全流程:拉、選、評、管、催五大環(huán)節(jié)。
全流程數(shù)據(jù)增能
拉-營銷模型,甄別虛假注冊,評估借貸意愿
在拉新獲客階段,個推制定貼合大額、小額兩種營銷場景需求的營銷模型,通過規(guī)則策略、模型策略、風(fēng)控策略三管齊下,幫助客戶識別“真人”,有效降低獲客成本、提升注冊率和轉(zhuǎn)化率??蛻艨赏ㄟ^提供樣本數(shù)據(jù),通過個推來完成建模,同時,在缺乏樣本數(shù)據(jù)的情況下,個推依托自身積累的海量樣本數(shù)據(jù),可以構(gòu)建出多種營銷場景下的通用模型,供客戶使用。
選-貸前的審核,識別欺詐人群,防范惡意騙貸
貸前審核階段我們通常采取兩個策略:欺詐分模型、風(fēng)險人群篩選。欺詐分模型指的是根據(jù)客戶提供的數(shù)據(jù)信息在個推平臺進(jìn)行數(shù)據(jù)轉(zhuǎn)換、特征匹配,并對其風(fēng)險特征予以篩選,利用預(yù)設(shè)規(guī)則予以打分,最后得出相應(yīng)的欺詐分。個推在逾350種特征中識別出數(shù)幾十種風(fēng)險特征。舉例來說,當(dāng)某用戶安裝小貸類APP達(dá)到多款以上,或線下到訪場景異常,或該用戶命中黑名單都會被識別為風(fēng)險特征。根據(jù)欺詐分的高低予以排序,為客戶列出不準(zhǔn)入人員、需重點關(guān)注人員等。
風(fēng)險人群篩選指的是根據(jù)用戶存在的風(fēng)險特征數(shù)量及程度,梳理出風(fēng)險人員。個推利用篩選出的8種維度、350+特征,通過模型預(yù)測和規(guī)則制定,輸出三類風(fēng)險人群:黑名單、灰名單、多頭名單。多頭名單顧名思義,當(dāng)某用戶頻繁安裝或卸載多款借貸類APP時則會被模型系統(tǒng)判定為多頭人員;灰名單指的是穩(wěn)定性較差的人員,黑名單指的是異常人員。在貸前審核階段,黑名單人員可直接不予以準(zhǔn)入,灰名單和多頭人員則需要重點關(guān)注。
評-信用分模型,貸前信用評估,輔助貸款定額
在評的階段,個推采用信用分模型,為客戶輸出用戶的信用評分。信用評分由五種維度構(gòu)建而成:資產(chǎn)、身份、穩(wěn)定性、關(guān)系、行為。個推信用評分模型先根據(jù)模型訓(xùn)練與規(guī)則模型,得到各個維度分,再將五個維度的個人評分作為特征輸入模型,作為特征得到總體個人信用分。
信用分模型由多個模型整合而成,第一層是分類模型(lr+xgboost),得到分值;第二層在維度分的基礎(chǔ)上再進(jìn)行回歸,得到最終信用評分。
管-貸中管控,監(jiān)測異常特征,實現(xiàn)風(fēng)險預(yù)警
在管的環(huán)節(jié),個推采用貸中監(jiān)測模型。從整體人群篩選出逾期相似(相關(guān))人群,結(jié)合實時數(shù)據(jù)與高危特征異常監(jiān)測得到高疑用戶,結(jié)合客戶的實際需求,對此類用戶通過進(jìn)一步的精準(zhǔn)研判得到逾期風(fēng)險人員,將此類人員告知客戶,讓其予以重點關(guān)注或排查。
催-貸后催管,催回價值評估,提高催回效率
在催的環(huán)節(jié),個推基于自身構(gòu)建的催回評分系統(tǒng),可以有效指導(dǎo)金融機(jī)構(gòu)制定差異化催管策略,助力更高效地完成催收工作。比如,當(dāng)客戶出現(xiàn)逾期和壞賬時,金融機(jī)構(gòu)通過個推的催回評分,對用戶的還款能力和還款意愿進(jìn)行評估,從而判斷哪些用戶優(yōu)先催。
風(fēng)控系統(tǒng)產(chǎn)品化
前面幾個流程主要講的是個推利用多維度特征自主構(gòu)建風(fēng)控模型,但在很多業(yè)務(wù)場景客戶希望快速構(gòu)建特征、快速返回風(fēng)控結(jié)果。為此,我們研發(fā)上線個真決策引擎,在規(guī)則設(shè)計層為客戶提供風(fēng)控規(guī)則,讓業(yè)務(wù)人員在規(guī)則執(zhí)行層通過規(guī)則性加工進(jìn)行靈活操作,目前已提供給部分客戶試用。
風(fēng)控決策引擎
如今,科技與金融深度交融的時代已經(jīng)到來,金融風(fēng)險控制任重而道遠(yuǎn),。個推將持續(xù)挖掘其豐富的數(shù)據(jù)資產(chǎn),不斷打磨自身技術(shù),助力金融行業(yè)運作效率和服務(wù)能力的全面提升。
大數(shù)據(jù)實踐——構(gòu)建新特征指標(biāo)與構(gòu)建風(fēng)控模型
https://blog.csdn.net/Tianweidadada/article/details/88902581/