- 探索數(shù)據(jù)?
- 數(shù)據(jù)噪音?
- 時間特征?
- 高基數(shù)變量?
- 模型需求多?
- 如何有效評估模型?
- 非正態(tài)分布?
- 標(biāo)準(zhǔn)化?
- LR, RF,GBDT…..使用哪種算法?
- 項目周期長?
- 缺失值?
- 參數(shù)配置?



數(shù)十年數(shù)據(jù)挖掘建模的實戰(zhàn)經(jīng)驗,參與和主持過多次國內(nèi)外銀行、保險業(yè)數(shù)據(jù)挖掘項目,屢次帶隊在國際SAS大賽中獲獎。
深刻的數(shù)學(xué)理解能力、超強的軟件實現(xiàn)能力、業(yè)界領(lǐng)先的高性能大數(shù)據(jù)技術(shù)。
| 智能建模 | 傳統(tǒng)建模 | |
|---|---|---|
| 人數(shù) | 1 | 1 |
| 建模時間 | 5分鐘(數(shù)據(jù)預(yù)處理+建模) | 2個月 |
| 建模數(shù)量 | 1 | 1 |
| 數(shù)據(jù)規(guī)模 | 100000+ / 28MB | 100000+/ 28MB |
| 模型AUC | 0.9728(測試集0.965) | 0.957 |
| 客群1 | 客群2 | 客群3 | 客群4 | |
|---|---|---|---|---|
| 建模人數(shù) | 1 | 1 | 1 | 1 |
| 模型數(shù)量 | 13 | 13 | 13 | 13 |
| 建模時間 | 1.5小時/個 | 1.5小時/個 | 1分鐘/個 | 2分鐘/個 |
| 數(shù)據(jù)量 | 134萬 | 155萬 | 6400 | 1.2萬 |
| 累計提升度 | 累計捕獲率 | AUC值 | |
|---|---|---|---|
| 前5% | 14.4 | 72% | >0.9 |
| 前10% | 9.4 | 94% | |
| 前15% | 6.3 | 94.5% | |
| 前20% | 4.8 | 96% |
當(dāng)前該產(chǎn)品購買率為1.72%
| 模型數(shù)量 | 時間 | 項目參與人數(shù) | |
|---|---|---|---|
| 智能建模 | 50-60個 | 2周 | 1人 |
| 手工建模 | 不適合大量建模 | 1周~2個月/個 (實際取決于模型復(fù)雜程度和建模人員水平,時間不可控) |
數(shù)人 |
智能建模改變應(yīng)用模式:業(yè)務(wù)用戶主導(dǎo),應(yīng)用過程中隨時隨地建模。