Skip to content
This repository has been archived by the owner on Feb 6, 2023. It is now read-only.

Latest commit

 

History

History
22 lines (13 loc) · 800 Bytes

数据理解.md

File metadata and controls

22 lines (13 loc) · 800 Bytes

数据理解

数据质量探查

  • 一般在SQL里面查某些字段用和总体的缺失情况, 如:

    select count(1) from table where name is null
    

重要特征探查

  • 选择思路:流失客户的数据一般是不稳定的,流失客户的后期数据与前期数据会有差异等,在业务理解里面已有分析,如下图:

图片看不了的,点击浏览器的后退再前进就可以看到了

png

总结:由于是二分类的模型,分流失和不流失,那么找特征的时候,我们要尽量找到这种能明显区分开流失和未流失客户的特征