用户复购率的口径,产品和运营两个部门对出来的数字不一样,到底该相信哪一个?凌晨跑批又失败了,源头业务系统传过来的用户ID一半是空的,数据根本没法用。......
数据清洗就是把原始数据里的错误改掉、把格式标准统一、补齐缺失的部分,最终让数据完整、统一、真实有效,能直接拿来分析、建模。很多人花大量时间研究模型......