|
摘要:数据挖掘应用受阻于数据质量
易观国际分析师屈攀认为,数据质量问题已经严重影响到数据挖掘技术的应用,由于缺乏有效的数据样本和非结构化的数据库结构,导致企业用户无法通过系统得到品类、供应商、消费者、季节、趋势等因素之间的多维关联分析。 引发数据质量问题的一个重要因素是原始数据录入程序缺乏应有的规范,例如超市柜员面对多个价格一样的盒装牛奶,其不会逐一扫描,而是扫描单品后用单价与数量相乘。这种不规范的操作行为将引起不同批号的商品被混批,并遮蔽客户对不同口味单品的追求,信息系统得到的结果将掩盖实际发生的问题。 易观国际认为,通过有制度化的数据录入程序、完善的IT系统定期审计机制、可行的数据逻辑审核等可有效提高数据质量。
|