关注点:如何发现数据背后的巨大价值?
信息--隐藏在数据中的真正价值
在信用卡业务领域,信息技术的飞速发展使越来越多的企业获得了大量的消费者数据。这些数据种类繁多、内容丰富,涉及消费者的方方面面,为企业更好地了解消费者、开展科学的管理模式提供了前提。但另一方面,分析人员或业务人员却发现,自己面临这些堆积如山的数据时又感觉无从下手。这主要有两方面的原因:一是这些原始数据普遍存在着很多质量问题,使后续分析无法进行,常见的有数据缺失、数据错误、不同来源的数据库不能相互识别等;二是不知如何让数据与营销计划进行“沟通”。
数据工程是整个数据库营销的第一步,所要解决的就是如何将原始数据转化为企业可以分析、利用的有价值的信息。从图2.1可以看到,数据工程就好像是一个加工厂,输入的是数据,输出的是信息。不要小看了这个加工厂,它是后续步骤的基础;如果基础打不好,整个数据库营销的效果就会大打折扣。据美国社会统计和调查结果显示,美国每年数据分析工作中有30%~80%的时间花费在数据工程上。在中国内地,由于很多公司刚刚开展数据挖掘工作,相应的数据采集、数据保护、数据加工等尚缺经验,因此数据工程的重要性在国内企业中更加突出。下面就让我们一起来了解一下这个加工厂是如何运作的。
实施目标:改善数据质量,获取有用信息
√ 信用卡业务的内外部数据及其分类
√ 数据应用于营销实践的两大障碍
√ 何谓信息及其基本分类
√ 数据工程--数据向信息转化的必经之路
数据
要了解数据工程,首先需要了解什么是数据,什么是信息。我们先从数据谈起。
所谓数据,就是企业通过各种渠道所获得的消费者原始资料。它可以通过各种方法获得,比如调查问卷、消费者消费记录、投诉记录、人口普查报告等。根据来源不同,可以分为内部数据和外部数据两种。内部数据就是企业在自身运营过程中积累起来的消费者数据。信用卡业务主要的运营环节包括发卡、交易、收单等,企业可以通过在每个运营环节分别建立不同的数据库来获取消费者信息【详细内容我们将会在“数据收集”等相关章节中进行介绍】。此外,按照性质的不同,内部数据又可以分为静态数据与动态数据两类。前者主要是客户在办卡时主动提供给银行的数据,对于这类数据,数据工程的主要目的是对其进行整理修正,以提高其准确度和可用性,从中了解客户相关的背景资料信息;而后者则主要是通过银行积极主动地对客户用卡行为进行记录而获得的系统数据,对于此类数据,数据工程的主要目的则是对服务于不同部门的系统数据进行深入挖掘,更全面、更深入地了解客户的行为特征、生活方式以及需求和喜好等信息。
外部数据指的是企业可获得的第三方数据。按照性质的不同,也可以分为两类:普查数据和地址名录。在中国内地,普查数据主要可以看国家统计局每年做的《统计年鉴》,里面包括人口普查、行业普查等。地址名录来源广泛,可以是各地政府机构进行整理,然后向社会公开,也可以是由第三方机构提供的,例如房地产交易数据、黄页、婚姻注册名单等。图2.2以图例形式说明了数据的分类。
数据应用于营销实践的两个障碍
虽然随着信息技术的迅速发展,信用卡企业积累了越来越多的消费者数据,但是真正能将这些数据用于营销实践的却是凤毛麟角。这一方面是由于目前中国很多企业还没有充分认识到数据的重要性,另一方面是由于分析人员或业务人员越来越发现,当真正面对这些堆积如山的数据时,又觉得无从下手。这其中主要有两方面的原因:一是这些原始数据普遍存在着很多质量问题,使后续分析无法进行;二是不知如何让数据与营销计划进行“沟通”。具体解释如下:
数据质量问题
作为数据加工的原始对象,数据质量的好坏将直接决定能否获得足够有价值的信息,从而影响实施目标的实现。因此,数据质量将是我们建立整个管理模式应该关心的首要问题。那么,什么样的数据才称得上是高质量的数据呢?
数据质量的理想状态
由于不同客户的使用目的不同,对数据质量的要求也有所不同,因此每一个数据的使用者和提供者对于“什么是高质量的数据”都有不同的理解和要求。但是,还是会有一个统一的数据质量考察标准,可以帮助确定数据质量的理想状态。
·数据取值的质量:准确、及时、完整
这一因素是考察数据质量最基础、最重要的角度,主要包括准确性、及时性、完整性几个维度。数据准确性要求数据提供者要尽可能为用户提供最准确的数据,如果数据不能达到100%的准确,需要向用户提供数据精确程度的说明。同时,明确陈述对于不准确数据的处理方式。
·数据的覆盖范围:360度的全面信息
数据覆盖范围是数据更广泛地满足用户需求的保障,要求所提供的数据应该来自内部、外部不同数据源,涉及静态、交易、问卷调查等不同方式,使用户可以对业务进行360度的全面了解。对于数据覆盖范围的要求,也有助于数据的提供者和数据用户建立起收集和整理数据的意识,不断丰富数据库内容,提高数据质量。
·数据的改进制度:持续跟踪、及时反馈
建立高质量的数据,首先需要形成一个反馈机制,依据这一机制,用户可以将其在使用过程中所发现的质量问题及时反馈给数据提供者,数据提供者对反馈信息进行分析,寻找合适的机会和方法对数据进行修正。其次,需要建立起一套数据质量水平评估方案,从而不断向数据使用者提供数据质量水平或数据异常情况的通知和说???。最后,需要对上述两个过程进行持续跟踪,便于发现错误的本源并进行解决。
现存的数据质量问题
现在中国内地多数信用卡企业通过内外部的各种渠道累积了大量的消费者数据,但如前所述,这些各式各样的数据库都存在着很多质量问题,使其不能直接应用于营销实践。经调查发现,中国内地企业现存的数据库主要存在以下质量问题:
·数据格式不标准
数据格式不标准主要是指,数据不规范或者未按照指定的数据格式或内容填写。标准的数据格式会为未来的数据分析和数据挖掘工作提供很大的便利,特别是文书数据,不标准的文本数据则很难进行分析。常见的几种数据格式不标准的情况有:相同的内容书写形式不同,填写多余信息,未按照规定的要求填写等。造成这些情况的主要原因是,客户的书写习惯不统一,搜集数据的环境嘈杂,等等。
·数据缺失
数据缺失是最常见的一种数据质量问题。原因是多方面的,最普遍的是出于私人信息保密的想法,客户会故意不填写某些数据,这时数据缺失的严重程度与该数据是否是必填信息直接相关。另外一种情况是系统更新后,新增加的内容就只有更新后的新客户的记录,而老客户没有相关记录。
·数据重复
由于数据不断的累积或人工的重复输入,经常会导致数据重复问题,这种问题的存在经常会影响运营效率,提高运营成本,需要特别注意。
·数据错误
数据错误也是很常见的一类数据质量问题,并且识别这种数据质量问题的难度相对较大。产生的原因有:客户填写笔误、业务人员录入错误、在数据传输过程中产生错误。
·数据不一致
在企业数据库中最令人头疼的就是,两个数据文件之间的数据不一致,甚至同一数据文件中不同记录之间的数据也不一致。前者可能是只是由于文件生成时间不同、记录格式不同而造成的,这时只需统一数据格式就可以解决问题。但如果是其中一个文件存在记录错误,则需要认真确定取舍方案。同一文件中的数据不一致情况也是如此。
以上就是经常出现的数据质量问题。要解决这些问题非常不容易,根据美国社会统计和调查的结果,美国每年因解决数据质量问题的花费在6000亿美元以上。很多读者也许会问,花这么大力气解决数据质量问题值得吗?低质量的数据对后续分析工作究竟有哪些方面的影响呢?
低质量数据的后果
目前中国很多企业都还没有充分认识到数据的重要性,自然忽视数据质量问题也成为企业内部普遍存在的问题。总体来说,数据质量问题会导致成本浪费、运营效率降低、客户满意度下降、企业决策失误等一系列严重后果。以一个简单的电话销售活动为例,如果在活动流程过程中,我们发现了以下几个数据问题:
·目标客户名单中存在着一定比例的无效电话号码。【数据错误】
·缺乏客户最佳联络时间及呼叫次数的记录。【数据缺失】
·目标客户名单中存在着一定比例的客户电话重复。【数据重复】
那么,我们可以预见在活动进程中,这些数据质量问题至少会造成以下几方面的影响:
·运营效率
显然,这些问题都会不同程度地导致人力、时间成本以及客户资源的浪费。因此,很可能因为运营效率低而未能达到预期的目标。一般来讲,在企业实际的运营过程中,活动或生产流程的进行都伴随着相应的信息流程的进行。一旦信息流程中的某个环节出现数据问题,企业必须作出三种选择:一种选择是终止目前的流程,这种选择将导致前端的人力、时间成本的浪费,并延误整体目标的实现;另一种选择是对出现的错误进行修正后再继续下去,这种做法需要额外地付出人力、时间成本,导致流程的延迟;最后一种选择则是忽略问题的存在,其结果势必不能达到目的,而浪费了很多成本及客户资源。由此可见,在运营过程中出现数据质量问题,无论采用哪种解决方式都将严重影响企业的运营效率。
·市场策略
数据库营销的核心是对企业数据信息进行深入挖掘,从而制定出科学的市场策略。如果数据质量出现问题,必将导致由此而建立起来的市场策略产生偏差。以上述电话营销为例,由于缺乏对客户群体的细分及客户消费偏好的分析,企业无法实现依据不同的客户群体制定有针对性的市场策略,因此难以赢得绝大多数客户的青睐。
·内部管理
根据对上述市场活动的分析,可预测该活动很可能达不到预期效果,而失败的根本原因是种种数据质量问题所导致的。由于这些数据问题发生在运营流程中的不同环节,并涉及不同的部门,因此在评估的过程中会很难清楚地界定各种问题的不同影响程度,对活动的评估及后续的改进造成了很大的困难,同时也使参与的各部门之间彼此产生不信任感,对组织的管理带来了影响。
·客户信任度