登陆注册
10122100000014

第14章 数据融合(2)

·由于原始的MCC为两级分类,而新的商户分类标准为三级分类,因此通过上述两个过程能够确保所有的商户都有明确的一、二级分类的归属。但根据新的商户类别划分标准所形成的关键字库,未必能够将所有的商户都进行明确的第三级分类,对于那些无法进行第三级划分的商户,暂时归并到“其他”类。

在商户分类过程中,最大的挑战就是关键字库的建立、关键字的搜索规则。由于关键字数目众多,各级关键字的搜索规则大多与关键字的具体意义相关,因此很难在有限的篇幅中进行清楚的阐述。我们仅以一类商户的分类规则和关键字的形式,以及相应的搜索规则为例进行说明,如表6.1所示。

关键字搜索规则:

·局部关键字仅适用于搜索范围中所列的MCC所对应的商户名称,且不考虑关键字的位置。

·对于复合关键字,即必须同时包含其他关键字,不考虑关键字的位置。

商户名称中同时包含两个及其以上的关键字【非复合关键字,包括同时包含多个全局关键字或多个局部关键字】时,如果同时包含父级与子级的关键字,分类码以子级关键字为准【全局关键字以父级关键字为准】,否则以所处位置较靠后的关键字为准。

时间

银行可以通过终端捕捉到精确的交易时间【如图6.1】。交易时间信息可以帮助银行更好地了解客户每天的行程。交易时间可以分成不同的时间段,包括早晨、上午和晚上。通过识别客户绝大多数交易通常发生在什么时候,以预测客户的日常生活方式。表6.2就是一个通过交易时间来推测可能的生活方式的例子。

价格

明确客户每月愿意用信用卡消费多少金额是非常重要的。这条信息可以帮助银行市场人员识别那些消费很多的客户,以便为这些客户设计更多的活动。同时,可以根据客户的收入和财产状况,考虑每个客户的消费潜力,从而了解哪些客户能够购买和使用更多的产品和服务。在客户分群中将更加细致地讨论如何评估客户的购买能力。

商户

理解客户光顾哪些商户主要包含两层内容:一层内容是客户光临了哪家商户,需要通过商户名称来理解;另一层内容是客户光临的是哪一档次的商户。

商户名称

对于商户名称,在交易系统中有专门的字段进行记录,该字段信息一般是由银行卡组织提供的。例如,在国内大部分是由银联提供的,由于某些商户的特殊性,或者同一商户不同POS机铺设时间不同等原因,造成目前的商户名称中存在的数据质量问题如下:

·商户名称缺失,或者不填写真实商户名称。例如,商户名称填写为“金卡商户”,铺设POS机的银行名称,数字串或者其他字符串、拼音等。

·存在商户名称前后不一致的情况,即同一商户在不同的时期出现多个不同的名称。另外,多个不同商户也有可能共用同一个名称。因此,商户与其名称的多对多关系使我们无法识别不同的交易记录是否来自同一个商户。

针对上述商户名称中存在的问题,采取如下相应的数据精练过程,将商户名称进行标准化:

·从相应的交易文件或商户数据文件中提取商户编号和商户名称,并排除个别错误的编号。例如,一个编号对应多个不同商户的情况,则视为错误编号。

·对同一个编号对应的多个商户名称的情况,根据其包含信息的内容、格式和多少确定选用的优先级别,判断标准如表6.3所示。

第一阶段优先级判断:根据各个商户名称中所包含字符的类别进行优先级判断,从“中文”到“空值”,优先级别依次降低。

第二、第三阶段优先级判断:当出现两个【含】以上的商户名称中包含中文字符时,以长度为依据进行第二阶段优先级别的判断,长度越长则优先级别越高。如果有两个【含】以上的商户名称长度相同,则以对应的交易时间为标准进行第二阶段优先级别判断,交易时间距今越近则优先级别越高。如果交易时间相同,则随机取用。当第一阶段优先级别判断结果为2/3/4/5,则以交易时间为准,交易时间越近优先级别越高;交易时间相同,也以随机结果为准。

通过以上商户名称优先级别的判断标准,可以将同一个商户编号所对应的商户名称进行排序,从而确定最终的商户名称,举例如表6.4所示。

通过优先级别判断,最后确定商户编号为“C123”所对应的商户名称为“河南ABC旅业股份有限公司Zhengzhou CN”。

由于商户名称信息有多种数据来源,并且其中所包含的字符信息种类很多,因此为商户名称标准化带来了一定的困难。同时,在处理过程中仍有不足之处,主要包括:

·如何将交易文件与商户文件中的商户信息进行匹配?由于其与不同银行内部系统的设计有关,因此不作详细介绍。但不同数据文件之间的匹配和整合确实是一个不容忽视的问题,具有一定的难度。

·商户名称中中文字符的识别及长度计算:推荐一个一般的高级语言都具有的汉字识别语句,即RANK【】函数,来进行汉字的识别,取第一个中文字符与最后一个中文字符之间的长度为商户名称中的汉字字符长度。

·目前标准化流程中存在的问题:现有的商户名称的选取标准,以名称所包含的信息多少为依据,确保选用较为完整的名称,但仍会造成不同程度的信息损失。如表6.5所示,按照排序结果,选取后一个为商户名称,该名称包含了更完整的名称信息和行业信息,但损失了前一名称所包含的商户分店信息。另外,有时候无法判断同一商户编号前后名称不同是否是由于商户真实名称的变更而引起的,可能因此影响准确度,但造成的误差在可接受的范围内。

商户档次划分

商户名称数据只是帮助我们对客户的购买地点进行定位,但是要真正了解客户的生活方式,需要知道客户一般光顾哪种档次的商户。商户档次大致可以分成奢华和非奢华两种。把商户分到不同的档次中,可以帮助识别客户是否过着奢华的生活。显然,总是光临高档次商店的客户都是一些生活奢华的客户。

两种数据源可以用来定义商店的档次,分别是外部数据源和内部数据源。前者从地域性的指南和杂志中获得奢华类商户的名称,后者将通过对所有产生信用卡消费金额前10%的商户或者由收入较高的客户所产生的较高消费的那些商户进行研究和考察来丰富奢华类商户的名单。同时,发生交易的商户所处的地理位置也可以决定某些商户的档次。在知识库建立之后,交易中的商户名称将通过关键字匹配的方式匹配到相应的知识库中。

·通过外部数据源

饭店、宾馆、女士用品等商户的级别都是来源于各种各样的外部数据源,包括政府机构和旅游组织等。例如,它们每年都会公布五星级宾馆的名单。一个五星级???宾馆是可以提供高质量住宿和个人服务的,而四星级宾馆则缺乏五星级宾馆所具有的某些特征。外部数据源可以适用于很多商户档次的划分。

·通过内部数据源

利用内部数据源对商户档次进行划分,可以通过分析有钱客户的消费来判断它们的共性。这个可以通过研究数据库中所有高收入客户的购买方式来实现。有钱客户可以通过收入进行划分,收入信息通常是在申请信用卡时提供,客户所提供的收入数据需要进行调整和纠正。通用的特征是用人口统计及行为信息来定义的,例如,参加高尔夫活动或者去某些富人经常光顾的饭店都可以被定义为高档次的场所。可以通过深入的挖掘来对内部数据源进行开发,用来考察一个商户档次的数据是从数据库中消费金额前10%的交易记录中获得的,或者是从那些高收入客户所产生的相对数额较大的交易中获得的。结合前面的商户分类及这里讨论的商户档次划分,可以帮助银行的市场人员形成关于客户行为特征和生活方式的相关变量或信息。例如,在高档次商户中的大额、频繁的交易就说明客户过着奢华的生活,频繁去澳门交易则说明客户有赌博的嗜好。

地点

交易地点

商户的奢华程度可以通过两个要素进行识别:地址和产品。利用地址来确定奢华类的商户是依据客户喜欢购物的区域来完成的。识别交易地点的方法有很多种,所明确的交易地点的范围也各有不同,有的数据可以帮助确定交易所发生的国家,例如货币种类,因为不同国家使用不同的货币。另外,还可以通过其他商户信息,例如商户编码、商户名称以及在该商户发生交易的客户地址数据等,进行商户地址的提取,所提取的地址信息要比直接通过交易货币种类所提取的信息更细致一些。

尽管很多种商户信息中都可能包含地址信息,但是单独的每种途径所能获取的地区信息都是有限的,并且准确度也不能完全满足分析的需要。同时,考虑到准确度和效率问题,最终结合商户编码规则以及在该商户发生交易的客户地址数据,来进行商户所在城市的确立,以商户编码为主,后者作为补充,具体的实施方法如下:

·商户编码的来源不同,包括银联提供的商户编码、本行自己拥有的商户编码,等等。因此,在根据商户编码进行地区信息提取之前,首先需要了解每种商户编码的规则,从而建立编码与地域的对应关系,并依次通过银联编码、本行编码、其他编码确定商户所在城市。

·提取各种编码中的地区信息之后,仍然有部分商户未能确定所在城市,则通过对在该商户进行交易的客户所在城市,以取现频次最高的客户所在城市为该商户对应的城市。

根据以上方法,通过银联商户编码规则约能确定80%商户的地区,通过本行商户编码约能确定5%商户的地区,通过其他编码规则约能确定10%商户的地区,余下5%的商户所在地区则是通过客户所在城市来确定。

由于商户地址信息是一个新生成的变量,并且其信息来源有几种,因此最大的挑战是如何合理进行信息的匹配和组合,提高地址信息的准确度,在处理过程中面临的主要挑战和遇到的问题有:

·编码规则只能确定商户所在省,不能确定所在市时,如何用客户所在城市信息进行补充?我们选择的处理标准是,如果客户所在省与编码规则确定的省份一致时,才对城市进行补充。如果两者不一致,则不进行市级信息的补充,只取编码规则中的省份信息。

·通过客户所在城市来补充商户地区信息的方法,存在准确度较低的问题。例如,酒店、旅游类商户,由于多为外地人消费,极有可能作出错误判断,但考虑到使用这种方法补充的商户数量不多,误差应在可接受的范围内。

分类的好处是可以帮助市场人员锁定特定的区域。所有的信用卡交易可分为虚拟型和实体型,虚拟型交易是指发生在网上的交易,而实体型交易则是指发生在商户里的交易。在我们的讨论中,只考虑发生在商户里的交易,类别将划分为不同的大洲、国家、城市和行政区。交易地址被系统地排列,并分类到数据库中不同的地址编码中。这样,商户所在的地域可以被帮助识别商户的档次,或者说奢华程度。典型的高端商户集中在城市中心或重要地理位置。例如,中央商业区--香港的商业中心聚集了国际知名品牌,香奈尔、普拉达、赛五林、古奇、雅诗兰黛等。大量的高档商业购物中心以及顶级的宾馆、咖啡屋,也会被设置在知名的商业公司或国际银行所在的位置以为其服务,有时候这些公司或银行就在购物中心的楼上,位于这种位置的商户可以很放心地被归类到高档商户中。至于位于郊区的小型超市或百货公司,则几乎不可能属于奢华商户。这些高端商户的分类,最终用于识别那些生活方式比较奢华的客户。

客户行为习惯/生活方式

账单不仅能够显示交易细节,也能够告诉市场人员客户的喜好。客户行为可以通过他们的交易来获得,包括交易金额、交易笔数、交易所在商户等的评估。在客户分群之前,可以从他们的交易行为中推测客户行为特征,例如行为习惯以及生活方式。

行为习惯

·付小费的习惯

尽管付小费在中国内地还不是一个非常普遍的现象,但是如果在未来服务业发展到一定程度的时候,这将成为惯例,到那时候是否付小费、付多少小费都会体现出客户的某些特征。以香港为例,小费是香港餐饮业的客户对服务生的服务所给予的酬谢。尽管饭店会在每份账单上加10%的服务费,但是顾客仍会以消费金额的一定比例来支付一些小费。在某些情况下,也会因为服务不周而不支付小费。计算小费多少的最好方法就是,用授权金额与客户账单上的金额进行比较,在交易单上可以看到其中的差异。如果两个金额之间的差异为零,则说明该客户没有支付小费。如果两者之间的差异较大,也就说明所支付的小费较多。

考察客户支付小费情况的重要意义在哪里呢?当客户进入饭店,如果他有给小费的观念,则会给为他服务的人员一定比例的小费。例如,客户可能给20%的小费。然而,如果他接受了特别优质的服务,则会增加小费的数目。增加的数目多少取决于客户的慷慨程度,越慷慨的客户给的小费就越多。尽管客户留小费有时候也可能是为了显示其财富、地位或者权力,但是由于付小费本身是一种自愿的行为,因此小费的数目仍然可以说明客户的慷慨程度。在某种程度上,小费也可以反映客户的财产情况。

·价格敏感度

价格敏感度是度量客户对促销、打折活动的敏感程度。一个对价格敏感的客户,非常容易因为产品价格的变动而改变消费的层次。对于这方面的评估,主要有四个因素。

来自商户的促销活动

通常银行总是会与一些大型的商户合作,为信用卡持卡人联合组织一些促销活动,提供某些产品的折扣。通过对客户在促销活动前与促销活动中的消费频次和消费金额的比较,可以计算客户对于促销活动的反应程度,从而说明其对价格的敏感程度。

在银行的合作商户中的交易情况

一般来说,不同的银行都会有成百上千个不同的合作商户来为其信用卡持卡人提供一定的折扣。例如,持有ABC银行信用卡的客户,可以在购买思捷商品时享受九折优惠。如果客户使用卡片的主要动机是为了从银行的合作商户那里得到折扣,那么客户在银行的合作商户的消费频次和金额将远远高于在其他商户中的消费。客户在越多数量的合作商户中消费,就越说明客户是价格敏感的客户。

信用卡积分的使用情况

同类推荐
  • 像狼那样聪明绝顶

    像狼那样聪明绝顶

    《像狼那样聪明绝顶——我们向世界杰出的CEO学习什么》一个企业家要想尽快地取得经营成功,最重要的一点就是要善于向强大先进的企业学习,借鉴并利用他们成功的经验。《像狼那样聪明绝顶》对世界500强企业做强做大的成功谋略进行了详细的分析和阐述。
  • 炒基金其实很简单

    炒基金其实很简单

    从基金基本常识入手,向读者介绍如何选择好的基金、如何管理自己的基金投资组合、如何科学地认识与合理地控制基金投资中的风险,以及基金投资实际操作中的流程与细节,并为读者解答基金投资中一些常见的困惑与问题。《炒基金其实很简单》既适用于新基民,也适用于老基民。是一本广大基民易于接受和掌握的通俗读物。它将帮助您掌握基金方方面面的知识,最终成为轻松、精明、成熟的基民。
  • 大产品

    大产品

    小米凭什么开创“小米模式”,火箭般一飞冲天?特斯拉凭什么接班苹果出任最新版“创新大神”,尽享万人追捧?余额宝凭什么一夜间震动整个中国金融业?“大产品”,一个时代的新物种,未来商业社会的统治者,大数据、云计算、物联网、社交网络、移动互联网发展的必然产物,正在重构整个商业社会。在这个百年难遇的快速迭代式革新的时代,如何适应大产品创新的节奏?如何掌控“大产品”的魔力?如何把握“大产品”的创造、运营秘诀?如何用“大产品”思维改善旧有的营销和管理理念?本书通过一个个翔实的案例,在阐释“大产品”增长空间、“大产品”运作思维、“大产品”破坏力的同时,对中国未来商业的大趋势进行了详尽的全景式解读。
  • 青年创业致富实用指南

    青年创业致富实用指南

    《青年创业致富实用指南》由中国国际广播出版社出版,内容包括:实现一生的辉煌、实现人生的辉煌、每个人都有创业的潜能、形成自己的创业优势、因人而异的创业路、从小事做起、创业问题的解愉之道等。
  • 绩效魔方

    绩效魔方

    总之,不同的人有不同的主张。这些主张和见解大多停留在绩效考核的层面,谈的是绩效考核,做的是绩效考核,一直都是围绕着绩效考核做文章,对绩效考核的形式和逻辑表现了极大的关注,而没有把绩效管理纳入视线,没有弄清楚绩效管理的逻辑,使得绩效考核脱离绩效管理的体系而独立存在,把完整的绩效管理体系简化成一个环节——绩效考核。
热门推荐
  • 快穿之妖精当道

    快穿之妖精当道

    洛水河畔有牡丹为花王,芍药为之相。诗经有云:“维士与女,伊其相谑,赠之以芍药”香芍药乃洛水河畔的妖精,一日受任于天命,被派遣到三千世界中做任务……天命陛下慵懒妖娆的伸了个懒腰,她笑着告诉香芍药:“要让每个天命气运者,获得爱情!”【女尊小说《深渊女帝本轻狂》求支持~】
  • 三大校花闯校园

    三大校花闯校园

    她们是三个女孩在学校里遇见了自己的真爱,有过点点滴滴,但是她们三个中只有一个才能和男主在一起
  • 真爱不计较

    真爱不计较

    他从没想过有一天会有小孩找上门算账——“妈咪是谁你不必知道,奶粉钱、尿布钱……乘以二……总共9057800元,我不介意你去掉尾数,但不准你去找妈咪!”可恶呀!哪个女人坏了他爱过不留痕迹的规矩,还把小孩教得这么精?这一探查之下,才知原来是当年爱他爱惨了的小学妹罗澄。不过风水轮流转,现在换成是他看人家看对眼,还甘心为爱放下身段,当起接送司机;甘心下厨做菜,当个贤夫煮夫;甘心不要自由,巴不得她拿婚约绑住他……
  • 生命密室

    生命密室

    “欢迎来到反人类密室逃脱游戏,祝您活着离开这里!“
  • 绝色废材:妖孽魔皇至尊妻

    绝色废材:妖孽魔皇至尊妻

    她,二十一世纪的超一流杀手。她,魔武大陆的废材三少。一朝穿越,当她成为她。废材之身,不会魔法,不通斗气,爹不亲娘不爱,受尽欺辱。然她已不是她,欺她者,她定要让他们千百倍的偿还回来。你有魔法斗气,我有万兽臣服,素手一拂,天下风云动。待崛起之日,逆天血脉,睥睨天下,无数男女为之癫狂!然而,谁又能料到如此惊才绝艳的她,竟会是女儿身。“女人,跟我走。”“少打我主意,不然我吃了你!”
  • 小村人物

    小村人物

    小村人物将自身特殊体验与人生感悟、现实关怀融会贯通,超越了许多同时代人的局限(如某些“80后”、“90后,,作家热衷的语言游戏、虚拟生活、撒娇和玩世心态),思想视野较为宽广,具备了向上生长和向内掘进的力量。再加上张成对语言的超常敏感和悟性,对各种艺术方法的不拘一格、兼收并蓄,使他的写作达到了一种令人瞩目的境界。
  • 我的初恋是EXO

    我的初恋是EXO

    吴诗雨,本是一个幸福的女孩,她有迁就她的父母和哥哥,还有和她关系很好的朋友。可谁料命运不饶人,竟夺走了她的一切。
  • 快穿黑化值爆表

    快穿黑化值爆表

    【快穿、双宠,1v1】沈梦绑定快穿系统,穿越到各个世界送温暖,拯救黑化的男主,让男主黑化值归零。沈梦:简单n(*≧▽≦*)n。于是,她穿到亲手打断男主的腿一秒之后,她穿到刚刚弄死男主之后,她穿到搞得男主家破人亡的现场。男主(微笑):嗯?听说,你要给我送温暖?沈梦:我不是,我没有!别胡说!#你看这个锅,它又大又圆,像不像你背上的那个?##每次穿成男主仇人怎么破?#
  • 大逍遥

    大逍遥

    命运长河中,永逝之水上,时光之舟逆流,摧毁天地囚笼,挣脱天地大束缚,驶向彼岸,直达——天威降下,摧毁时光之舟,时光碎片、八种道纹散落天地八方——谓之远古大毁灭时代——亿万年,转瞬即逝……
  • 超级明星助理

    超级明星助理

    宅男韩风因为一颗名为“超级明星助理系统”的戒指,成为了当红女明星的助理,从而走上了一条不一样的人生道路!歌唱技能,舞蹈技能,编剧技能,钢琴技能、武术技能,异能技能。。。人体知识技能化,只要有足够的兑换点,便无所不能!装逼,霸道,邂逅女明星,戒指在手,天下我有!这是一个宅男的故事,一个草根成神的故事!(前两卷为都市文,情节很狗血!!!第三卷开始写娱乐明星,不喜者莫入!!!!!!)交流群:173976763