牛宝体育新闻
有牛宝体育哪些大数据分析案例?
牛宝体育牛宝体育中国著名电视机品牌TCL,2019年推出针对年轻消费者的子品牌电视雷鸟。雷鸟电视将目标用户群定义为“新世代”,推出一系列的智能电视产品。
通过对年轻消费者的扎实调研,雷鸟产品团队围绕年轻人的喜好做了一系列设计,比如外观方面,雷鸟采用一体化设计,将金属超窄边框、独特的三角金属镂空底座、曲面屏幕这几个元素融合起来,打造电视的“颜值之王”。
该款电视机面世后,果然顺利吸引了年轻人下单,广受好评。但是品牌在采集全网用户反馈数据并进行分析后,意外发现被提及最多的称呼为“父母”,相当一部分实际使用电视机的用户为“老年人”。
这一洞察结果令雷鸟团队颇为惊诧。通过数据挖掘与分析,雷鸟团队发现电视机的使用场景中,“父母”和“中老年”等同样表现显著。关键词云中,“爸妈很喜欢”和“老人很满意”也被收录。
通过关联分析发现:雷鸟互联网电视产品确实准确触达年轻用户,但是作为主力消费者的年轻人,有一部分人为父母[看电视]而买,所以电视需同时满足老年人使用场景,以及年轻用户对影音娱乐和游戏需求。
这个过程中,年轻用户是购买者,而父母是受益者,两代人的使用需求更多由年轻人购买决策主导。雷鸟根据此洞察,在产品设计、品牌宣传等环节作出调整,迎合客户,提升体验。
由雷鸟的案例可见,虽然当代客户拥有强自主性,但是也不是绝对的“无迹可寻”。通过客户的体验反馈数据的挖掘、清洗、分析等一系列大数据手段,可以帮助企业洞察到一些被忽略、超出经验判断范围的,散落在盲区的点。
很多年前,我所在会计师事务所受某大型集团所托去它的某家子公司做费用专项审计项目。当时的审计方案是以各明细费用为总体,从中抽取样本去检查费用的真实性和准确性,看是否存在虚报、多报的现象。
到了现场,我们都铆足了劲去翻凭证,检查发票的真实性、凭证后附的原始单据是否齐全、审批签字手续是否完整等等。
最终的审计结果是除了有几张连号的的士票(一个人打车报销,其发票不可能连号,连号是表示乘客问的士司机要了好几张发票,以达到去公司虚报、多报的目的)报销外,并没有发现其他异常,发票都是真的,原始单据也齐全,审批手续也符合制度规定。
项目负责人也准备就此结束项目,其中一个组员在翻看凭证时,发现某部门总的出差油补报销很频繁。
该公司的出差油补政策是如果驾驶私人车辆用于公务、则公司给予2元/公里的油耗补贴。
该部门总虽然报销很频繁,但是呢,凭证后面的原始单据也齐全,什么行驶里程表截图、报销签字手续等都有。
我们的组员将明细账做了个透视表,发现该部门总的出差频率远远高于其他人,而且出差的地点大部分都是A市,这就有点奇怪了。
后来一路排查,该部门总的老婆孩子在A市,他把个人往返两市之间的费用一直在公司报销。
当时还没有大数据的概念,只能靠审计人员利用自己的职业敏感性、专业知识去发现蛛丝马迹。
在审计该公司时,会计在凭证摘要里也只写了谁谁谁出差油补报销,并没有注明报销人出差的城市,如果要想知道是去哪里出差的油补报销,只能去翻凭证后面的附件。
当时我们为了统计该部门总的出差目的地等数据,花了很多精力和时间去翻凭证看附件。
自此出了这件事后,该集团公司出了一条新规,要求会计在做账时,如果是出差油补费用报销,则需要统一摘要格式为“XX于XXXX年XX月XX日~XX月XX日出差XX市油补报销”,如果是业务招待费报销,则需要统一格式为“XX于XXXX年XX月XX日业务招待费报销”,如果是下属代领导报销,则还是要在摘要里注明实际报销人是谁,比如“XX(XX代)于XXXX年XX月XX日业务招待费报销”。
这样的话,集团总部都不用去子公司现场,直接在财务系统里把明细账一导出来,然后从中提取相应字段做数据分析,就能知道每个人每个月的报销频率及报销金额,一旦发现指标异常,就能展开具体核查工作。
特别是业务招待费,有些是领导自己的私人朋友或家庭聚餐所花的费用,然后拿到公司来报,财务也不敢质疑,也不能要求领导在报销单上写清楚招待的谁(毕竟有些是招待政府官员、金融机构等相关人员,比较敏感),所以领导利用自己的职权将私人花费拿到公司报的现象层出不穷大数据。
该集团出了这个新规后,一定程度上就能够遏制这种公款报销私人支出的现象,把所有子公司的数据一拉出来,分析一下各项指标,当事人很难解释,所以各子公司自然而然地会节约支出。
比如要设置哪些分析指标(出差频率、出差地点、报销金额等),指标的正常波动区间是多少(每月两次、每月2000元等),超出这个波动区间则自动预警,同时规范基础数据以便于数据分析(规范凭证摘要格式统一,以便提取字段作数据分析)等等。
如果有小伙伴对数据分析思维养成感兴趣,建议去听一下猴子老师(知乎新知答主、主攻数据分析,30W+粉)分享的《数据分析3天实战训练营》,在知友中的口碑很不错,课程内容涵盖大数据分析思维养成、Excel、Python等数据分析技巧、大厂数据分析经典案例等,能够快速入门大数据分析,现在只需1毛钱就能获得听课名额,快点击下面的链接听起来吧。
记得以前有一次去到一家小公司做年度审计,发现他们家账上挂着10万块的营业外支出,一查明细,是滞纳金及罚款支出。
后来经与财务打听,原来是去年他们公司出现了点状况,又卡在企业所得税申报的时点,他们老板没有钱纳税,后来灵光一闪,现在不是大部分发票都是电子发票吗?那么就采用将电子发票重复打印的方式做账,做高费用,这样当季利润就会大幅下降,从而达到少缴税的目的。
刚申报完没多久,税务局就打电话让企业财务去税务局约谈,然后还来到了企业现场检查会计凭证,很快就发现了猫腻,当场就下了处罚通知书。
后来才了解到,税务局系统能掌控企业所有的发票信息,谁给你们企业开了多少发票,税务局系统一清二楚,比如其他企业今年给A企业总共开了5000万的发票,而A企业在做纳税申报时申报了8000万的费用支出,那税务局系统就会自动发出警报。
因为成本费用支出里不需要发票的只有人工支出,而人工支出的具体金额也可以根据与个税申报系统进行对接而获知,其余的成本费用都需要有发票,而以你公司为抬头的发票开出了多少,税务局系统一目了然,通过大数据一对比分析,你企业做纳税申报时数据是否有水分,系统自动就能判断。
而系统出现预警,税务局工作人员则需要去核查并解除警报,如果确实是有些正常的例外情况触发了警报,则工作人员则将会反馈给技术人员,技术人员会根据这些没考虑到的例外情况去完善预警模块的参数与指标,从而不断提高系统预警的准确度,而实现精准打击偷税漏税。
想了解并学习大数据分析的小伙伴,再次推荐研职在线推出的《数据分析职场大全》训练营,从数据分析思维养成、Excel、Python等数据分析工具使用技巧、大厂经典数据分析案例分享等应有尽有,能够快速入门数据分析,助力工作效率及汇报展示,现在只需要花0.1元即可获得参营资格,需要自取。
之前还听说过一个案例,就是某纪委将全市各机关单位的油卡、公车、里程、维修等数据统一采集分析。
数字化是现在企业、高校、事业单位大力发展的新型管理模式,而数字化的基础就是大数据分析,基于大数据去指引企业的管理行为、经济决策等。
这里是奥迪特饼干的会客厅,前四大审计经理,CPA+法考+税务师三证持有人,更多干货内容请移步阅读下面的回答:
这个就问到我的专业了~这里分享几个我司做的数据分析真实案例,希望对你有所帮助。
通过整合各类信息系统的数据资源,实现数据显示、情况分析、人员监测等多种功能,适用于卫生管理、医院管控、病例分析、舆情分析、社区监控等领域。
支持与医院各类OA、HIS等应用系统集成,可将医院数量、医护人员资源、床位和设备资源等信息进行实时可视化监测,并结合人口信息,帮助加强管理者对医院资源的监测和感知。万一面临突发情况,管理人员可最大程度分配调集医疗资源,做到把控有度,调节有序。
信息技术、调度技术、自动化技术在智能电网的发展中不可或缺。而电网大屏可视化决策系统成为智能电网的重要助力,支持整合电力部门现有信息系统的数据资源,覆盖基建、运检、调度、生产、营销、安监等多个业务领域,实现数据融合、数据显示、数据分析、数据监测指挥等多种功能,可广泛应用于监测指挥、分析研判、展示汇报等场景。
服务调度管控平台主要包括山东省95598话务监测、工单监测、紧急工单过程管控、停电监测四个模块。平台基于亿信华辰BI软件亿信ABI搭建,电网公司基于“sg186系统”及“95598业务支持系统”构建数据中心,亿信ABI通过JDBC接口连接数据中心业务数据,利用丰富的统计图、地图资源及数据分析技术,对各业务数据进行动态、交互式的可视化展现。在PC端设计完成的分析图表,可完美在大屏呈现展示,便于领导随时审查,对于异常状况及时处理,辅助领导决策。
话务监测模块:统计展示当日山东省全部的线地市公司的日同比变化情况。通过点击下拉框选择日同比、小时环比、除夕同比进行互换展示。
工单监测模块:统计展示当日山东省的工单总数、同比变化率及全部业务类型的所有工单的日同比变化情况。通过下拉框筛选工单类型、业务类型、单位信息,展示日同比、小时环比及除夕同比变化情况。通过地图动态播放各地市工单信息。
紧急工单过程管控模块:统计展示山东省全部(城市+农村)类型的故障报修业务类型的工单及环节信息。该模块包括故障报修、投诉及服务申请业务类型四个页面。
停电监测模块:包括停电时段分布和停送电单位分布。通过堆积图的形式展示停电时段分布和停送电单位分布信息。
一商宇洁是广州宝洁有限公司的核心分销商之一,公司以代理化妆品和洗化产品为主,随着市场开拓区域不断扩大,销售额连年递增。而在双十一、双十二等大促活动期间,交易、处理、配送等业务数据,缺少及时的、直观的可视化展示途径。
基于以上情况,一商宇洁采用亿信ABI酷屏功能,自助完成从前台的订单成交、后台的审单推送、仓配的发货配送、到订单完成签收等订单全链路的实时情况呈现。
通过数据可视化大屏解决了以往业务数据没有及时的、直观的可视化展示途径,在大促的活动时,帮助企业及时有效的观测前台交易、后台订单处理、仓配效率,以及订单的完成情况。
数字化浪潮来袭,各行各业都在颠覆传统的路上砥砺前行。使用合适的数据分析产品、聪明地使用和管理数据,才能在长期竞争中成为终极赢家。不得不自夸一下,亿信华辰已为金融、税务、医疗卫生、应急、电力、教育等100多个行业7000多家客户提供数据产品和服务。
关于亿信华辰亿信华辰是中国专业的智能数据产品与服务提供商,一直致力于为政企用户提供从数据采集、存储、治理、分析到智能应用的智能数据全生命周期管理方案,帮助企业实现数据驱动、数据智能,已积累了8000多家用户的服务和客户成功经验,为客户提供数据分析平台、数据治理系统搭建等专业的产品咨询、实施和技术支持服务。
1)Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。
在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。
它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许未来数年后,它们搜集的数据能让医生给你的诊断变得更为精确,比方说不是通用的成人每日三次一次一片,而是检测到你的血液中药剂已经代谢完成会自动提醒你再次服药。
乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。
1)智能电网现在欧洲已经做到了终端,也就是所谓的智能电表。在德国,为了鼓励利用太阳能,会在家庭安装太阳能,除了卖电给你,当你的太阳能有多余电的时候还可以买回来。通过电网收集每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来2~3个月时间里,整个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。因为电有点像期货一样,如果提前买就会比较便宜,买现货就比较贵。通过这个预测后,可以降低采购成本。
2)丹麦的维斯塔斯风能系统(Vestas Wind Systems)运用大数据,系统依靠的是BigInsights软件和IBM超级计算机,分析出应该在哪里设置涡轮发电机牛宝体育,事实上这是风能领域的重大挑战。在一个风电场20多年的运营过程中,准确的定位能帮助工厂实现能源产出的最大化。为了锁定最理想的位置,Vestas分析了来自各方面的信息:风力和天气数据、湍流度、地形图、公司遍及全球的2.5万多个受控涡轮机组发回的传感器数据。这样一套信息处理体系赋予了公司独特的竞争优势,帮助其客户实现投资回报的最大化。
法国电信-Orange集团旗下的波兰电信公司Telekomunikacja Polska是波兰最大的语音和宽带固网供应商,希望有效的途径来准确预测并解决客户流失问题。他们决定进行客户细分,方法是构建一张“社交图谱”- 分析客户数百万个电话的数据记录,特别关注 “谁给谁打了电话”以及“打电话的频率”两个方面。“社交图谱”把公司用户分成几大类,如:“联网型”、“桥梁型”、“领导型”以及“跟随型”牛宝体育。这样的关系数据有助电信服务供应商深入洞悉一系列问题,如:哪些人会对可能“弃用”公司服务的客户产生较大的影响?挽留最有价值客户的难度有多大?运用这一方法,公司客户流失预测模型的准确率提升了47%。
北美零售商百思买在北美的销售活动非常活跃,产品总数达到3万多种,产品的价格也随地区和市场条件而异。由于产品种类繁多,成本变化比较频繁,一年之中,变化可达四次之多。结果,每年的调价次数高达12万次。最让高管头疼的是定价促销策略。公司组成了一个11人的团队,希望透过分析消费者的购买记录和相关信息,提高定价的准确度和响应速度。
1)数量:团队需要分析海量信息。他们收集了上千万的消费者的购买记录,从客户不同维度分析,了解客户对每种产品种类的最高接受能力,从而为产品定出最佳价位。
2)多样性:团队除了分析了购买记录这种结构化的数据外,他们也利用社交媒体发帖这种新型的非结构化数据。由于消费者需要在零售商专页上点赞或留言以获得优惠券,团队利用情感分析公式来分析专页上消费者的情绪,从而判断他们对于公司的促销活动是否满意,并微调促销策略。
3)速度:为了实现价值最大化,团队对数据进行实时或近似实时的处理。他们成功地根据一个消费者既往的麦片购买记录,为身处超市麦片专柜的他/她即时发送优惠券,为客户带来便利性和惊喜。
透过这一系列的活动,团队提高了定价的准确度和响应速度,为零售商新增销售额和利润数千万美元。
很多企业在做SEM的过程中,都有这样的感触:每年都会花费大量的预算在SEM推广中,但是因为关键词投入产出无法可视化,常常花了很多钱却不见具体的回报。在竞争如此激烈的SEM市场中,企业需要一个高效的数据分析工具来尽可能地帮企业优化SEM推广,例如BDP,来帮企业节省不必要的支出,提升整体的经营绩效。企业可借助数据平台提供的网络营销整合解决方案,打通各个搜索引擎营销(SEM)、在线客服系统和CRM系统,营销竞价人员无需掌握复杂的编程技术,简单拖拽即可生成报表,观察每一个关键词的投入和产出,分析每一个页面的转化,有效降低投放成本。通过BDP实况分析数据,可以快速洞悉对手关键词的投放时段、地域及排名,并对其进行可视化的分析,实时监控自己和竞争对手的投放情况,了解对手的投放策略,支持自定义设置数据更新的时间点、监控频次和时段大数据,及时调整策略。知已知彼,才能百战不殆。
意料之外:胸部最大的是新疆妹子。曾经淘宝平台显示,中国女性购买最多的文胸尺码为B罩杯。B罩杯占比达41.45%,其中又以75B的销量最好,其次是A罩杯,购买占比达25.26%,C罩杯只有8.96%。虽然淘宝数据平台不能代表一切,但是结合现实来看,这个也具有普遍的代表性,只能感慨中国女性普遍size。在文胸颜色中,黑色最为畅销,黑色绝对是百搭,每个女性必备。从省市排名,胸部最大的是新疆妹子。这些数据都对于文胸店铺而言是很好的参考,为店铺的库存、定价牛宝体育、款式选择等策略都有奠定数据基础。
微软大数据成功预测奥斯卡21项大奖。2013年,微软纽约研究院的经济学家大卫•罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。今年罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。
总的来说,大数据的终极目标并不仅仅是改变竞争环境,而是彻底扭转整个竞争环境,带来新机遇,企业需要应势而变。企业只有认识到这一点,使用合适的数据分析产品、聪明地使用和管理数据,才能在长期竞争中成为终极赢家。
本回答以某国产新势力造车企业的选址项目为例,讲述时空大数据及GIS在商业化选址中的探索应用。
随着特斯拉和蔚来用直营模式在市场上逐渐站稳脚跟,更多车企意识到“用户思维”的重要性,因此他们也开始尝试改变销售模式牛宝体育,由批发转向零售,直面消费者。
直营模式的第一步就是要建立完整的营销渠道体系,其中包括销售门店选址、短期巡展商场选址、售后服务中心选址、品牌充电场站选址、线上新媒体广告投放选址、线个场景。
下图为利用时空大数据及GIS进行车企营销渠道选址的技术架构图,以新能源汽车轨迹数据、人口分布数据以及AOI数据为数据基础,对其进行清洗、处理、建模以及指标计算,通过数据了解目标群体客户居住在哪里、常去哪些商场、固定在哪里充电,从而帮助车企进行营销渠道选址。
车企依据国家标准(GBT32960.1-2016)实时从新能源汽车上采集车辆运行数据并汇聚到当地新能源汽车数据中心以及北京理工新能源汽车国家监测与管理平台。
采集的静态车辆属性数据包括车架号、车辆品牌,车辆型号、车辆购买年月等;采集的车辆动态运行数据包括位置数据、整车数据、电机数据、电驱数据、电池数据以及报警数据;采集频率是5~30秒一条。
下图为某辆车某次出行的连续轨迹数据,这辆车从浦东新区的中环森兰国际出发,经过中环高架路到达虹口区的海怡花园。
利用新能源汽车数据中的车辆品牌、车辆型号、购买年月并结合动态位置数据,可以了解目标客户群体的时空分布特征从而赋能选址工作。
下图为人口分布数据示意图,利用人口分布数据可以清楚地了解城市内居民的时空分布特征,在大规模线上广告投放中可以准确地瞄准人群聚集区域进行投放,以最低的成本尽可能触达到更多的人口数量,节省大量不必要的成本支出。
AOI数据(Area of Interest)指的是互联网电子地图中的兴趣面,包含名称、地址、类别、经纬度坐标四项基本信息,主要用于在地图中表达区域状的地理实体,如居民小区、商场、写字楼、产业园区、综合商场等。
在营销渠道选址中使用AOI数据可以将非结构化的车辆轨迹数据以及人口分布数据落到具体的AOI实体边界中,以AOI为载体形成具体指标,例如某小区中高价值车辆的保有量、某商场中高价值车辆的停驻次数等,利用这些指标可以直接进行营销渠道选址。
由于接入的车辆轨迹数据以及AOI数据存在空值率高、坐标偏移、坐标网格化、地理坐标系不统一、AOI实体缺失等问题。因此在使用数据之前需要进行数据清洗,清洗的步骤包括常规数据清洗、轨迹纠偏、网格化筛选、地理坐标系统一、AOI补充。
对车辆轨迹数据、人口分布数据以及AOI数据进行常规数据清洗,具体步骤包括:
对车辆静态属性数据、人口分布数据、AOI数据进行去重处理、缺失值及异常值处理。
剔除车辆轨迹数据中关键字段空置率的车辆数据,关键字段包括经纬度坐标、累计里程数、剩余电量
剔除车辆轨迹数据中关键字段异常率高的车辆数据。经度正常范围是70°~138°,纬度正常范围是2°~55°,累计里程值正常范围是0公里~5000000公里,剩余电量正常范围是0%~100%
针对车辆轨迹数据中剩余电量字段范围不一致的情况(有的车企电量最大值是100,有的车企电量最大值是255)进行一致化处理
针对人口分布数据中人口数量值字段的缺失值或异常值,利用均值插值的方法进行补充
由于GPS定位精度受到硬件及周边环境因素的干扰,车辆轨迹数据偶尔会出现坐标点偏移的情况
针对轨迹偏移的情况,计算待判断坐标点与前后两个坐标点均值之间的距离,如果距离超过阈值(阈值一般是100米,针对采集频率的不同需要进行调整),则为偏移点需要剔除。
由于经纬度坐标值位数较长,在传输过程中可能因为通信协议的限制被强制取整,例如121.342313-121.34。存在这样问题的车辆轨迹数据在空间上呈网格化的特征,这样的数据对于时空行为特征探查是没有意义的,因此需要识别并剔除。
实际操作中用group by的方法提取每辆车唯一的经纬度坐标值,如果唯一的经纬度坐标数量与轨迹点总数量的比值过小,则车辆存在网格化的问题。
不同的车企会根据不同的地理坐标系采集车辆轨迹数据,坐标系不统一会造成数据分析结果的偏差,因此在使用车辆轨迹数据之前先要确保地理坐标系的一致。
在实际操作中发现AOI数据存在重要地物缺失的问题,如下图所示为厦门AOI数据,其中SM广场一期和SM广场二期都缺失,这会对选址工作带来偏差。因此,在使用AOI数据之前,需要对缺失的重要地物进行补充。
这边利用高德地图POI数据检验AOI数据的完整性,如下图所示,蓝绿色面图层是AOI数据,点图层是商场类POI数据,其中红色点是POI存在但AOI不存在的商场,针对这些缺失的商场进行手动补齐。运用相同的办法可以补充住宅小区、写字楼、产业园区等其他重要地物。
车辆轨迹数据属于非结构化数据,体量大且不能直接进行指标计算。因此,在指标计算之前需要建模将连续的车辆轨迹数据转变为只有起点和终点信息(包含经纬度坐标、时间、行驶里程、电量)的次行数据。
下图为次行切割模型的具体实现步骤,大概思路是先根据点与点之间的时间差进行自然切分,之后针对每段轨迹进行固定长度窗口切分并判断每个窗口的状态(行驶、停驻、充电),最后对相邻同状态的窗口进行合并形成次行数据。
在商业化选址中潜在客户的居住聚集区域是重要的参考依据,因此需要对次行数据进行建模并识别车主的居住地。
下图为某辆车一段时间内的次行数据,可以明显地看到这辆车的数据以南花园为中心散开,所以推测上南花园可能是这辆车的居住地。
针对某辆车的次行数据,筛选17:00~24:00之间的到达坐标点以及6:00~10:00之间的出发坐标点,并形成一个坐标点的列表
利用DBSCAN算法对上面的坐标点列表进行密度聚类,得到若干个该车辆的聚集停留点
将聚集停留点与AOI数据进行空间匹配,在满足落到住宅小区前提下热度最高的聚集停留点就是该车辆的居住地。(可连续观测多个月数据来提高识别准确性)
通过建模得到车辆的次行数据以及居住地数据之后需要将这些坐标点与AOI数据进行空间匹配计算,最终将数字格式的经纬度坐标数据转换为具有实际意义的AOI实体。
例如某辆车某次的起点坐标是121.501601,31.23299,终点坐标是121.47663,31.232435,那么通过空间匹配计算我们就可以知道这辆车这次出行时从汤臣一品到人民广场来福士商场。
利用下图所示算法可以判断坐标点是否在AOI面内,或者也可以直接用Python中的GeoPandas库以及Java中GeoTools库完成这步计算。
利用上面的算法确实能够进行准确的空间匹配计算,但是对于大规模坐标点以及AOI面的计算效率较低,因此需要用技术手段来提高计算效率。
实际操作中,通过建立空间网格索引的方法来提高空间匹配计算的效率,用简单的浮点计算代替复杂的空间计算,下图为该算法的具体流程。
经过数据清洗以及数据处理之后,已经将非结构化的车辆轨迹数据变成结构化的次行数据。接下来基于车辆行为日期类型、时间段、车辆价值、车辆购买时长6个数据维度进行计算,形成以AOI数据为载体的数据指标用于商业化选址。
在计算单个AOI数据指标的基础上,利用GIS中的缓冲区计算工具分别计算目标AOI周围1.5公里、3公里、5公里、10公里、15公里范围内的各项数据指标和。
车企商业化选址共有销售门店选址、巡展商场选址、售后服务中心选址、品牌充电站选址、线上广告投放选址、线个场景,针对不同的选址场景需要用不同的数据指标进行赋能。
销售门店是车企最重要的固定曝光点,是车企在当地城市中的旗舰标杆。销售门店需要选在具有稳定且带有巨大流量的商场,选址需要用到的数据指标包括(以某高端品牌车企为例,下同):
巡展商场是车企的流动曝光点,相比销售门店成本较低且灵活性较强,一般一场巡展10天到半个月左右。巡展商场的选址逻辑和销售门店大致相同,在人流稳定的商场建立门店进行长期收割,在人流不太稳定的商场开展巡展进行定期收割,另外可以通过数据探查每个商场流量较高的月份并进行巡展。
售后服务中心是车企对已售出车辆提供养护及维修服务的场所,需要选在场地面积大且方便客户出行的区域。选址标准是以某城市所有售后服务中心为中心做15公里的缓冲区,所有缓冲区加起来需要覆盖80%的客户居住地。
品牌充电站是车企给车主提供的增值服务,同时也是在潜在客户面前曝光的重要渠道。品牌充电站需要建立在两类地方,第一类是自己品牌车主聚集的居住地、工作地附近,目的是方便车主临时充电提升使用满意度;第二类是所有品牌车主聚集充电的地方,目的是提升在潜在客户(其他品牌车主)面前的曝光度。
线上广告指的是抖音、微信朋友圈等效果类广告投放,目的是获得更多潜在客户的电线万以上车辆的停驻车辆数可以在时间和空间2个维度准确地找到目标客户群体,优化广告投放的时间和空间逻辑,避免大量不必要的成本支出。
线下广告指的是楼宇电梯广告、停车场道闸广告等。利用车龄5年以上的40万以上车辆的停驻车辆数等相关指标可以找到可能需要换车的高净值客户聚集的住宅小区。