牛宝体育新闻

后大数据时代(二):大数牛宝体育据与人工分析

2023-10-15
浏览次数:
返回列表

  现在搞大数据的特别火,但是说实话,懂大数据的没几个。有些搞大数据风控的,你看他们的招聘信息上,要的居然是同时懂数学软件和风控的。别的不说,最懂风控的人是即在信贷一线跑了多年,又在总部做过多年风控政策的,这种人本身就很少了,还要指望这些天天跟业务打交道的人懂编程?再看这些招聘要求,迷信数学建模的就要找懂神经网络的,迷信高科技的要找做机器学习的。我说要是这些公司规模有多大,要搞什么前沿研究,这么做还行,都是些新成立的小公司,这是要逆天还是对数学和计算机技术有什么误解?

  现在很多人搞的大数据是什么玩意儿呢?有段时间我看到一个关于《上古卷轴5》的笑话大数据,在手机上搜了搜,然后手机百度上首页就不断的给我推各种游戏新闻,如果我不搜其他东西,它就能给我一直推下去,最后我把手机百度卸了,改成了火狐。

  这些人做大数据的思路就这么简单,现在的互联网金融公司,总想着用一个足够高端的、复杂的数学模型,从一大堆数据里分析出哪笔信贷业务风险高,哪笔风险低,这属于根本不懂风控的人搞出来的。

  其实大数据风控的核心在于数据获取,而不在于风控模型。举个例子,个人小额信贷,我调查过的一家公司是这么做的:先买通了电信,让他们可以查询任何一个号码的通讯记录,然后从网上爬虫,爬下来一大堆小贷公司的联系电话组成一个黑名单。然后当有人申请贷款的时候,查询这个人的通话记录,凡是在一段时间内多次和不同的小贷公司的电话号码通话的、或者他频繁联系的其他号码里有人多次和小贷公司联系的,他们就认为是不合格客户,拒绝放贷。

  你看这个逻辑很简单吧牛宝体育,而且牛宝体育模型也简单的连中学生都能做,就只看客户和黑名单里的电话的通话频率就行了。就这么简单的一个东西,测试几个月,放贷几千笔,没有一笔坏账,这个水平在信贷业务里算高到恐怖了。当然,还有可以加强的地方, 如果换我去的话,我会再想办法和社保医保打通,通过社保医保的缴费情况、缴费单位、和报销记录,来衡量这个人的就业情况和健康情况。这里面的核心都不是建模,而是你如何选择关键数据,以及如何获得关键数据。

  通过一堆杂乱的数据,用非常高超的建模,实际上也达不到这个效果。另一方面,是资本在推动产业,对于资本来说,能用钱解决的问题都不是问题。从电信获得特征数据就是用钱能解决的问题,但寻找一个特别高超的建模师,就不是资本能解决的,因为资本没有能力识别谁的技术高,谁的技术低。

  单纯通过数据在各种软件上跑是不能解决问题的,表面上看能拟合出一个非常好的曲线来,实际上这样建模的人只是在重复以前的经验,自己都不理解自己做的模型里每个函数背后的意义,结果经济环境不变的时候没问题,经济环境剧变,正是需要准确预测的时候,模型反而失效了。信贷这行业,一旦风控出了大问题,那是辛辛苦苦二十年,一夜回到解放前。因为放贷的利差才百分之几,就算牛宝体育5%,也要做20笔,才能抵得上一笔坏账。遇到环境剧变牛宝体育时,模型失效,基本上就意味着破产了。

  所以,以后真正发展起来的大数据风控,其实是大数据监控,而不是大数据预测。选取最合适监控的数据大数据,然后用人脑去分析监控的结果,而不是把数据往自己都搞不懂的数学模型里塞,然后就指望另一端输出一个正确结果出来。

  要知道选那些数据监控最合适,耗费人脑力最少,就需要经验非常足,长期接触贷款客户的风控人员才能明白。国内大多数风控是不跑一线,不到客户现场调查的,本身对于风控的理解就不足,并且国内懂风控的往往不懂建模、懂建模的没搞过风控,但至少比寻找风控、建模、编程三者兼具的人容易多了。资本往往会寻找砸钱解决问题的途径,而不是依赖天才解决问题。

  机器学习其实也是一样,机器只是用来处理预设好的,有边界的问题,人脑的优势在于可以不断从边界外寻找解决方案。怎么打败AlphaGo?直接拿把斧头把它的机房砸了就行了,拉闸更简单。所以一群人去算计另一群人的时候,不能直接用计算机的思考结果作为指导,因为你不知道被算计的这群人会不会按规则来。现实商业不是游戏,没有一定的条条框框,计算机只是辅助人思考,而不是替代人思考。

  但机器学习给了一种可以替代人思考的幻觉,而所有归属于机器类的东西,都可以用砸钱解决问题。这个幻觉必然误导资本对于机器学习的利用,最后被坑死在幻觉里。

搜索