关于雪山贷

如何用大数据去判断P2P借贷

2013年12月19 09:07

     投身于P2P贷款领域的很多人都喜欢使用借贷平台提供的大数据去分析行业趋势,并帮助了解谁是借款人,他们对P2P借贷市场风险控制的表现如何。因为很多早期投资人基于借贷平台的线上性质而面向技术导向,所以可能存在这样的误解——想要成为一个成功的投资人,必须要理解并应用这些大数据。但是大数据并非无所不能的,如何用大数据去判断P2P网贷是必须要关注的。

如何用大数据去判断P2P借贷


大数据只能代表过去的表现。

     任何一个曾经通过中间商出售过(或尝试出售)共有基金,股票,债券或其他投资的人都听到或看到过这样一个主题“过去的表现不能代表将来的结果”,确实如此。我们从历史记录中获得的借款人的重要信息,比如支付记录,FICO信用分和负面信息 ,只能代表他们过去的表现如何。如果他们曾经按时偿还了贷款,并不意味着他们也会按时将钱还给我们。但是这增加了偿还的可能性,特别是如果没有重大变故(如失业或生了重病等)的情况下。没有人知道未来会发生什么,这些信息并不具有预见性,它们只能反映过去。

贷款资金池可利用数据少且有时间局限。

     从一些历史记录中,我们并不能获取有意义的信息,但更多人会认为我们获取到的最有意义的信息是早期支付违约的可能性。贷款资金池的长期数据中我们真正能用得着的很少。
大数据各个孤立的因素是相互支撑的

     数据的应用性很大,大数据的一个所谓的好处是你可以利用它研究任何有意义或可能有意义的变量。这些变量中,我们在这里讨论的包括FICO信用分,负面评价,公开呈报,拥有的住房,工作的时间等等。这些信息是好还是坏呢?好处显而易见,我们可以研究那些我们觉得重要并且能够降低我们风险的因素。

     大数据处理的问题是这些变量都是分开的,如果把这些变量放在一起,我们能获得很多有意的信息,一旦分开,这些变量就贬值了。

     比如说,信用分依赖于我们之前讨论过的许多因素,包括偿还记录,负面评价,公开呈报,资信调查,有效的信贷循环以及债务与收入比。当我们筛选信用分时,我们已经综合考虑了这些因素,如果进一步考虑孤立的变量,实际上是多余的,甚至有害于筛选条件的质量。因此,如果我们选择的条件包括信用分较高且没有负面评价两项,尽管我们已经知道没有负面评价会提升信用分,但我们依然重复计算这些因素而不是考虑其他信贷因素,这其实是多余的。

相互关系并非因果关系

     科学家和研究员对这个短语比较精通。意思是,如果2件事物是有关联的,这并不意味着他们之间一件事情发生就会导致另一件事情也同时发生。