李长升:大数据技术在社会信用体系建设中具有很广阔的应用空间

中国金融信息网2018年11月16日16:31分类:信用观点

中国金融信息网讯,“首届太湖信用大数据创新应用大赛”自10月12日开始报名以来,社会各界积极回应、报名踊跃。值此大赛即将结束报名之际,作为本次大赛的初赛评审专家之一,优易数据研究院人工智能所负责人、电子科技大学研究员李长升博士,在算法赛初赛的最后冲刺阶段,给大家做了一次深度答疑。他认为,大数据技术在社会信用体系建设中具有很广阔的应用空间,此次比赛有多方面的现实价值。

社会信用

一、您怎样看待目前社会信用情况?

第一,我国的社会信用体系建设正处于全面发展的新阶段。随着党中央、国务院高度重视社会信用体系建设工作,覆盖全社会的征信系统逐步完善,守法诚信褒奖机制和违法失信惩戒机制愈加健全,市场主体诚信档案、行业黑名单制度等措施也体现出我国在社会信用方面做出的巨大努力,使人不敢失信、不能失信,目前成效已初步显现,社会影响力越来越大。在取得成效的同时,还有一些棘手的问题函待解决,如信用信息采集范围有限,数据孤岛,中小微企业和农村信用体系建设等。

第二,互联网对征信的影响巨大。随着大数据的发展,信用体系完善的空间巨大,个人信用信息已经开始收集并可从多方面获取,但数据较为分散。互联网公司开始注重个人信用情况,并利用互联网手段收集个人信息,建立信用评分制度,用以完善信用评分,供企业对个人信用做以评估。同时,企业信息更加公开化,信息获取更加方便,有利于强化信用系统的建设。

二、您对于社会信用大数据的理解?

在互联网大数据时代,各种各样的信息越来越多的被以“数据”形态被记录、存储下来,这些数据包括了人们的基本信息、网络浏览行为、交易行为、社交行为,人们存储的文字、语音、图片、视频等等。

基于大数据的社会信用是建立在“一切数据皆信用”的基础之上,引入各种来源的海量数据,挖掘分析各种数据与信用之间的关系,从中提炼出高价值的信息,并灵活支撑日益增多的各类信用业务应用需求。

大数据技术具有高扩展性、高性能和强大的数据采集、处理、分析挖掘能力,因此在社会信用体系建设中具有很广阔的应用空间。信息大数据时代的到来为我国社会信用体系建设提出了新的发展方向,也为进一步完善信用数据统一平台提供了机遇,运用云计算、大数据等先进技术,推动地方、行业信用信息系统建设及互联互通,通过海量数据处理,逐步消除信息孤岛,实现信息资源全社会共享,发挥奖惩联动的最大威力,推进社会信用体系建设工作向纵深发展。

三、这次的企业合规风险预测,官方提供的数据文件接近20个,每个文件又有很多的属性。您觉得在处理数据的时候,参赛选手需不需要提前了解一些企业合规经营的常识性问题?在这方面您有什么好的建议和我们的参赛选手分享一下?

我认为参赛选手需要提前了解一些企业合规经营的常识性问题。

建议选手了解信用相关知识,中国的信用体系、银行的信用评级准则以及互联网衍生的信用评级方法,并了解企业财报信息和公示出的各信息的意义。

四、如何理解这次比赛的现实价值?

首先,通过对企业信用情况进行预测,同时预测出企业违约的可能性,帮助公司规避风险,规范企业运营;

其次,利用大数据的方法进行企业风险的预测,可以与传统信用预测相结合,推动风控分析的发展;

最后,提供给参赛选手一个平台学习了解信用建模,并对自己的理论知识加以实践,还可与其他选手交流知识,共同提高。

五、数据集中大部分字段都不能直接用做特征,特征提取和特征选择方面有没有一些建议呢?

除了机器学习常见的特征工程的手段,还可以使用自然语言处理技术针对文本信息提取出有效的特征,多挖掘特征之间的关系,应用组合特征、交叉特征、合成特征等可能会得到更好的结果。

六、您对于大数据行业未来的预测?

大数据时代开启人类社会利用数据价值的另一个时代。它是一个好的工具,帮助人们提升社会生产效率,了解事物真相,认识客观规律,同时加快进入智慧社会,全世界都会聚焦于大数据行业。

随着大数据技术的飞速发展,大数据已经融入到各行各业。我国大数据技术的应用尚处于起步阶段,各行业、企业在数据采集和处理、应用等诸多方面均需要探索。展望未来,利用数据更好的了解用户、提供更加个性化的服务是众多企业的共同愿景,因此,提供整体解决方案的大数据公司机会最大。

七、请您给选手一些建议吧!

一是认真分析题目,了解字段的含义,关键点还是在于对业务的深刻理解上,以便构造出强有力的特征,多分析错误。

二是在参赛过程中多与其他参赛者互动,能不断地获得启发,受益良多。

三是模型融合是数据挖掘类比赛的惯用套路。

四是比赛是不断迭代的过程,将比赛代码的流程自动化,是提高比赛效率的一个关键。

五是保持良好的心态,因为比赛会给你带来压力,也许过了一晚,你的排名就会一落千丈。认真去做,这些都是很宝贵的经历。

八、对于进入复赛的选手,您认为应该注意的事项有哪些?

首先,确保算法在线下和线上的结果保持基本一致;

其次,由于评测次数有限,希望大家珍惜每一次评测机会;

最后,不要作弊,不要作弊,不要作弊!

据悉,首届太湖信用大数据创新应用大赛由江苏省信用办、新华信用、中国软件行业协会大数据应用分会指导,苏州市经济和信息化委员会、苏州高新区管委会、中国经济信息社江苏中心主办,苏州市公共信用信息中心、苏州高新区经济发展和改革局、国信优易数据有限公司承办,高新区狮山街道办事处、苏州信用促进会协办,大赛从“开放、共享、应用、创新”四个维度出发,以发掘相关“大数据+信用”创新项目为引,吸引智库人才集聚、吸纳新鲜战略资本,以丰富信用苏州建设储备,深化大数据与信用体系融合,进一步巩固信用苏州建设。(完)

新华社民族品牌工程:服务民族企业,助力中国品牌

新华社品族品牌工程

[责任编辑:韩笑]