26
2021
11

【新闻】《中国信息报》发表方匡南教授文章

   《中国信息报》2021年11月25日统计学苑版发表了方匡南教授文章《基于大数据的小微企业信用风险测度研究》。

  《中国信息报》是国家统计局主管的综合财经类报纸,它充分依托统计系统丰富的信息资源,努力站在实践、理论和政策的交汇点上,以历史的、现实的、未来的和世界的眼光辑文办报,按照“突出统计特色,洋溢财经气息,透出文化品味,办出专业水准”的要求,拓展新闻报道和信息服务的广度、宽度和深度,不断挖掘有价值的信息,努力提供有思想的新闻。在国家新闻出版总署主办的第三届中国报业竞争力年会上,中国信息报社被评为“2006最具竞争力的行业报”。

中国信息报.jpeg

-------------------------------------------------------------------------------------------------------------------

基于大数据的小微企业信用风险测度研究


2019年12月,武汉发现新型冠状病毒感染者以来,该病毒在国内快速传播,并随后席卷全球,我国政府果断采取了“封城”、企业延期复工等措施来对抗疫情,疫情较快得到了遏制。但是餐饮、旅游等大量小微企业抗风险能力弱、现金流吃紧、短期内贷款偿还能力下降、复工复产伴随更大的融资需求,成千上万小微企业面临的困难成为社会关注的焦点。要帮助小微企业度过难关,最核心是帮助小微企业解决融资需求问题。

我国小微企业数量庞大,据第四次全国经济普查结果显示,2018年末我国小微企业(含个体工商户)数量超过9000万家,占全部企业数量的99.8%,遍布全国不同地区的各个行业,贡献了全国60%的国民生产总值和50%以上的税收,满足了80%左右的城镇就业,因此发展小微企业对我国经济高质量发展具有十分重要的意义。近年来,在政府的大力推动和金融机构的业务创新下,我国小微企业金融服务质量和水平有了较大的提升,但是小微企业融资难、融资贵问题仍然十分突出,尤其是小微企业“首次贷”难的问题。表面上看是缺钱,实质上是缺信息,缺信用,根本原因是银行和小微企业之间存在信息不对称,所以政府除了出台对小微企业贷款的扶持政策,更重要在于完善我国小微企业的信息披露机制,构建有中国特色的小微企业信用体系以及开发小微企业信贷风险指标体系和统计测度方法。

随着大数据、人工智能、区块链等金融科技在金融领域的应用,金融机构可以全方位地收集小微企业多维度信息,采用机器学习等人工智能方法对其贷前风险科学评估,贷后风险及时智能监测和预警,为金融机构有效服务小微企业开拓了一条新的路径。尤其是在重大疫情下,借助于大数据、人工智能等技术的纯线上 “无接触”信用贷款模式成为了眼下许多小微企业的救命稻草。因此,系统地研究我国小微企业的信用风险统计测度方法以及构建我国小微企业信用体系非常重要。

一、小微企业融资难、融资贵问题的原因

中小企业贷款难问题一直制约着我国中小企业的成长和发展,成为我国经济发展的瓶颈之一,这一问题长期以来都备受经济金融理论界的关注。相对于大企业,中小企业更为信息不透明, 并缺乏可抵押的资产、市场竞争力弱,因而中小企业的融资也更为困难。国外有学者研究认为企业处在初创和成长阶段更加依赖从传统金融机构获取资金支持。此外,也有学者研究表明信贷缺口规模受到小企业的行业属性、组织形式、年龄等因素影响,中小企业借贷的约束性条款主要有定期提供财务信息、投向特定项目、缩短贷款期限、要求抵押和担保等。近年来,中国政府通过提供各种优惠政策和补贴、推动银企对接、鼓励发展中小金融机构和担保机构、加强中小企业信用体系建设等措施,缓解中小企业融资难问题。但是我国小微企业融资难、融资贵的问题仍然突出。其中,信息不对称是中小企业融资困境的重要原因。国内有学者建立了一个关于信息不对称和中小企业融资问题的分析框架,认为中小企业“融资难”是由于信息不对称导致较为严重的信贷配给约束,为了减少信用风险,银行等传统金融机构倾向于减少小微企业的信贷业务。国际经验表明,基于全面准确的小微企业信用信息而开发的信用评分能有效解决小微企业与金融机构之间的信息不对称,从而提升小微企业融资的可获得性。因此,发展和创新小微企业征信服务是破解小微企业融资约束的有效方法。比如美国著名的邓白氏(D&B)信用评估公司利用其庞大的全球数据库和客户资源网络,针对中小微企业特点,开发出小微企业信用风险系统解决美国的小微企业融资难问题。另外,基于互联网金融等金融科技具有边际成本递减和边际效益递增的特点,在解决小微企业融资具有天然优势,打破了传统金融的“二八定律”。

总的来说,我国的小微企业融资难融资贵问题带有鲜明的中国特色,既有市场机制原因又有体制因素,需要对这一问题加以系统分析,找出影响我国小微企业融资的关键因素,以及如何借助大数据、人工智能等技术解决我国小微企业融资难融资贵问题?

二、大数据时代小微企业信用风险统计测度方法与存在的问题

小微企业信贷风险管理的核心基础是风险识别问题。传统的信用决策系统主要依赖于专家的主观判断,难以做到科学、客观。为了降低信用决策中的主观因素,基于统计模型的信贷风险测度方法越来越多地被用到决策中。信用评分系统在衡量信用风险的内部评级中占有核心的地位,比如《巴塞尔新资本协议》鼓励银行采用内部评级法评估信用风险,即鼓励银行基于自身业务构建内部信贷风险测度模型。银行对大中型企业信贷风控技术相对比较成熟,对小微企业的信贷风控技术比较欠缺,小微企业由于其特殊性,不能简单套用大中型企业的信贷风险测度方法。另外,在实践中传统信贷风险测度模型也随着时间推移慢慢失效,预测效果变差,导致违约损失增加。信贷风险测度模型不是一成不变,会随社会经济环境、数据类型、法律政策环境、行为习惯等变化而变化。比如国外有学者基于生存分析模型考虑了宏观经济变量的变化,发现个人信用评分结果随宏观经济状态变化。

大数据及相关技术的发展,为小微企业融资服务和风险管理带来了新的契机。通过获取小微企业的经营财务、税务、工商、水电等数据,可以全方位、多维度评估小微企业的信贷风险。但从统计建模角度来看,小微企业信用风险测度存在的问题有:(1)由于数据来源多、数据结构复杂、存在缺失值、数据非平衡等问题,对传统的信用风险测度方法带来了极大的挑战;(2)由于我国信息共享机制不完善以及随着隐私保护要求趋严,数据分散在各个数据源机器上,不能向外提供详细的原始数据,只能在数据源本机上进行分析,向外提供数据的分析结果,所以,在隐私保护机制下传统的信贷风险测度方法就不能用了;(3)贷后的风险管理一直是信贷领域的难点,基于信用风险测度技术,借助于大数据和人工智能等技术及时跟踪和判断客户的风险状况,智能监测和预警违约风险是小微企业信贷风险管理的重点。

综上所述,在多源大数据和隐私保护机制下,需要研究新的信贷风险统计测度方法,促进信贷风险统计测度模型的完善和优化,实现对小微企业信贷风险的识别、评估和贷后预警,提高风险管理的智能化水平。

 

三、我国小微企业信用风险测度的研究展望

(一)  打破数据孤岛、构建实时更新的小微企业数据库

数据是信用风险测度的基础,除了企业直接提供的财务、管理、营销等企业内部信息外,银行可通过调研、实地考察等方式对企业信息进行人工采集,也可利用网络爬虫、文本挖掘等技术在各新闻网站、行业网站、商业数据库中自动采集企业的外部信息,从而保证信息的全面和可靠。同时,由于市场的快速变化,小微企业的信用风险特征随时可能改变。因此,数据库要能够及时更新,为风险测度模型的构建、贷后风险的动态评估提供实时的数据保障。此外,当企业的风险状况发生变化时,需要对数据的收集方式和搜集频率进行灵活的调整,为银行的风险决策提供更有效的信息支持。

(二)  提前识别欺诈风险、减少信用风险测度误差

对于欺诈的客户,由于在财务指标等有意作假,传统的小微企业信用风险测度方法可能没法识别出来,所以往往在信用评估之前先进行欺诈识别。对于欺诈风险识别方法:一方面,由于小微企业的特殊性,银行针对大中型企业的欺诈风险识别技术无法直接套用,但两个业务之间仍存在一定的相关性,因此,可通过迁移学习的方法将银行在大中型企业业务中积累的经验和数据迁移到小微企业的欺诈风险识别建模中,有效改善小微企业信贷业务标签或样本不足的问题,从而提高模型的识别能力;另一方面,在标注能力有限的情况下,可利用离群值检测方法、聚类算法和图算法等无监督算法发现异常模式,辅以有限人工干预进行识别,也可利用主动学习的方法筛选出较“难”分类的小微企业样本交给反欺诈岗位人员审核,提高标注的效率。

 

(三)  创新统计方法、融合多源数据测度信用风险

随着大数据的发展,数据来源越来越多,针对相同或者相似的任务能够收集到多个数据集。这些不同来源的数据,虽然是针对相同或者相似任务收集的,但是由于测量环境、测量标准或统计口径等因素的差异,不能简单将多数据集合并分析。对这种来源多样的复杂数据集如何有效地整合在一起分析是统计学和机器学习研究的新发展方向之一。在众多多源数据融合方法中,其中整合分析是最有前景的方法之一。整合分析方法起源于 20 世纪60 年代, 可以把不同来源、 不同格式、不同特点的数据进行融合建模。相对于单一数据集模型,该方法整合了更多的原始信息,能解决因不同来源数据的差异而引起的建模不稳定,在模型解释性和预测方面都具有显著优势。多源数据的整合分析,可以分为两类,一类是“变量”方向的整合,即不同数据集样本相同,而变量不同,整合不同来源的变量信息,比如信用评分时整合了贷款记录数据,网购数据、公安法院数据等;另一类是“样本”方向的整合,即样本是不同的,但是变量是一样的,整合不同来源的样本信息,比如城市和农村居民的征信数据。

(四)  重视信息安全和隐私、发展联邦学习等新技术

随着2021年9月1日起施行《中华人民共和国数据安全法》和2021年11月1日起施行《中华人民共和国个人信息保护法》,对数据安全和个人信息保护越来越重视。在新的法律要求下,小微企业信用风险测度该如何建模?需要发展能够解决数据安全和个人信息保护问题的新技术和新方法,联邦学习是一种比较有前景的方法。联邦学习是一种分布式的机器学习技术,在此框架下,各数据源本机仅需交换并更新梯度或参数等中间计算结果就能实现联合建模,从而避免了原始信息的交互,有效的控制了隐私泄露。然而,在真实的网络环境中,模型反演攻击、模型推理攻击等恶意攻击手段层出不穷,直接提供中间计算结果仍存在敏感信息被获取的风险。如何利用差分隐私、安全多方计算、同态加密等技术防范恶意分析者对敏感信息的反演攻击,并同时保证通信效率和模型精度是研究的重点。此外,由于数据储存在不同的地区或部门,各数据集的分布往往存在差异,如何挖掘数据间的异质特征也是所研究模型需要考虑的内容。

(五)  借助于大数据和人工智能技术、实时监测贷后信用风险

贷后风险监测是金融信贷的难点之一,但在大数据和人工智能时代,实时监测贷后信用风险变得可能。首先基于多源复杂的数据构建科学的小微企业贷后信用风险指标体系,然后建立贷后风险识别模型,捕捉小微企业经营风险的变化情况,实时跟踪和判断风险状况,精确预测小微企业贷后违约的时点,并利用机器学习等人工智能方法实时动态智能监测小微企业的风险变化情况,实现风险被动防御向主动识别、监测和拦截转变。


« 上一篇 下一篇 »