企业大数据智能风控:内涵、技术框架与实施流程

时间:2023-07-21 10:40:06  来源:网友投稿

程平 万梦竹

【摘 要】 随着大数据、人工智能等新一代信息技术的发展与应用,传统的企业风险管理模式面临着在模式、技术、流程方面的转型。文章基于企业风险管理理论及其演变,结合大数据和人工智能等新技术定义了企业大数据智能风控的概念并阐述了其内涵,构建了企业大数据智能风控的技术框架,探索了企业大数据智能风控的实施流程,最后以采购业务中的供应商评级为例阐述了大数据智能风控如何具体实施,旨在建立较为通用的企业风险控制理论方法体系,为企业风险控制的实施、大数据智能风控理论和方法体系的建设等提供参考和支持。

【关键词】 风险控制;

大数据;

人工智能;

智能风控

【中图分类号】 F272;
TP315  【文献标识码】 A  【文章編号】 1004-5937(2023)12-0143-07

一、引言

党的二十大报告指出“高质量发展是全面建设社会主义现代化国家的首要任务”,同时习近平总书记还强调要完善国家安全法治体系、战略体系、政策体系、风险监测预警体系。对于想要提高竞争力的企业而言,量已经不再是首要的发展目标,健全完善的企业管理体系、风险控制体系才是企业持续发展的保障,才能够让企业有机会在日益激烈的市场竞争中获得质的有效提升和量的合理增长。

在科技加速进步、经济不断发展的背景下,企业的经营业务、经营模式不断发生着变化,同时也意味着企业将面临诸多的不确定性,而传统的企业风险管理体系可能无法提前识别出隐藏的风险,难以满足现代企业的风险控制需要。以大数据、人工智能为代表的新技术可以为风险控制领域提供新的管理思路,大数据技术能够帮助企业整合多方面的数据,使风险评估更多维、更客观;
人工智能技术可以构建算法模型,更加准确地分析与预测企业的风险,提高风控效率。因此,对于企业而言,将大数据、人工智能等新技术融入风险控制过程,及时调整或重构企业的风险管理体系,提升企业在大数据时代的风险控制能力,让企业风险控制从手工化、碎片化、定性化向智能化、系统化、定量化发展,才有可能继续发挥风险管理体系应有的作用,保障企业稳健发展,提升企业经营绩效。

大数据、人工智能时代下,运用新技术提升企业风险控制水平逐渐受到学术界和实务界的关注。目前,已经有许多企业将大数据运用于业务分析及处理,有利于企业更准确地制定未来发展战略,提高企业竞争力[1]。卢小宾等[2]基于传统的银行风险分析体系以及大数据对风险分析的影响,提出了面向风险管理的银行大数据分析系统架构,能够有效整合不同类型的数据,从而使风险控制更精细、更全面。王昕[3]通过分析电商企业财务风险现状与成因,以及大数据以哪些机制影响电商企业财务风险管理,最终从数据产生层、数据分析层和数据应用层三个层次构建了基于大数据的电商企业财务风险管理体系。王玉龙等[4]运用7种机器学习算法构建了企业债务违约风险预测模型,并通过实证研究表明该模型不仅能够有效进行债务违约风险预测,还有助于监管部门针对性监督上市公司财务状况。崔宏[5]阐述了现阶段税收风险管理存在的问题,深入分析了税收大数据在风险管理中的作用,并提出了通过税收大数据发挥监管效能、打通风险管理、连接风险分析链条等建议。何苗等[6]研究了数据经济时代下企业风险的性质变化与企业风险管理的策略变化,探讨了企业风险管理各环节如何进行数字化转型,得出了要在风险识别阶段提高数据化风险感知能力、在风险评估阶段构建智慧化标准体系以及在风险应对阶段形成自动化应急机制的结论。

现有文献关于大数据和人工智能等新技术在企业风险管理领域的研究大多集中在两个方面:一是现有风险管理体系在大数据时代的问题与建议等方面的理论研究;
二是大数据和人工智能等新技术在银行、电商等行业的风险管理体系构建。然而,企业大数据智能风控到底为何物,不同行业的企业又该如何运用实施,这些都没有统一的界定与标准。大数据智能风控在企业中虽已有所实践,但应用领域仍有局限性,缺乏较为通用的风险控制架构。基于此,本文从企业大数据智能风控的内涵、技术框架、实施流程三个方面进行研究,为企业在不同业务流程中实施大数据智能风控建立较为通用、系统的理论和方法体系。

二、企业大数据智能风控的内涵

本文基于对企业风险管理理论内涵的理解以及大数据和人工智能等新技术的应用,将企业大数据智能风控定义为使用大数据、人工智能等新技术在企业中进行业务流程梳理、风险及风险因素分析、风险评估指标/特征体系构建、大数据采集、大数据预处理、数据仓库构建、风险评估、风险评估结果可视化和风险评估报告生成等一系列风险管理措施的过程。这一过程的核心思路是通过深入分析企业需要实施风险评估的业务场景,对企业内外部的大量数据进行采集、处理,再通过构建算法模型和风险评估指标体系,以此进一步做出更加高效、准确的决策。简而言之,企业大数据智能风控实际上就是对业务的分析、对数据的管理和对模型的构建的过程。

企业大数据智能风控中的“风控”是指风险控制,和内部控制有所异同。相同之处在于,内部控制的本质是风险控制,企业全面风险管理涵盖了内部控制。不同之处在于,风控主要围绕企业战略经营目标,既关注内部的财务、运营等风险,又关注外部的市场、监管等风险;
而内控更加关注企业内部业务流程、制度的合规性与完整性。

三、企业大数据智能风控的技术框架

企业大数据智能风控的技术框架是企业实施大数据智能风控的基础,同时也明确了风险控制过程中数据从采集到处理、存储等过程的机制,以及如何基于数据搭建起针对多业务流程、应用多技术工具、实现多方面应用的风控模型。企业大数据智能风控技术框架分为数据采集层、数据处理层、数据存储层、风控服务层、风控应用层,如图1所示。

(一)数据采集层

企业日常经营活动中涉及的数据主要来源于企业的OA系统、财务系统、互联网平台、仓储系统、生产管理系统等。在采集这些数据时,需要根据数据类型、来源的不同使用不同的采集方式,例如网络爬虫、分布式数据采集、连接公开应用程序接口(API)和机器人流程自动化(RPA)采集等。网络爬虫可以根据预设好的规则自动抓取互联网网页的内容;
分布式数据采集可以通过Sqoop、Flume等工具采集数据并存储到基于Hadoop的分布式文件存储系统中,提高数据可靠性;
连接API可以直接连接不同软件、平台的公开接口来实现数据互通;
RPA采集可以模拟人的操作在企业内部系统、互联网平台等抓取数据。

(二)数据处理层

大数据环境下,由于采集的数据来自于多个不同的数据源,相同的属性在不同系统、不同数据表中可能具有不同的命名,容易阻断数据之间的联系;
数据表数据量大,总会存在许多冗余属性、缺失值等,所以在将数据存储、应用之前,必须将采集到的原始数据处理成符合后续操作要求的格式。大数据处理分为批量处理和实时处理两种,也叫做离线处理和在线处理。在线处理可以在秒级或者毫秒级处理和展示实时数据流,例如数据库的一次查询;
离线处理可以一次性处理大量的历史数据,例如批量地压缩文档。

(三)数据存储层

数据存储层主要通过依托Hadoop集群的HDFS分布式文件系统和数据仓库来完成数据的管理与存储工作。HDFS不仅可以存储PB甚至更高量级的数据,还可以通过多副本机制提高数据容错性,数据更加安全可靠。其存储的大量企业数据可以为数据仓库的构建提供稳固的数据基础,数据仓库可以从中抽取数据并按主题集成,提高了数据的访问查询效率。为了高效准确地分析企业各业务板块存在的风险,企业可以按照业务流程来划分数据仓库主题,例如供应商准入、供应商评级、采购合同签订、采购验收入库、销售计划编制、销售发货等主题。

(四)风控服务层

在大数据时代,仅对企业数据进行简单的环比、同比等已无法满足现有的需求,因此企业需要综合运用大数据和人工智能等新技术,从企业内外部海量的数据中挖掘风险信息,并实现量化评估。企业可以利用基于机器学习算法与业务模型构建财务风险预警模型、供应商评级模型、销售预测模型、资产配置决策模型等;
也可以构建大数据风险评价指标,例如准入资质合格性、應收账款可回收性、资产闲置率、商业折扣合规性等,以定量和定性相结合的方式,充分利用企业内外部数据,发挥风控服务层作为大数据智能风控的技术基础层的作用。

(五)风控应用层

大数据智能风控可应用于采购业务、销售业务、资产管理、人力资源管理、财务管理、生产制造、仓储管理等多种场景,但企业需要根据自身技术水平、行业特殊性以及具体的业务场景,从业务需求、流程优化和技术选型等方面分析自身具体的问题,从而实现更有精准的风险控制。大数据和人工智能等新技术可以通过风险实时监测、统计分析、智能预警、生成可视化风险评估报告等方法辅助企业实现风险控制,既便于企业内不同层级的信息传递,又便于风险报告使用者及时做出风险管理决策。

四、企业大数据智能风控的实施流程

结合传统风险管理流程与大数据和人工智能等新技术特点,本文提出了企业大数据智能风控的实施流程,包括业务流程梳理、风险及风险因素分析、风险评估指标/特征体系构建、大数据采集、大数据预处理、数据仓库构建、风险评估、风险评估结果可视化和风险评估报告生成,如图2所示。

(一)业务流程梳理

业务流程梳理是基于某些原则,结合实际的业务场景和业务需求,明确企业应当采取的行动和步骤。无论业务是基于线下还是线上开展,都存在其相对固定的操作流程。在梳理该流程的过程中,风控人员一定要和业务人员沟通和确认,最大限度地还原业务流程,否则容易忽略核心环节。梳理时可以先提炼流程主线,再明晰每个活动的具体内容,最后考虑各环节之间的流转条件。除此之外,还应当思考一些关键问题,比如梳理流程是按照现状梳理,还是按照预期的流程梳理?流程中哪些细节是一定要体现的?是按照操作的变化、角色的分工还是按照数据的流转来梳理流程?这些问题都会对业务流程梳理产生重要影响。

(二)风险及风险因素分析

梳理完业务流程后,应结合企业以往风险发生情况、市场客观因素等方面,来分析、判断哪些环节可能存在哪些风险,并对风险的成因进行分析。风险因素就是风险发生的潜在成因,进行风险因素分析时应当对这些潜在的、可能导致风险发生的因素进行评估与分析,从而确定风险发生概率大小。为了确保企业稳健发展,风险对企业实际工作的影响是一个重要的考虑因素,应该根据风险对企业的潜在影响进行风险排序,最终可根据各个风险值对整体工作或项目的风险进行评估。除此之外,还应当考虑不同风险因素对同一风险的影响程度,并分别为其设置相应权重,以此反映各因素对风险的影响。

(三)风险评估指标/特征体系构建

该步骤是指构建大数据风险评估指标体系,以及构建智能风控算法模型所需的特征体系。大数据风险评估指标体系可以快速识别出某些业务环节存在的风险,适用于能够结合固定的风险评价标准直接通过计算公式、条件判断等实现风险评估的业务场景,或每次评估彼此独立、对后续评估没有影响的单次风险评估。比如将货物验收时的抽样合格情况与AQL对照表中的相应标准进行对比;
又比如通过资产负债率指标来评估企业的举债经营风险。企业构建智能风控算法模型可以通过对现有数据的不断学习,挖掘企业内外部大数据背后隐藏的信息,从而更准确、更客观、更科学地实施风险评估与控制。比如通过对企业未来销量的预测,可以识别出销售计划编制是否存在风险。无论是指标还是特征,设计时都需要遵循可操作性、客观性、重要性等原则[7]。

(四)大数据采集

企业大数据智能风控涉及的数据主要可分为互联网数据、数据库数据、日志数据和其他数据四种类型。互联网数据包括大量的图片、音频、视频等半结构化或非结构化数据,通常通过网络爬虫或连接API等方式将数据提取再统一转换。数据库数据主要来自于企业OA系统、ERP系统、SCM系统等关系型数据库,多为结构化数据,数据量大但采集难度较小,可通过连接数据库或使用Sqoop工具进行采集。日志数据包含来源于企业各种系统、互联网平台等产生的大量日志文件,多采用分布式架构工具进行采集。其他数据涵盖企业生产设备、机器系统等的能耗数据、视频数据、图片数据等,以及供应商资料复印件、发票等企业本地保管的纸质文件,可通过专用接口、OCR识别等途径采集。

(五)大数据预处理

企业内外部所产生、涉及的数据很多,但并非所有都适合用于大数据智能风控,其中有些数据可能并非风险评估所关注的内容,甚至有些数据还会对最终结果形成干扰,所以大数据预处理主要是为了整合来自不同数据源的数据,既能提高原始数据的质量,又为后期分析工作夯实了基础。大数据预处理方式通常包括删除重复数据、填补缺失值、数据降维、转换数据类型等操作。

(六)数据仓库构建

越来越多的信息系统被企业所应用,但各数据源之间没有很好的信息交互与共享功能,导致海量数据与“孤岛信息”的情况并存[8]。为了全面高效地使用企业内外部数据,提升数据价值,必须构建数据仓库。数据仓库可以根据不同的分析主题将不同数据源的数据整合,再从中提取对风险评估有价值的信息,提高数据的利用效率。数据仓库构建的基础是数据仓库模型,该模型会明确数据的内容、数据之间的联系,其质量不仅会影响风险评估的质量,还会影响风险评估的效率。

(七)风险评估

在运用大数据技术实施风控时,风险评估是指对大数据风险评估指标计算或判断,得到指标结果后,再结合预先设定好的指标评价标准进行风险评价;
在运用人工智能技术实施风控中,风险评估是指智能风控算法模型构建与应用,包括特征提取、训练模型、评估模型、部署模型和监控模型等内容。

(八)风险评估结果可视化

风险评估模型结果可视化是指通过大数据可视化技术来呈现风险评估指标计算结果或风险评估结果。在大数据智能风控过程中,可以从数据应用场景或数据之间关系两个角度来考虑呈现的可视化效果。

(九)风险评估报告生成

风险评估报告生成是指将风险评估指标计算结果、风险评估结果以及风险控制措施等內容以PDF、Word等格式文档呈现。风险评估报告中各个板块的内容都可以使用自动化技术实现填写,其中风险控制措施在企业刚开始实施大数据智能风控时会由人工有针对性地设置一些初始化的建议,而随着后期数据量的增加以及算法的不断优化,这些风险控制措施的内容将结合历史数据、市场环境数据等变得更加智能,更加契合企业实际情况。

五、实例分析

大数据智能风控可以在企业的采购管理、销售管理、生产制造、库存管理、资产管理、财务管理等多个方面实施,而供应商评级作为企业进行供应商选择、管理、监督和改善等一系列活动的基础和标准,在企业风险控制中是重要一环,做好这项工作不仅能够有效地保障企业的采购供应,还能控制采购成本,提升企业竞争力。由于篇幅有限,下面以采购管理中供应商评级环节为例,展示企业大数据智能风控的实施流程。

(一)业务流程梳理

供应商评级过程会涉及到采购部、质检部、生产部和销售部等,其中采购部还包括供应商评估专员、采购专员和采购经理等岗位人员。根据不同部门、岗位的职责以及采购执行过程中相关表单的流转情况,梳理出的供应商评级流程如图3所示。

(二)风险及因素分析

在供应商评级环节,可能存在舞弊风险或经营风险,深入分析便可以梳理出舞弊风险可能是由于供应商评级体系不够合理、供应商评级权力过于集中等风险因素所导致;
经营风险的表现形式包括采购成本高、采购商品质量差、服务品质低等,这些都可能是由于未及时更新对供应商的评级而未能选择更优质供应商所导致。

(三)风险评估指标/特征体系构建

风险评估指标体系设计的内容应当包含指标名称、针对的风险点、指标评估频率、指标功能、指标如何运用、风险评价标准等。特征体系的构建则需要先选取与风险评估业务相关的特征,并说明其作用、描述其定量计算公式等,过程和风险评估指标体系构建类似。在供应商评级环节,为了判断企业是否存在未及时对供应商进行评级或评级不准确等情况,可以设计由“供应商评级准确性”“供应商评级及时性”“供应商评级变化合理性”等一级指标构成的大数据风险评估指标体系。由于篇幅有限,下面以大数据风险评估指标体系中的“供应商评级变化合理性”指标为例,展示后续的大数据智能风控流程。

(四)大数据采集

“供应商评级变化合理性”指标涉及到的数据主要来源于企业内部的供应商管理系统的供应商评级表,为结构化数据。供应商评级表包括供应商名称、评级时间、各个评分项目的得分以及评定等级等字段。采集时可以从系统中直接导出Excel表,也可以连接供应商管理系统的数据库读取数据。

(五)大数据预处理

“供应商评级变化合理性”指标在运用时需要判断供应商的评定等级是否发生变化以及变化的方向,而等级“A”“B”等属于字符型,无法直接进行大小比较,所以需要在预处理时进行数值化。该指标可以进行的大数据预处理操作包括规范数据类型、数值化、缺失值插补、删除非法字符、删除无关信息等。

(六)数据仓库构建

在采购业务中,可以选取供应商评级主题以反映供应商评级是否及时、准确等情况。“供应商评级变化合理性”指标对应的供应商评级数据仓库模型包括1个事实表和3个维度表。其中供应商等级评定事实表包括与供应商评级相关的数据,日期维度表、供应商维度表和等级维度表可以提供不同的角度分析供应商评级情况。

(七)风险评估

运用“供应商评级变化合理性”这一指标时,需要判断供应商的评定等级是否发生变化以及变化的方向,即本次与上次的评定等级数值化后再作差。若本次评定等级数值大于或等于上次评定等级数值,则视为等级变化合理,不存在风险,在同一水平下可以优先选择这部分评级稳定或者等级上升的供应商进行合作;
若本次评定等级数值小于上次评定等级数值,则视为等级变化不合理,存在风险,对评级下降的供应商就作风险提示,需谨慎考虑进一步合作。

(八)风险评估结果可视化

“供应商评级变化合理性”指标在运用时以单个供应商的单次评级结果为对象。风险评估的结果分为合理与不合理两种情况,在可视化时可以考虑从整体上呈现单一年份的风险评估情况,即合理与不合理情况的数量、比例等对比;
也可以呈现局部内容,如单独筛选出评级变化不合理的供应商,或查看某部分供应商近年评级变化情况趋势等。部分风险评估结果可视化如图5所示。

(九)风险评估报告生成

企业的管理者、决策者可能并不会参与风险评估过程,但他们需要了解风险的评估、控制情况,并且风险评估指标的分析过程也需要被记录,因此在完成风险评估后,需要将风险评估指标计算结果、风险评估结果等可视化内容以及建议的风险控制措施等记录在风险评估报告中。大数据智能风控评估报告中包括封面、目录、风险评估目的、风险评估思路、风险评估方法、风险评估标准、风险评估结果以及应对风险的措施建议等内容。

六、结语

风险管理是企业生产经营活动顺利开展的保障,也是新兴技术在大数据时代的又一应用领域。企业风险多种多样,存在于企业的各个业务环节,降低企业风险的关键因素之一就是能够提前识别风险。大数据和人工智能等新技术与风险管理的融合,一定程度上推动了企业风险管理体系的改革。将企业内外部大量的半结构化和非结构化数据整合用于风险分析,有利于风险管理部门更快速、更全面地识别风险,从而降低甚至避免风险带来的损失。因此,本文基于传统的风险管理体系,针对大数据时代下企业风险管理存在的手工化、碎片化和定性化等问题,提出了企业大数据智能风控的技术框架和利用大数据与人工智能技术加强风险识别的实施流程。本文提出的技术框架与实施流程具备一定的通用性和可拓展性,可以为企业大数据智能风控在不同领域的实施提供理论与方法体系建设支持,能够对企业大数据智能风控的相关研究与具体应用起到推动作用。

【参考文献】

[1] 王秋菲,秦爽,石丹.基于大数据的审计风险识别与控制问题研究[J].会计之友,2018(24):93-100.

[2] 卢小宾,徐超.面向风险管理的银行大数据分析系统架构研究[J].信息资源管理学报,2018(2):4-12.

[3] 王昕.大数据对电商企业财务风险管理的影响分析[J].人民论坛·学术前沿,2019(24):122-125.

[4] 王玉龙,周榴,张涤霏.企业债务违约风险预测——基于机器学习的视角[J].财政科学,2022(6):62-74.

[5] 崔宏.关于税收大数据赋能风险管理的思考[J].税务研究,2022(7):131-136.

[6] 何苗.数字经济下企业风险的性质转变与管理策略[J].财会月刊,2021(15):117-123.

[7] 程平,廖婧宇.基于COSO的重庆海事局内部控制评价指标设计[J].会计之友,2018(6):154-157.

[8] 程平,杜姍.基于数据仓库的行政事业单位采购管理内部控制评价——以重庆海事局为例[J].财会月刊,2019(17):53-57.

猜你喜欢风险控制大数据人工智能2019:人工智能商界(2019年12期)2019-01-03人工智能与就业IT经理世界(2018年20期)2018-10-24数读人工智能小康(2017年16期)2017-06-07论增强企业经营管理的风险意识经营者(2016年12期)2016-10-21医院财务管理风险及改进措施分析商(2016年27期)2016-10-17基于大数据背景下的智慧城市建设研究科技视界(2016年20期)2016-09-29下一幕,人工智能!南风窗(2016年19期)2016-09-21

推荐访问:内涵 框架 流程

版权所有:上派范文网 2010-2024 未经授权禁止复制或建立镜像[上派范文网]所有资源完全免费共享

Powered by 上派范文网 © All Rights Reserved.。沪ICP备12033476号-1