泰宁新闻网

最新基于深度学习神经网络的企业投资风险评估方法与流程

鞋

泰宁新闻网 http://www.tainingxinwen.cn 2020-10-18 11:08 出处:网络
本站介绍的最新基于深度学习神经网络的企业投资风险评估方法与流程,介绍下面内容:

本站介绍的最新基于深度学习神经网络的企业投资风险评估方法与流程,介绍下面内容:


本发明涉及深度学习神经网络技术领域,尤其涉及一种基于深度学习神经网络的企业投资风险评估方法。



背景技术:

目前在投资机构一级市场企业投资领域,主要由投资人作出投资决策。投资人进行投资决策主要依靠行业研究分析、企业高管访谈、企业客户访谈、企业外围访谈、企业情报收集与分析等方式方法,每个投资人根据自身的知识结构、行业经验、企业情报等信息做出投资决策,而每个投资人自身的知识结构、拥有的行业经验、获取的企业情报等信息有较大的差异,且投资人对信息的处理速度有限,导致投资人无法从大量历史投资机构投资被投企业的投资案例、被投企业信息、投资机构信息中识别具有风险的投资机构与被投企业特征,进而作出高质量的投资决策。

本发明利用深度学习神经网络技术,实现了投资机构一级市场企业投资领域的智能化,投资人可根据投资标的风险数值来决定是否投资该投资标的。



技术实现要素:

本发明公开了一种基于深度学习神经网络的企业投资风险评估方法,其主要目的是评估投资标的的风险数值,帮助投资机构作出更优的投资决策。

为实现上述发明目的,本发明采取的技术方案是:基于深度学习神经网络的企业投资风险评估方法,包括以下步骤:

步骤一:从互联网上持续采集投资机构投资被投企业关系的信息;并接收投资人输入投资机构投资被投企业关系的信息。

步骤二:根据投资机构投资被投企业关系内的被投企业,从互联网上采集被投企业相关多方面的信息,并接收投资人输入或补全被投企业相关信息。

步骤三:根据投资机构投资被投企业关系内的投资机构,从互联网采集投资机构相关多方面的信息,并接受投资人输入或补全以上投资机构相关信息。

步骤四:对采集与接收的被投企业相关信息与投资机构相关信息进行数据清洗。

步骤五:分别对清洗后的被投企业相关信息与投资机构相关信息进行向量化特征抽取,获得被投企业特征向量和投资机构特征向量。

步骤六:在计算机上,搭建深度学习神经网络(deepneuralnetworks)。

步骤七:根据投资机构投资被投企业关系,将被投企业特征向量与投资机构特征向量组合成一个投资案例特征向量。再将大量的历史投资案例组合成大量的投资案例特征向量。

步骤八:将大量的投资案例特征向量输入深度学习神经网络(deepneuralnetworks)中训练,获得投资风险评估模型。

步骤九:输入待评估投资风险数值的投资标的被投企业与参与投资的投资机构,对输入的被投企业和投资机构进行向量化特征抽取,获得被投企业特征向量和投资机构特征向量,组合成一个待评估风险投资案例特征向量。

步骤十:将步骤九中的待评估风险投资案例特征向量输入投资风险评估模型,模型输出该笔投资案例的风险数值。

步骤十一:投资人参考投资风险评估模型输出的风险数值作出投资决策。

步骤十二:投资人将投资决策通过步骤一中的采集投资机构投资被投企业关系环节反馈给深度学习神经网络(deepneuralnetworks)。深度学习神经网络(deepneuralnetworks)持续接收新的投资机构投资被投企业关系数据,输出优化的投资风险评估模型。

进一步地,当步骤九中输入的投资标的被投企业相关信息与参与投资的投资机构相关信息尚未采集或尚未采集到时,需由投资人输入补全数据。

本发明的有益效果是:在投资机构一级市场企业投资领域,可由计算机代替投资人从大量历史投资机构投资被投企业的投资案例、被投企业信息、投资机构信息中识别具有风险的投资机构与被投企业特征,以克服投资人自身的知识结构、拥有的行业经验、获取的企业情报等信息有限制时无法作出高质量投资决策的问题;可令计算机不断学习最新的优秀投资案例,完成学习与进化,以持续输出趋近于真实情况的投资案例风险数值。

附图说明

下面结合附图及实施例对本发明作进一步描述:

图1为本方法的原理框图;

图2为深度学习神经网络训练投资风险评估模型示意图;

具体实施方式

实施例:

如图1所示,本发明实施例提供了一种基于深度学习神经网络的企业投资风险评估方法,所述方法包括以下步骤:

步骤101:采集与接收投资关系信息

从互联网上采集历史投资机构投资被投企业关系的信息,这些关系数据均为互联网上的公开数据,可通过咨询机构、行业媒体、企业信息查询机构等企事业单位的网站上采集获得,将采集到的数据保存在数据库中;历史数据采集完成之后,持续监控这些网站,如果有新增的投资关系数据则将新增的投资关系也采集下来保存在数据库中。

除了可以从公开渠道获得投资关系数据,投资人还可以手工输入尚未获得的投资关系数据,手工输入的投资关系也保存在数据库中。

投资关系数据包括投资机构、被投企业、投资结果,投资结果为1或者0,当投资机构投资被投企业时投资结果为1,投资机构放弃投资被投企业时投资结果为0。

步骤102:采集与接收投资机构信息

根据数据库中投资机构投资被投企业关系内的投资机构,从互联网公开渠道采集投资机构相关信息,投资机构相关信息包括:投资机构名称、机构简介、官网信息、成立日期、地址信息、联系信息、历史投资行业信息、历史投资轮次信息、历史投资金额趋势信息、历史投资案例趋势信息等多方面的信息。将采集到的投资机构相关信息保存在数据库中。

除了可以从公开渠道获得投资机构相关信息,投资人还可以手工输入尚未获得的投资机构相关信息数据,手工输入的投资机构相关信息也保存在数据库中。

步骤103:采集与接收被投企业信息

根据数据库中投资机构投资被投企业关系内的投资机构,从互联网公开渠道采集被投企业相关信息,被投企业相关信息包括工商信息、员工信息、股权信息、融资信息、对外投资信息、司法信息、经营信息、竞品信息、新闻舆情等多方面的信息。将采集到的被投企业相关信息保存在数据库中。

除了可以从公开渠道获得被投企业相关信息,投资人还可以手工输入尚未获得的被投企业相关信息数据,手工输入的被投企业相关信息也保存在数据库中。

步骤104:清洗数据

对数据库中的被投企业相关信息进行数据清洗,对多条数据均指向同一个被投企业的情况进行数据去重,数据去重时采取保留字段数据最全数据的措施;对未采集完整的被投企业相关信息数据进行关联查询数据、均值填充等方式进行数据补全,保障被投企业相关信息至少包含工商信息、员工信息、股权信息、融资信息、对外投资信息、司法信息、经营信息、竞品信息、新闻舆情;对被投企业相关信息数据进行数据格式统一与校验,使得所有相同字段的数据保持格式统一。

对数据库中的投资机构相关信息进行数据清洗,对多条数据均指向同一个投资机构的情况进行数据去重,数据去重时采取保留字段数据最全数据的措施;对未采集完整的投资机构相关信息数据进行关联查询数据、均值填充等方式进行数据补全,保障投资机构相关信息至少包含投资机构名称、机构简介、官网信息、成立日期、地址信息、联系信息、历史投资行业信息、历史投资轮次信息、历史投资金额趋势信息、历史投资案例趋势信息;对投资机构相关信息数据进行数据格式统一与校验,使得所有相同字段的数据保持格式统一。

步骤105:a.抽取被投企业信息特征

从互联网公开渠道获取金融投资相关的语料库,并使用skip-gram模型训练词向量库,将词向量库形状定义为[v×n],v为词的数量,n为单个词向量的维度,即单个单词的词向量为[1×n],训练完成后获得目标词向量库(target-word-vectors)。

对于被投企业相关信息的数据进行分词,分词后获得一个词清单,假设词清单的长度为m,将词清单内的词到词向量库(target-word-vectors)中查询词向量,并组合一个被投企业的向量。由于目标词向量库(target-word-vectors)的形状为[v×n],所以被投企业的向量形状为m×n。将该向量m×n在列方向上相加,获得一个1×n的向量,将向量内的每个值除以标准差。标准差的公式如下:

其中,n为向量列的数量,m为1×n向量内数值相加的平均数。

计算完成后获得依然获得一个形状为1×n的向量,此向量即为被投企业的特征向量(e)。

步骤105:b.抽取投资机构信息特征

对于投资机构相关信息的数据进行分词,分词后获得一个词清单,假设词清单的长度为m,将词清单内的词到步骤105中获得的词向量库(target-word-vectors)中查询词向量,并组合成一个m×n的投资机构向量。将该向量m×n在列方向上相加,获得一个1×n的向量,将向量内的每个值除以标准差。标准差的公式如下:

其中,n为向量列的数量,m为1×n向量内数值相加的平均数。

计算完成后获得依然获得一个形状为1×n的向量,此向量即为投资机构的特征向量(o)。

步骤106:在计算机上,搭建深度学习神经网络(deepneuralnetworks)。

步骤107:生成投资案例特征向量

从数据库中获得投资关系数据,包括投资机构、被投企业、投资结果,投资结果为1或者0,当投资机构投资被投企业时投资结果为1,投资机构放弃投资被投企业时投资结果为0。根据投资关系中的被投企业与投资机构,从数据库中查询获得相关的被投企业与投资机构,根据步骤105与步骤106对对应的被投企业与投资机构进行特征抽取,并把获得的单个被投企业特征向量(e)、单个投资机构特征向量(o)在行方向上进行合并,获得一个1×2n的向量,即单个投资案例特征向量。假设投资关系的数量为k笔,则生成投资案例特征向量完成后将获得一个k×2n的向量(r)。如图2中k笔投资关系训练数据所示。

步骤108:训练投资风险评估模型

这里使用前馈神经网络(feedforwardneuralnetwork,fnn)作为示例,实际上卷积神经网络(convolutionalneuralnetworks,cnn)、递归神经网络(recurrentneuralnetworks,rnn)等其他类型神经网络均可完成训练投资风险评估模型的任务。

在计算机上搭建一个深度学习神经网络,如图2中的前馈神经网络所示。

将步骤107中获得的k笔投资关系训练数据(r)配合对应的投资结果,按照顺序送入前馈神经网络进行训练,如图2所示,训练完成后得到投资风险评估模型。

步骤109:预测投资案例风险

输入待评估投资风险数值的投资标的被投企业与参与投资的投资机构;假如相应的被投企业与投资机构在数据库中不存在,则由投资人手工采集被投企业相关信息与投资机构相关信息后输入并保存至数据库。从数据库中找到待评估投资风险数值的投资标的被投企业与参与投资的投资机构,采取步骤105、步骤106中的特征抽取方法对被投企业和投资机构进行特征抽取,获得被投企业的特征向量(e′)和投资机构的特征向量(o′),并把获得的被投企业特征向量(e′)、投资机构特征向量(o′)在行方向上进行合并,获得一个1×2n的向量,即待评估投资风险数值的投资案例特征向量(r′)。将投资案例特征向量(r′)输入投资风险评估模型,模型预测得出该笔投资的风险数值为(label′)

步骤110:作出投资决策

投资人根据该笔投资的风险数值(label′)以及投资经验等作出投资决策

步骤111:反馈投资关系

投资人将该笔投资的投资决策投资结果(投资:1/放弃:0)作为lable,反馈至步骤101(采集与接收投资关系信息),将最新的投资关系投资结果保存至数据库,使得最新的投资关系投资结果按照本实施例中的流程通过前馈神经网络优化投资风险评估模型。

当投资人根据投资机构企业投资业务实际情况不断地投资关系投资结果时,投资风险评估模型将被优化至无限趋近于投资风险真实情况。

本发明实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明的。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明的所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。


技术特征:

1.基于深度学习神经网络的企业投资风险评估方法,其特征在于:包括:

第一、信息采集;基于既成的投资关系的信息,分别采集各投资关系信息中投资机构和/或被投企业的基础信息;

第二、数据清洗;将投资机构及被投企业的基础信息格式化为可保存于关系型数据库中的结构化数据;

第三、数据转化;基于金融词汇及训练词向量库形成的目标词向量库,对结构化数据进行分词后完成对应数据的向量转化及特征向量的抽取;

基于每个投资关系信息,其中投资机构的特征向量与其中被投企业的特征向量通过目标函数转化为一个投资案例特征向量;

第四、建立模型;基于搜集的投资案例资料,将投资案例中的投资关系经所述信息采集、所述数据清洗、所述数据转化后获得大量的投资案例特征向量,向深度学习神经网络中输入大量的投资案例特征向量获得投资风险评估模型;

第五、风险评估;将待评估的投资关系通过所述信息采集、所述数据清洗、所述数据转化后获得待评估的投资案例特征向量,并将评估的投资案例特征向量输入所述投资风险评估模型,根据投资风险评估模型的输出结果做出投资决策;

第六、模型更新;将第五步中的投资关系及投资决策作为投资案例资料,所述深度学习神经网络基于第五步的投资案例资料获得优化的投资风险评估模型。

2.根据权利要求1所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述数据清洗时,对被投企业的结构化数据和投资机构的结构化数据使用了数据去重;数据去重时采取保留字段数据最全数据的措施;对未采集完整的被投企业的结构化数据和投资机构的结构化数据采取关联查询、均值填充的方式补全数据。

3.根据权利要求1或2所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述数据清洗时,被投企业的结构化数据包括工商信息、员工信息、股权信息、融资信息、对外投资信息、司法信息、经营信息、竞品信息、新闻舆情数据。

4.根据权利要求3所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述数据清洗时,投资机构的结构化数据包含投资机构名称、机构简介、官网信息、成立日期、地址信息、联系信息、历史投资行业信息、历史投资轮次信息、历史投资金额趋势信息、历史投资案例趋势信息。

5.根据权利要求4所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:对对被投企业的结构化数据/投资机构的结构化数据进行数据去重时,需确保数据格式统一并校验。

6.根据权利要求1所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述数据转化时,通过skip-gram模型训练词向量库,获得形状为[v×n]的目标词向量库,其中v为向量,n为向量列的数量。

7.根据权利要求5所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:使用目标词向量库对被投企业的结构化数据和投资机构的结构化数据的分词清单进行向量化转换;若分词清单的长度为m,则被投企业/投资机构的特征向量形状为m×n;将该向量m×n在列方向上相加后将向量内的每个值除以标准差,最终获得被投企业/投资机构的特征向量,完成特征抽取。

8.根据权利要求1所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述数据转化中,所述目标函数为f(x1,x2)=y,其中,x1为被投企业特征向量,x2为投资机构特征向量,y为投资案例特征向量。

9.根据权利要求7所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述目标函数的函数关系为:将单个被投企业的特征向量(e)、单个投资机构的特征向量(o)在行方向上进行合并,获得一个1×2n的向量,即单个投资案例特征向量;若投资关系的数量为k笔,则生成的投资案例特征向量为一个k×2n的向量(r)。

10.根据权利要求2所述的基于深度学习神经网络的企业投资风险评估方法,其特征在于:所述深度学习神经网络包括前馈神经网络、卷积神经网络、递归神经网络。

技术总结
本发明公开了基于深度学习神经网络的企业投资风险评估方法,基于既成的投资关系的信息,分别采集各投资关系信息中投资机构和/或被投企业的基础信息;将基础信息格式化为结构化数据;基于金融词汇及训练词向量库形成的目标词向量库,对结构化数据进行特征向量的抽取;将特征向量通过目标函数转化为一个投资案例特征向量;基于投资案例资料,将投资案例转化后获得的投资案例特征向量并输入深度学习神经网络中获得投资风险评估模型;将评估的投资案例特征向量输入所述投资风险评估模型,根据投资风险评估模型的输出结果做出投资决策;将所获得的投资关系及投资决策作为投资案例资料,深度学习神经网络基于反馈的投资案例资料获得更好的评估模型。

技术研发人员:傅文斌;吴琪
受保护的技术使用者:苏州明眸智策科技有限公司
技术研发日:2020.02.26
技术公布日:2020.06.26

最新基于深度学习神经网络的企业投资风险评估方法与流程的相关内容如下:

本文标题:最新基于深度学习神经网络的企业投资风险评估方法与流程
http://www.tainingxinwen.cn/qitaxinxi/521146.html

0

精彩评论

暂无评论...
验证码 换一张
取 消