【案例】重庆市金融工作办公室:大数据监测预警非法集资平台

近年来,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资的犯罪手段和形势发生了很大变化。仅在2016年,全国检察机关公诉部门受理非法集资案件9500余件


作者 | 金信网银

官网 | www.datayuan.cn

微信公众号ID | datayuancn


本篇案例为数据猿推出的“金融科技价值—数据驱动金融商业裂变”大型主题策划活动第一部分的文章/案例/产品征集部分;感谢 金信网银 的投递


1、企业名称


重庆市金融工作办公室


2、所属分类


金融科技·征信


3、案例背景


近年来,随着国家对金融市场管控政策的不断调整以及互联网金融的快速发展,非法集资的犯罪手段和形势发生了很大变化。仅在2016年,全国检察机关公诉部门受理非法集资案件9500余件,其中,非法吸收公众存款案8200余件、集资诈骗案1200余件。受理金融犯罪案件30900余件48700余人,起诉23700余件36300余人。从以上数据来看全国打非形势依然非常严峻。同时,伴随着互联网大环境下网络非法集资的规模大比例增加,作案手段更趋隐蔽化、多样化给金融监管工作带来了更大的困难。


在当前金融市场和互联网的大环境下,政府想要更有效地打击非法集资,就需要运用到新的手段和方式。通过技术创新和模式创新,凝聚大数据处理领域的优势力量,做到“用数据说话、用数据决策、用数据管理、用数据创新”,并且借助大数据实现智慧治理、数据决策、风险预警、智慧城市、智慧公安、舆情监测等。因此,尽快建立实用有效的网上监控体系,是实现非法集资事件早期发现与预警的最有效手段和方式。


4、实施时间


2017年5月31日至2018年5月30日


5、应用场景



(1)打击非法集资迫切需要


近年来,重庆市非法集资案件多发频发势头虽得到扼制,陈案积案处置取得积极进展,规范、流程等基础性制度初步建立,但受经济下行、商事制度改革过渡期、群众金融知识普遍缺乏等因素影响,各类不规范民间融资行业领域有集中暴露风险。值得注意的是,非法集资正不断向新的行业、领域蔓延。


很多非融资性担保公司、投资咨询等中介机构公开“代人理财”大肆非法集资;许多小额贷款公司、私募股权投资等融资性机构超范围经营涉嫌非法集资;一些农业专业合作社以入股分红为诱饵吸收农民资金投资异地或放高利贷;网络平台打着“民间借贷”旗号非法集资风险也日见凸显。


且随着互联网金融的不断发展,当前,互联网金融的内部运作和外部监管在具体合规操作和法规体系上凸现出相关漏洞,局部领域风险不断积累,迫切需要实现非法集资的事前监测,实现“打早打小”,防止演变成较大的非集事件,及时挽回群众的资产损失。


(2)落实市政府关于防范和处置非法集资工作需要


重庆市大数据监测预警非法集资平台建设是按照《国务院关于进一步做好防范和处置非法集资工作的意见》,扎实有效做好本市防范和处置非法集资工作,防范系统性区域性金融风险的重要组成部分。


在今年4月25日,桂平同志在全市打击非法金融活动领导小组(扩大)会议上强调:强化网络监测、行政处置、督查考核“三种手段”,加快建设全市大数据监测预警非法集资平台,采取差别化处置策略积极稳妥化解风险。因而,建立立体化、社会化、信息化的监测预警体系,是遏制非法集资高发势头,及早引导、规范、处置非法集资苗头的有效保证。


(3)建设智慧型服务型政府的需要


从全球范围来看,随着大数据、云计算和智能挖掘等新一代信息技术商业模式的不断成熟,重庆市政府决力向智慧化、精准化、主动化的方向发展,打造智慧型政府形象。


6、面临挑战


(1)政府人员有限


面对互联网时代,非法集资出现的新特点、新趋势、新手段,传统的防范监管模式已经不能完全适应新形势变化,且市政府人员编制较少造成个人工作量增加而效率降低的情况。


(2)事前监测预警难


面对目前非法集资手段的电子化、网络化、传播途径多样化、行业分布的广泛化等特点,想要实现对非法集资犯罪活动的事前预测、事中预警,是重庆市金融监管部门面临的一大挑战。


(3)数据协调困难


随着我国政务信息化取得巨大进展,很多不同的数据分别隶属于政府的不同部门,相关数据信息相互隔离,缺乏关联分析与深度挖掘,容易形成信息孤岛,从而导致获取非法集资相关信息和证据困难。


例如:非法集资风险监测预警的核心是账户资金异动情况,涉及账户信息异动是由各金融机构依据《反洗钱法》和《大额交易和可疑交易报告办法》向人民银行报送,具体信息由人民银行反洗钱部门掌握。非法集资民事、刑事案件审判信息和犯罪记录由法院和公安机关掌握。此类信息因涉密和保护隐私,难以向其他部门实现共享。中央条管金融机构合法产品信息由银监、证监、保监等中央金融监管部门掌握。农民专业合作社管理信息由农业部门掌握,要实现数据共享还需要进一步协调。


(4)非法集资处置困难


传统监管模式对非法集资行为不能及早发现,只能在非法集资案件发生后被动地去处置,很难做到“打早打小”,在苗头时期、涉众范围较小时解决问题。


7、数据支持


围绕非法集资的监测预警,建设金融风险大数据中心,每日数据量更新达5000万条。截止目前,新闻数据12.08亿条,论坛8.6亿条,微博163.1亿条,微信公众号数据2.96亿条;工商数据覆盖4500万家企业和1亿家工商个体户;法院数据15亿条,覆盖1000万家涉诉企业;招聘数据覆盖主流招聘网站;金融行业数据覆盖了网贷、私募、众筹、小额贷款公司、交易中心、融资租赁等行业。此外,该大数据中心还对接了相关脱敏数据,采集了ICP备案数据,同时建立了一套非法集资高风险库。


8、应用技术/实施过程


(一)实施过程


(1)搭建平台架构


重庆市大数据监测预警非法集资平台的数据支撑为金融大数据系统,通过系统对多个数据源的采集,在内存式计算系统上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。


其次,针对重庆市私募、网贷、投资咨询、融资担保等行业分别建设预警模型,应用大数据处理技术实时运算,得出衡量企业非法集资潜在风险的指标“冒烟指数”。


最终,基于重庆市企业的原始数据和“冒烟指数”分析结果,设计可视化系统,辅助用户直观了解重庆市非法集资风险情况和个别企业风险详情。


(2)设计研发产品


从需求出发,金信网银辅助重庆市金融办实时扫描重庆2万余家类金融企业的舆情负面信息、工商处罚信息、法院涉诉信息等数据,一旦出现企业涉嫌非法集资的行为,及时发出预警信号。


同时,结合重庆市区域金融风险情况,应用“冒烟指数”模型作为研判依据。“冒烟指数”一词的取名,灵感来自于森林火灾前的冒烟场景。因为森林要着火首先要冒烟,烟越大火势越旺,同样非法集资案件爆发前总会有苗头,因此衡量企业非法集资潜在风险大小的指标叫“冒烟指数”。



“冒烟指数”从合规性、收益率、传播力、投诉举报情况和特征词命中情况五个维度深度挖掘重点监控企业的风险。合规性指数从企业资质、企业管理人资质、是否涉嫌超范围经营、是否存在虚假宣传等几个因素来考量;收益率偏离指数从企业承诺的收益率和市场平均收益率之间的差值来考量;传播力指数从企业或产品宣传的途径、企业经营覆盖范围等几个因素来考量;投诉举报指数从投诉信息的来源渠道和投诉内容来考量;特征词命中指数从企业舆情出现非法集资风险关键词的频率来考量。


“冒烟指数”位于0~100之间,分数越高,该企业非集风险就越高。当冒烟指数高于60分时,说明该企业的非法集资风险很高,建议约谈整改。


为确保“冒烟指数”模型的精准性和客观性,金信网银在利用跨部门数据资源的基础上,以大数据和云计算为技术支撑,综合应用了机器学习算法、自然语言处理及复杂网络分析等前沿技术,并对历史非法集资案件的数据进行剖析,梳理出近千个细分数据项,然后对海量数据进行反复训练,不断的优化模型的准确性。


(3)数据计算云平台服务方案


最终,产品以Saas云平台的模式交付给重庆市金融办。Saas云平台具有数据同步便捷、运维成本低等优点。在数据同步方面,金信网银不断积累的新数据和模型优化后的计算结果能够第一时间同步到重庆市大数据监测预警非法集资平台中。在后期运维过程中,一旦出现软硬件等运营故障,金信网银可以第一时间核查原因,降低时间成本。


(二)应用技术


(1)大数据采集技术


应用TRS海量异构数据采集技术对网络新闻、财经媒体报道、百度贴吧、社交网络信息、经授权的工商、税务、法院诉讼数据等数据实时监控和采集,对采集到的信息进行过滤和自动分类处理,最终将最新内容及时发布出来,实现统一的信息导航功能,同时提供包括全文检索、日期(范围)检索、标题检索、URL检索等在内的全方位信息查询手段。


(2)大数据管理技术


金融风险大数据中心每日数据更新量达5000万条,融合多源结构化和非结构化的海量数据。作为大数据架构的底层,大数据中心应用分布式存储技术和集成技术实现数据的海量存储,应用索引分片、对等节点机制(去中心化)、新型列数据库存储机制等技术实现数据的有效管理,应用全文检索技术实现数据的精准检索,提供了大数据高效管理和智能检索的平台支撑。


(3)大数据分析技术


高效、迅速、精准的挖掘海量数据中的风险信息是重庆市大数据监测预警非法集资平台的关键。金信网银利用大数据、云计算和机器学习等进行决策,融合了文本挖掘、自然语言处理技术、复杂网络分析、LBS分析等技术,并结合机器学习、深度学习等算法,实现从大数据监测预警非法集资分析方法的突破。


文本挖掘也称为文本数据挖掘,是以文本型信息源为分析对象,利用智能算法,如神经网络、基于案例的推理等,融合文本分词、文本分类、文本过滤、文本抽取、关系挖掘等功能,从非结构化文本文档中提取有用的、重要的模式,知识和规律。


文本分词融合规则和统计两方面技术,可有效解决切分歧义问题;文本分类可对信息的行业、地区、褒贬义等进行分类,是建模中的一项重要指标;文本过滤有效识别和过滤各种有害垃圾文本信息,降低后期模型计算的误差;文本抽取使用机器学习和统计的方法实现各类实体信息的抽取;关系挖掘可从海量数据中快速分析挖掘实体间关系,用于分析企业的关联担保风险。


复杂网络是由数量巨大的节点和节点之间错综复杂的关系共同构成的网络结构。结合工商数据的投资关联数据、法院数据的原被告利益数据等数据,复杂网络分析方法可用于核心企业/人员的锁定、关联风险的识别及关联结构异常的挖掘等。


基于LBS分析,可视化呈现目标企业与其关联企业的地理分布,并从其动态演变特征挖掘风险异常。


机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它是一门研究机器以获取新知识和新技能,并识别现有知识的学问,是将无序数据转化为有用信息的方法,价值在于从数据中抽取规律,并用于解释数据或预知未来。机器学习分为四大块:降维、分类、聚类和回归。从技术角度看,谷歌云机器学习与人工智能首席科学家李飞飞表示:机器学习正在信用卡风险检测、反诈骗和洗钱等方面发挥越来越大的作用。


9、外部合作


为完成重庆市大数据监测预警非法集资平台的建设,金信网银从数据合作、技术合作、专家合作等方面整合了各方资源,共同做好此项目。


数据是大数据平台的生产资料。整合多方海量的数据,才能丰富模型的指标体系,提升数据分析的准确性。金信网银一方面建立自己的独家数据资源库,另一方面一直寻找市场上最优质数据供应商,用最准确的数据给用户提供服务。与好公司合作,可降低自己的数据成本和时间成本,也会更好的服务用户。目前,金信网银整合的舆情数据、工商数据等数据都与业界最好的数据供应商建立起合作关系,真正实现“1+1>2”的效果。


技术合作是金信网银提高产品研发速度的重要途径。开源软件的普及打破了传统科技公司的桎梏,促进了多方之间的交流和合作。金信网银的产品设计借鉴了合作伙伴和开源软件的自然语言处理技术、知识图谱分析等,大大提高了工作效率。


专家合作是金信网银迅速发展的一大法宝。对市场需求的理解,一方面需要从实践中总结学习提升,另一方面需要理论层面的引导,加深对业务逻辑的分析。金信网银建立自己的专家智库,一起探索非法集资监测预警工作的方向,辅助监管层更有效地降低区域金融风险。


此外,金信网银还加强和市场合作、媒体合作、高校资源合作,以及未来资本运作等方面的合作。


10、商业变化


重庆市大数据监测预警非法集资平台建设是按照《关于促进互联网金融健康发展的指导意见》以及近期国务院关于启动互联网金融领域的专项整治系列部署,落实属地监管责任,推进本行政区域范围内的风险排查、监测预警、案件查处、善后处置、宣传教育和维护稳定等工作。具体有以下社会效益:


第一,平台建设是推进金融治理创新的必要手段,将金融风险化解在萌芽阶段,维护重庆市本地金融稳定和人民群众财产安全,促进本地新兴金融业态的健康发展。


第二,平台建设加强了重庆市政府对于互联网金融的监管,促进了互联网金融健康的发展,更好地服务于实体经济。


第三,平台建设有利于及时发现和处置重庆市非法集资行为,对已经出现的违法案件,有利于形成完整的线索链条,加快公安部门侦破案件,为人民群众挽回损失。


第四,平台采集到的新兴金融业态各方参与主体大数据信息,也有利于充实和完善重庆市公共基础信息资源库和信用信息主题库,依托该系统可为有关部门和领导提供宏观经济金融形势、金融运行状况、行业发展的统计、分析等,为决策参考。


关于企业 -


北京金信网银金融信息服务有限公司(以下简称金信网银),成立于2014年,是一家专门从事金融大数据分析挖掘系统、风险管理综合服务平台的研发和服务公司,能够满足金融监管部门多角度金融风险预防和监管的需求。公司致力于大数据监测预警金融风险,技术驱动创新社会治理,打通政府信息壁垒,用“冒烟指数”辅助地方金融监管部门守住不发生系统性金融风险,促进社会和谐稳定,为中国金融体系完善和信用体系建设注入正能量!


目前,金信网银已服务公安部建设非法集资犯罪监测预警平台,利用大数据技术辅助研判分析经济犯罪;服务北京市金融局建设全国第一个打击非法集资监测预警平台,应用于打击非法集资专项整治行动和互联网金融风险专项整治,及时监测预警非法集资等金融风险;服务中国互联网金融行业协会监测预警会员风险;服务深圳市金融办建设类金融行业监管平台;服务广东省金融办、重庆市金融办、北京市东城区金融办、北京市海淀区金融办、贵州省金融办、湖北襄阳金融办等做好类金融行业风险排查工作。此外,还服务于“一行三会”、珠海市金融办内蒙古自治区金融办等金融监管部门。



作为整体活动的第二部分,2017年10月25日,数据猿还将在北京举办千人规模的“2017金融科技价值——数据驱动金融商业裂变”峰会并将在现场举行文章、案例、产品的颁奖典礼。


更多精彩内容

(点击关键词查看)


· 观 点 ·

阿里金融云徐敏 | 达观数据陈运文

易日升史建伟 | 易宝支付余晨

诸葛io于晓松 | 91征信薛本川

聚信立甘建铃 | 天创信用张宇

安华金和杨海峰 | 东方金信王伟哲


· 案 例 ·

光大银行:风险一体化项目实施

中国人民银行反洗钱监测分析二代系统

大数据综合分析平台 ——海量数据复杂分析处理



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1380892.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

1028万!重庆统计局招标大数据平台,开建统计数据中台

2022年9月15日,重庆市统计大数据平台(CQS22C01140)发布中标(成交)结果公告,如下: 项目编号 CQS22C01140 项目名称 重庆市统计大数据平台 服务范围 大数据已成为新型生产要素和国家基础性战略资源,积极发挥政…

税局端服务器未响应是什么意思,DNS服务器未响应是什么意思

DNS服务器未响应是指DNS服务器没有和你连接上,即不能从DNS服务器上获取数据。DNS服务的是安装了DNS服务器端软件的计算机,服务器端软件既可以是基于类linux操作系统,也可以是基于Windows操作系统的。 本教程操作环境:windows7系统…

读《Flask Web开发实战》(狼书)笔记 | 第1、2章

前言 2023-8-11 以前对网站开发萌生了想法,又有些急于求成,在B站照着视频敲了一个基于flask的博客系统。但对于程序的代码难免有些囫囵吞枣,存在许多模糊或不太理解的地方,只会照葫芦画瓢。 而当自己想开发一个什么网站的时&…

Android 高手进阶教程(二)之----Android 数据库SQLiteDatabase的使用!!

直接进入主题~ Android 提供了三种数据存储方式,第一种是文件存储;第二种是SharedPreferences 存储;第三种就是数据库SQLiteDatabase 存储。 文件存储我就不用多说了,而SharedPreferences 可以存取简单的数据(int,double,float.etc),它经常…

SQL-每日一题【1484. 按日期分组销售产品】

题目 表 Activities: 编写解决方案找出每个日期、销售的不同产品的数量及其名称。 每个日期的销售产品名称应按词典序排列。 返回按 sell_date 排序的结果表。 结果表结果格式如下例所示。 示例 1: 解题思路 前置知识 group_concat函数的功能   将group by产生的…

傅盛:猎豹移动在三个领域取得进步 手游业务受政策影响不大

雷帝网 乐天 11月22日报道 猎豹移动(NYSE:CMCM)昨日发布截至2018年9月30日的第三季度财报,财报显示,猎豹移动Q3总收入13.52亿元,同比增长16%,环比增长23%,超过公司业绩指引上线。 猎豹移动手游业…

傅盛:猎豹持有猎户星空约34%股权 未来或获控股权

雷帝网 乐天 8月21日报道 猎豹移动董事长、CEO傅盛昨日在电话会议上表示,猎豹移动更加重视国内市场。过去,猎豹的海外工具及国内工具由不同团队运营。现在,由统一的团队运营管理。 “我们还将猎豹在海外验证的模式复制到国内。”傅盛说&#…

猎豹MFC--不使用向导

在CMyApp类的类视图下点属性 找到消息 添加找到InitInstance加进去 添加OnPaint消息 添加左键消息 自动生成的头文件信息: 在客户区大小内画椭圆文字 以上两张图先画线后画圆 CClientDC dc(NULL) 传NULL 为桌面 串this为当前窗口 来自为知笔记(Wiz) 转载于:https:…

中国工具类App折戟海外,为什么只有猎豹移动杀出血路?

移动互联网下半场中国市场人口红利不再,“走出去”成为互联网公司不约而同的选择,BAT、蚂蚁金服、摩拜、ofo、美图等公司都在出海。不过,中国互联网公司出海的历史却可以追溯到移动互联网早期,很早之前就出现了海外小三巨头&#…

如何打造一款专属于自己的高逼格电脑桌面

作为一名电脑重度使用者,你是否拥有一款属于你自己的高逼格电脑桌面呢?你是不是也像大多数同学一样,会把所有的内容全部都堆积到电脑桌面,不仅找东西困难,由于桌面内容太多还会导致C盘空间不足,影响电脑的反…

【吐槽系列】如何用最贱蛋的方式将web程序变为桌面应用

#前言 实在是想吐个槽,最近公司有个活,想要将我们写的web网站套在一个浏览器壳子里面,愣装桌面应用(zhuang b)。然后健哥给我推荐了cef,顺道作者又手贱的去看了cefSharp和Xilium.CefGlue,不得不…

Java算法_ 杨辉三角(LeetCode_Hot100)

题目描述:题目描述:给定一个非负整数 numRows,生成「杨辉三角」的前 numRows 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 获得更多?算法思路:代码文档,算法解析的私得。 运行效果 完整代码…

树莓派系统烧录,连接电脑,电脑远程桌面控制树莓派(树莓派无屏幕,校园网)

1、系统烧录 本人初学树莓派,没买屏幕,在学校里,用的是校园网,没有路由器,所以没办法直接通过网线连接树莓派和路由器,好让电脑能远程桌面控制树莓派,所以只能用迂回的方法,先让电脑…

猎豹创建快捷网页

猎豹创建快捷网页 IE创建快捷网页:http://blog.csdn.net/wangboxian/article/details/7431404 猎豹:将下面的绿钩拖到桌面上即可 posted on 2014-01-04 01:56 周永强 阅读( ...) 评论( ...) 编辑 收藏 转载于:https://www.cnblogs.com/zhouyongqiang/p/…

学计算机的桌面,三个软件,干净你的电脑桌面,让你更高效工作学习!

文 | 谦行公子 首发 | 谦行公子 今天向大家推荐三个软件,为了就是让大家都拥有一个干净整洁的桌面,从此高效地学习生活~至于哪三个,接着看 相信很多人都有这样的经历,连续工作好几天甚至好几周,桌面上堆满…

数据通信——OSPF高级特性

引言 之前讲过的是OSPF简单特性,理解起来很简单,但是OSPF协议深层很全面,可以说,如果懂了OSPF协议,相当于链路状态协议也能一通百通了。下面是一些重点注意事项和知识点。 1.在大型网络中,OSPF的SPF计算…

第10集丨Vue 江湖 —— 表单输入绑定

目录 一、v-model1.1 基本用法1.2 值绑定1.3 修饰符1.3.1 .lazy1.3.2 .number1.3.3 .trim 二、总结2.1 案例2.2 效果 一、v-model 1.1 基本用法 功能&#xff1a; v-model指令在表单 <input>、<textarea> 及 <select> 元素上创建双向数据绑定。它会根据控件…

R爬取新浪财经网的股票数据

使用到的包是RCurl,通过这个包可以做一些网页讯息的抓取 先通过新浪财经的入口,选一只感兴趣的股票,再点击左边行情走势下的历史交易得到历史交易数据 常用的浏览器可以打开网页讯息的源代码: 首先读取包并用,读取该网址的信息,并按行对信息进行切割: library(RCurl) t…

本杰·格拉汉姆选股策略

转 本杰明格拉汉姆选股策略 第一部分&#xff1a;投资哲学 价值投资方法已为个人投资者和专业投资经理人员所广泛运用。此方法是在60年前&#xff0c;随着格拉汉姆和多德的大学教科书《证券分析》的发表而问世的&#xff0c;格拉汉也因此被誉为价值投资之父&#xff0c;重温一…

金融科技之交易:动量效应选股策略

金融科技之交易&#xff1a;动量效应选股策略 策略内容&#xff1a;代码整理角度计算标准化处理数据准备回归线的斜率两点连线的斜率由斜率计算角度计算模块的整合 绘制叠加图UI界面控件&#xff1a;QLabelQLineEditQPushButtonQComboBoxQTableWidget 信号与槽函数选择目标股票…