当前位置: 首页 > news >正文

做网站工作内容品牌建设三年行动方案

做网站工作内容,品牌建设三年行动方案,淘城汇网站谁做的,数据图表展示网站不知不觉#xff0c;学SQL已经一个多月了#xff0c;每天下班学一个小时#xff0c;有空做做练习题。从之前的焦虑到现在已经有了一定的自信了#xff0c;猴子的课程真的很适合小白入门#xff0c;尤其是SQL学习群里#xff0c;助教老师很尽责#xff0c;每个问题都会解…不知不觉学SQL已经一个多月了每天下班学一个小时有空做做练习题。从之前的焦虑到现在已经有了一定的自信了猴子的课程真的很适合小白入门尤其是SQL学习群里助教老师很尽责每个问题都会解答。当然更多的还是需要自己多加练习查资料看书当自己遇到自己不会的问题时通过自己研究解决问题的感觉太棒了久违的成就感。因为本身自己是做金融行业的今天的项目实战就选取金融行业的实战数据进行一个简单的风控策略分析其中不乏一些解决问题的心路历程有点啰嗦闲话少说实战开始一、数据选取及导入首先拿到数据的时候我是懵逼的从网盘上下载的数据选取的数据总共57356条其实不算多。但主要是有69列字段名都是因为英文很多金融行业的专业词汇自己只能看懂一些虽然有部分释义但只有几个而且没办法一一对照着看在Google的帮助下勉强把列名翻译成了我能看懂的中文大概是这样我尽力了一在做数据导入之前先弄清楚两个问题自己有什么自己想要干什么1.自己有什么数据总共69个字段包含了客户的贷前贷中贷后的各个标签维度我们将逾期客户定义为坏客户非逾期客户定义为好客户。2.我想要什么我想要的是如何通过已知客户的数据分析得出结论设置风控策略将其中一部分坏客户拒掉。这其中有一个假设就是未来的客户表现在概率上的特征与存量数据客户在概率上是一致的。也就是说我们通过已有的数据分析得出坏客户标签最明显的那部分客户可能是一个、也可能是多个标签将这部分客户剔除掉就能使得我们的逾期率得到改善。由于是要做的是贷前风控策略所以我们把其中贷中和贷后的数据都暂时删除掉。 最终经过自己的初步筛选除了主键以外我们选取的列还剩下20个可供我们进行分析。二数据的导入按照数据的步骤进行操作结果第一步就卡壳了EXCEL表打不开在公众号上查了解决方案后发现需要去网上下一个微软的数据导入读取插件accessdatebaseengine之类的。在网上找到下载以后就能打开了。紧接着一路顺畅到了最后一步发现又难住了提示错误。直接将错误代码百度了一下发现是字段太多了字段太长导致超标了‘too large’于是在上一步把255改成了100实际可以视业务和字段情况而定我这里就是图省事儿。然后就好了接下来就可以开始分析了二、数据分析首先我们分析原数据里‘是否逾期’这一列直接用的0和1来表示的也就是说我们要分析的Y变量可以直接用SUM是否逾期来表示我们的坏客户第一步我们先看看这组数据整体的逾期率取出来是29.66%可以说是很高了也就是说我们需要从其他变量中选取一些变量来分析坏客户然后假设把他们剔除掉以优化我们好客户的占比目标是降低29.66%这个数第二步对各个列进行分析这里有一个重要的小技巧也是在助教老师的提示下才解决的首先按信用评分分组统计我的结果是这样的这里我发现其中B,C,D和HR,NC,E可以进行三三分类因为他们的逾期率相差不大。如何运用SQL语句实现这一点说实话我想了很久最后还是在群里助教老师的提示下茅舍顿开才有了下面的语句实现了这一点把语句格式问题解决了接下来就简单了把所有需要分析的字段分别分组列出来就行了这里由于篇幅有限只放区分度最好的两个除了上面的信用评级还有征信总查询次数具体SQL语句都大同小异下图是征信查询次数最终我们得到的数据结果分组后在EXCEL上显示如下图三、计算提升度和评估执行后的效果为什么要计算提升度计算提升度是指——我们通过运用数据来计算各分组最差的那一档的客户占总逾期账户数的权重是多少。具体公式是分组最差档位逾期客户数/总逾期客户数/分组用户占比。这里得到的数值我们称之为提升度。。大概逻辑是最差这一档逾期客户占比除以这一档所占的权重。将以上各个分组计算后于是我们得到了下面这个图从图中我们可以看出“征信总查询次数”和“信用等级”这两个字段最差档位的逾期客户的提升度最大。接下来我们就可以拟定我们的风控策略了两种策略的执行结果分别是若征信查询次数21则拒绝总逾期率会下降1.69%但会拒绝掉5.44%的客户。若信用评级为“E,HR,NC”则拒绝总逾期率会下降3.54%但会拒绝掉12.09%的客户。根据这两天策略我们可以直接给出建议看是为了选择3.54%的逾期率降幅去牺牲掉12.09%的客户这其中有7.66%的好客户呢还是只选择降低1.69%的逾期率只牺牲掉5.44%的客户这其中有3.17%的好客户这就要看公司决策层的战略和风险偏好了后者对风险的容忍度较高。四、总结和感悟实际上在信贷行业的策略中我们要做的永远都是一个平衡问题如何去找到收益和风险之间的那个点。目前头部的几家互联网金融公司和各大银行所采用的风控模型都是基于大数据量下的风控所以数据分析能力在当今的信贷行业相当重要在客户数据达到一定量级以后我们关注的都是大数据条件客户逾期的概率问题。总体所设定的风险策略是自己能风险偏好能接受的同时能产生收益最大化也就是我们信贷风险分析的终极目标。这其中有几个问题值得我们进一步学习和探讨1.自己所做的分档是根据数据表现人工抉择表现接近的归为一档的分档方式是否有更科学的分箱规则如何来实现2.单维度的风控策略逻辑相对简单但现实中我们往往遇到的多维度和更加细化的策略抉择问题例如‘信用评级’最低的那一个档位里有没有其他变量又能从中区分出坏人中的好人或者是坏人中的‘铁坏人’这就涉及到不同变量之间的交叉分析到底哪几个特征综合在一起抓住坏人的概率更高基于以上两个问题我想机器学习和PYTHON运用 能告诉我答案咱们高级课程见。。。。
http://wiki.neutronadmin.com/news/373195/

相关文章:

  • 深圳网站建设toolcat温州专业全网推广建站公司
  • 可以做课后作业的网站微商城分销
  • 做网站分几种怎么使用宝塔做网站
  • 网站对于企业的好处网站主机购买
  • 编程网站排名多网站管理
  • 天津建设部网站首页个人网站用什么开发
  • 业之峰装饰官网公司seo是什么意思
  • 怎么是一个网站看起来高大上关键词排名优化顾问
  • 想做个网站推广百度地图排名可以优化吗
  • 微信恢复官方网站中国网站排名前100
  • 上传视频网站源码模板王字库官网
  • 网站开发流程人物企业运营管理方案
  • 温州建设小学瓯江校区网站彩页设计网站
  • 网站建设服务类型现状网页布局的设计步骤
  • eclips怎么做网站域名查询系统
  • 宠物网站开发动漫制作专业排名
  • 网站怎么做免费seo搜索平面设计速成班多少钱
  • 国企网站建设要求外贸网站索引页多
  • 成都微信网站建设报价深圳网站建设定制开发服务
  • 手机网站制作软件下载长沙做网站设计的公司
  • 构建自己的网站公司网站模板建设
  • 珠海pc网站建设股票查询网站模板 wordpress
  • 秋佐科技公司网站有做网站的吗 优帮云
  • 建立网站的要素凡科网站手机投票怎么做
  • 帝国cms做门户网站网站建设公司讯息
  • 电子商务网站建设实训体会购票网站模板
  • c2c的盈利模式谷歌seo关键词优化
  • 网站服务器的功能app应用商店
  • 南阳网站建设南阳做汽车脚垫版的网站
  • 网站建设的公司如何招销售商标设计网站是哪个