聊城做网站的公司信息,聚家网装修平台,公司流程管理系统,扁平化设计网站本文作者#xff1a;夏之冰雪#xff0c;i春秋签约作家 《我在百度网盘上看到上万条车主个人信息,企业、政府高官信息、各种数据库和无穷无尽的盗版》#xff0c;一时间#xff0c;这篇文章就火了#xff0c;火爆程度另百度猝不及防。 其实呢#xff0c;这事真不能全怪百… 本文作者夏之冰雪i春秋签约作家 《我在百度网盘上看到上万条车主个人信息,企业、政府高官信息、各种数据库和无穷无尽的盗版》一时间这篇文章就火了火爆程度另百度猝不及防。 其实呢这事真不能全怪百度毕竟用户分享出去了。之所以引起这么大轰动主要是因为用户的文件本身什么数据都有导致这次危害或者说恐慌进行了放大。 每一次危机过去之后————
普通人只会对其津津乐道
有能力的人会思考如何避免再次发生
而开拓者则会洞察整个形势。百度网盘泄露事件留给了我们什么百度事件发生得到消息的人会赶紧确认自己的隐私文件是否被分享然后尽快取消分享保证安全。一周过后风波也就散了基本就没有什么话题或者新闻了。 这里我抛出一系列问题 除了百度网盘还有没有其它类似的问题遭受泄露的用户群体有哪些通性从事技术行业的人更具备敏感意识么他们是否更大程度避免发生这类问题本篇文章不会给出答案因为这是开放性问题没有绝对的答案。上面这几个问题目的是为了让大家带着思考去看下文之后你可能会对百度事件有一个更全面的认识。 从最大的同性社交平台获取数据好了言归正传回到题目。题目不是噱头毋庸置疑github是全球最大的同性社交平台这篇文章我会通过github向大家展示一种攻击思路以及我的一个成果 我有几千个github账号和密码确实没有上万不吹牛逼该多少就多少。几千个账号说多不多说少不少所运用到的技术原理————基于爬虫的数据攻击这方面的研究不知道算不算学术差不多有一年多了我会把可公开的内容展示给大家研究的结果还不是很成熟欢迎大家在下面回帖讨论很乐意与大家交流。 在github平台用户需要输入账号和密码登陆而账号可以输入邮箱也可以输入github的用户名。 github用户名就是所谓的git账号这个是对外公开的查看个人主页或者查看代码时候都会在比较明显的地方显示用户名通过用户名可以直接登录github。比如这个哥们他叫Sushil Thasale而他的github账号是sushil-thasale。 账号很容易得到那么密码怎么才能知道呢直接上图 这是某个用户的密码这是这个用户的登陆后的页面 这个用户名字是四位很好的账号——jv98他的密码很复杂 这是登陆后的个人主页 其实我们还能知道用户的邮箱这个用户的邮箱是Oliver.andersson.te14c gmail.com如此复杂他的密码却很简单 个人账户设置页面我可以悄悄地加一个邮箱进行监控 再给一个2013年就注册的账号和密码 登陆后的个人主页 好了不晒图了这种账号确实有几千个而且有好多都是github的重度用户。 细心的读者应该已经发现我是怎么找到他们的密码的了。所有密码截图都是来自他们自己上传到github项目的代码里所有截图都是代码截图。我利用了github的搜索技术搜索到一堆想要的账号和密码然后进行登录尝试登陆成功的我就记下来。 那么怎么搜索才能找到呢 充分利用开源项目开源项目有固定的存储密码的位置比如php语言的wordpress密码存放位置在根目录下的wp-config.php文件中代码内容define(‘DB_PASSWORD’, ‘password’)。开源项目有很多就拿php语言来说就有wordpress、joomla、phpcms、discuz等。利用搜索技术比如同时搜索多个关键词defineDB_PASSWORD筛选语言为php基本就能列出所有wordpress的密码了。善于利用搜索技术对于密码为空的要过滤掉对于密码为####、*这种的也要过滤掉。以上操作千万不要手工开头我都说了————基于爬虫的数据攻击所以我们要写爬虫自动爬取github数据然后通过正则匹配筛选掉不想要的数据。 这里的核心就是爬虫以及过滤。过滤技术用得越好数据越有价值爆破的时间成本越低 除了过滤掉常见的password、####、、空密码等还有一个细节一定要注意 没错github密码有要求的所以我们可以写个正则只保留符合 github 密码要求的这样我就拿到了一堆价值数据。 然后再用python写个程序模拟登陆github就可以了。 最后再展示一个github项目比较多的账号 为了避免引起额外信息泄露暂时无法提供更多深入的数据和完整的爬虫框架脚本。 坐拥这些账号目前我能想到的赚钱方法就是收费帮别人的项目点赞。网络安全从业者与爬虫技术爬虫技术本身并不能实施黑客攻击也不能直接与安全连在一起。 但是纵观很多安全方面的东西却又都离不开爬虫技术 百度网盘数据泄露爬虫惹的祸。某企业存在通过id泄露数据我们可以编写爬虫批量扫描id获取数据。某网站权限配置不当导致在特定情况访问登陆后的页面这时候也可能需要写爬虫。wvs等安全工具严重依赖爬虫通过爬虫爬取网站组织架构。探探app两年前我就玩过含有大量美女我的第一反应不是感不感兴趣而是悄悄地写了个爬虫获取了大量图片而且我还发现他们防色情做的不严谨。开个玩笑写到这里大家应该明白了为什么我强调爬虫的重要性了。 另外爬虫可以使很多事情变得有趣只要肯琢磨脑洞足够开我们完全可以实施很多攻击。 从过来人角度说一下自己的成长蛮有意思的从爬虫起家学技术中途又在公司从事过接近一年的数据挖掘这两个技术的结合给我的学习和研究带来了很多兴趣。 当你具备爬虫和数据分析时你真的可以去改变一些事情。 乌云密布的爬虫百度网盘这件事是我不想看到的这类安全问题的一个共同特点 用户自身确实存在问题。从严格意义上讲这个不是漏洞。企业在修复时处于下风甚至无能为力、无法修复。就拿github这个例子来说除非我把github几千个账号发出来github把每个人账号都冻结。 我只是尝试了一些开源项目还有很多项目我没有实施爬虫攻击比如facebook的redmine项目等很有可能这些项目代码里也有密码泄露。 真的没办法根治未来我担心会有越来越多的安全问题属于没有办法根治的却存在极大安全隐患的。就好比我生大病了我却不知道怎么治你说问题严重么 只说结论 脚本执行了一个下午我便拥有了几百个阿里云服务其中不乏性能很高的服务不乏百万数据级别的redis服务也不乏企业服务。这些服务里面的数据我不知道有多少价值泄露会引起多少恐慌因为我一条都没看过。 这是提交给阿里云之后阿里云的修复建议很早之前的短信了 我的同事、朋友们之中都有收到阿里云的这条短信。嗯没错因为漏洞本身源自用户自己的数据泄露只能通过短信提醒用户。 是不是和百度网盘泄露有相似之处 就写到这里吧。。。 安全渐远渐行却总有一些无能为力的事情发生丝丝的痛