`
kaka2008
  • 浏览: 91860 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

csdn泄漏密码分析

阅读更多
   csdn密码泄漏,640万用户数据泄漏,对于在小公司的我,从没见过这么大数据量,于是非
常兴奋,迫不及待的想去操作一下如此大的表。

   使用mysql,首先建表。
  
     create database csdn;

     create table csdn(
        id int not null auto_increment,
        username varchar(100),
        passwd varchar(100),
        email varchar(100),
        primary key (id) 
     )
   


   接着导入表,由于泄漏的文件不是标准sql,只有三列,使用#隔开,因此使用load data infile方式。
  
     load data local infile '/home/kaka/csdn.sql' into table csdn fields terminated by '#' (username,passwd,email);
   

   导入成功,共有6428632条记录。

   这么多条记录,访问起来十分慢,首先建几条索引(index)
  
    create index passwd_index on csdn(passwd) using btree;
   

   时间是
  
引用

      Query OK, 6428632 rows affected (3 min 46.82 sec)
  

   再对邮箱建一个索引:
  
    create index email_index on csdn(email) using btree;
   

   用的时间更长,
  
引用

      Query OK, 6428632 rows affected (6 min 51.11 sec)
      Records: 6428632  Duplicates: 0  Warnings: 0
  

   不过和后面的查询减少的时间比起来,这个6分钟也是很值得了。

   下面来进行一些有趣的分析:

   1、常用密码排名(前20名)
  
引用

|     passwd       | count(passwd) |
+--------------+---------------+
|  123456789   |        235029 |
|  12345678    |        212766 |
|  11111111    |         76348 |
|  dearbook    |         46052 |
|  00000000    |         34953 |
|  123123123   |         20010 |
|  1234567890  |         17794 |
|  88888888    |         15033 |
|  111111111   |          6995 |
|  147258369   |          5966 |
|  aaaaaaaa    |          5890 |
|  987654321   |          5555 |
|  1111111111  |          5145 |
|  66666666    |          5026 |
|  a123456789  |          4686 |
|  11223344    |          4096 |
|  1qaz2wsx    |          3969 |
|  password    |          3654 |
|  xiazhili    |          3649 |
|  789456123   |          3611 |

  

   12345678和12345678分别突破20万,整天叫嚷这数据安全的程序员们,轮到自己的时候,密码就这么简单啊~
   排名第四的是dearbook,有4.6万人,我不清楚dearbook有何含义,知道的解释下吧。

   以ilove**作为密码的共有12031个人。

  2、没有重复的密码:
  
引用

       !(*!!
!(()!!!^
!((%)*)(QWtxd
!((%!((%
!(($)
!((!)*)
!((!)()%
!((
!(&^)^!(
!(&^!!@&
!(()!!@
!(()!@)(cloud
!(()!@)6125dou
!()jian20
!((^)^@@123123
!((@0709yxw
!((*03230225tian
!(()HB1990128
!(()0803
!(())@)@@

  

     
   要想密码没有重复,!,(,)不可少啊~不过这也太难记了吧。。

   3、80后统计
   把密码设为日期的应该就是自己的出生日期了吧
   来统计一下80后

  
引用

birth   count
-----   ------
1980 15374
1981 21923
1982 34535
1983 35144
1984 39849
1985 41709
1986 50940
1987 59569
1988 53519
1989 45269
-----   ------
        397831
  

将近40万的80后哦~

   4、注册邮箱排名(前20)
  
引用

   qq.com        1972584
163.com        1763310
126.com        806199
sina.com        350870
yahoo.com.cn        205110
hotmail.com        202361
gmail.com        186086
sohu.com        104554
yahoo.cn        86797
tom.com        72231
yeah.net        53114
21cn.com        50597
vip.qq.com        35055
139.com        29105
263.net        24756
sina.com.cn        19103
live.cn        18860
sina.cn        18574
yahoo.com        18338
foxmail.com        16382

  


  从这张表里,大概能反映目前国内各邮箱厂商的市场占有率:网易和qq领先竞争对手非常多,网易256万多,腾讯200万左右,排名第三的新浪只有35万左右。后面依次是雅虎,hotmail,gmail,sohu。。

  5、大学统计
  根据邮箱后缀来统计各大学注册人数
 
引用

    mail.ustc.edu.cn           2035     中科大
    sjtu.edu.cn         1876     上海交大
    bjtu.edu.cn                 1341     北京交大
    fudan.edu.cn         981      复旦
    stu.xjtu.edu.cn         930      西安交大
    zju.edu.cn             876      浙大
    mails.tsinghua.edu.cn 716      清华
    bit.edu.cn           691      北京理工
    mail.nankai.edu.cn   640      南开
    stu.edu.cn          559      汕头大学
    emails.bjut.edu.cn   487      北京工大
    swu.edu.cn          450      西南大学
    nenu.edu.cn         413      东北师范
    ustc.edu            345      中科大
    mail.dhu.edu.cn     327      东华大学
    cqu.edu.cn          311      重庆大学
    pku.edu.cn          309      北大
    mail.sdu.edu.cn     309      山东大学
    stu.snnu.edu.cn     299      陕西师范大学
    cqut.edu.cn         260      重庆理工
 


  中科大,上海交大,北京交大占据了前三甲啊。。

  6、两个段子
 
引用

       RT @hecaitou:  转:CSDN 杯我最喜欢的密码大决选总冠军:ppnn13%dkstFeb.1st。看不懂?中文解析:娉娉袅袅十三余,豆蔻梢头二月初。
 

  经查,没有这个密码。。
 
引用

       转:CSDN杯我最喜欢的密码大决选季军: FLZX3000cY4yhx9day (飞流直下三千尺,疑似银河下九天) hanshansi.location()!∈[gusucity](姑苏城外寒山寺) hold?fish:palm(鱼和熊掌不可兼得)
 

  经查,只有 FLZX3000C 这个存在,其它的都不存在。
  这帮文人啊,造些无聊的段子有神马意义~
 
 
  csdn的分析就到这里吧,下一篇将是对4000万天涯数据的分析,敬请期待啊~

  ps:
  1、建库,导入数据,建索引时间都是基于我的笔记本上虚拟机统计出来的。P8500双核,1G内存.
  2、处理大数据,linux系列比windows强太多了。在win7上查询不下去了,我才转移到ubuntu上的。
  3、本人只是对处理大规模数据感兴趣,所以才下载了这些数据,仅用来学习,不害人不传播,请勿跨省,请勿向我索取。

   
分享到:
评论
1 楼 wubaodong 2011-12-28  
顶一个

相关推荐

    论文研究-无双线性对的无证书两方密钥协商方案.pdf

    为了解决上述问题,给出了一个新的无双线性对运算无证书两方密钥协商方案,并分析了它的安全属性,只要每方至少有一个未泄露的秘密,那么新方案就是安全的。因此,即使密钥生成中心知道双方的临时私钥,新方案也是...

    国内网络用户密码分析 (2013年)

    以CSDN和RenRen网站泄露的明文密码为例,分析了国内网络用户设置密码的最常用密码、密码长度分布、密码类型分布,以及使用Email地址、手机号码、日期相关、英文单词等作为密码的情况.针对普通网民提出了一些设置...

    防火墙相关

    4.8 安全分析—为什么我们的设置 是安全的和失效保护的 87 4.9 性能 89 4.10 TIS防火墙工具箱 89 4.11 评估防火墙 90 4.11.1 数据包过滤器 90 4.11.2 应用网关 90 4.11.3 电路网关 91 4.12 没有防火墙,日子怎么过 ...

    数据库安全审计系统介绍.pptx

    数据库信息泄露风险分析 数据非法修改 黑客 第三方人员 公共帐号 系统用户 数据破坏 DBA或超级用户 敏感数据 数据盗取 未授权使用 真实性 完整性 保密性 信息泄露:产生->传输->使用全过程 ? 数据库安全审计系统...

    hassh:HASSH是一种网络指纹识别标准,可用于标识特定的客户端和服务器SSH实现。 指纹可以以小MD5指纹的形式轻松存储,搜索和共享

    “ HASSH”-一种用于SSH客户端和服务器的分析方法。 “ HASSH”是一种网络指纹识别标准,可用于标识特定的客户端和服务器SSH实现。 指纹可以以MD5指纹的形式轻松存储,搜索和共享。 HASSH可提供哪些帮助: 在高度...

    PDManager个人文档数据管理

    文本的安全, 最大限度的减低了信息载体接受非法访问造成信息泄露的风 险性, 同时这种以用户口令分散产生密钥的方法又方便了用户对每一数据 库文件中所有数据的集中管理。 文件列表 ======== 1.PDManager....

    标准模型下可撤销的基于身份的代理重签名方案

    针对目前基于身份的代理重签名方案不支持用户撤销的问题,引入了可撤销的基于身份代理重签名密码体制,并给出了相应的形式化定义和安全模型。基于代理重签名方案和二叉树结构,构造了一个可撤销的基于身份的代理重...

    商业银行移动支付安全研究

    然而,用户在享受移动支付方便快捷服务的同时,却面临着严峻的安全问题:手机木马、隐私泄露等事件层出不穷,大量具有完整攻击行为的金融支付类病毒,可在远程/近场支付过程中对用户的账户、密码、验证码等信息进行...

    网络安全实用项目教程-项目3-网络数据库安全.pptx

    计算机网络安全项目教程 2011年底, CSDN、天涯等网站发生用户信息泄露事件引起社会广泛关注,被公开的疑似泄露数据库26个,涉及帐号、密码信息2.78亿条,严重威胁了互联网用户的合法权益和互联网安全。根据调查和...

    vc++ 应用源码包_1

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

    vc++ 应用源码包_2

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

    vc++ 应用源码包_6

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

    vc++ 应用源码包_5

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

    vc++ 应用源码包_3

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

    vc++ 开发实例源码包

    CSDN免积分下载工具 源码 演示了使用CInternetSession去下载资源。 CStatic文字滚动 如题,此实例非常适合学习,重载并自绘了Wnd类,效果是上下文字、图片、文字由大到小和星星闪烁等滚动效果。实例使用了加载类似...

Global site tag (gtag.js) - Google Analytics