标题: 提供一个分布式计算的创意,关于数学的
youyancao
论坛担当
Rank: 4



UID 7591
精华 1
积分 741
帖子 325
阅读权限 10
注册 2005-10-1
来自 浙江
发表于 2006-2-18 19:37  资料  主页 短消息  加为好友  添加 youyancao 为MSN好友 通过MSN和 youyancao 交谈
提供一个分布式计算的创意,关于数学的

内容:收集所有MD5码对应的最短明文
资料:
md5的全称是message-digest algorithm 5(信息-摘要算法),在90年代初由mit laboratory for computer science和rsa data security inc的ronald l. rivest开发出来,经md2、md3和md4发展而来。它的作用是让大容量信息在用数字签名软件签署私人密匙前被"压缩"成一种保密的格式(就是把一个任意长度的字节串变换成一定长的大整数)。不管是md2、md4还是md5,它们都需要获得一个随机长度的信息并产生一个128位的信息摘要。虽然这些算法的结构或多或少有些相似,但md2的设计与md4和md5完全不同,那是因为md2是为8位机器做过设计优化的,而md4和md5却是面向32位的电脑。这三个算法的描述和c语言源代码在internet rfcs 1321中有详细的描述(h++p://www.ietf.org/rfc/rfc1321.txt),这是一份最权威的文档,由ronald l. rivest在1992年8月向ieft提交。
摘自http://bbs.zol.com.cn/index20060121/index_165_4583.html
简单的说,MD5码就是对任意字符串进行的函数运算,最后得出一个32位的16进制数字.也就是说,这个函数的定义域是无穷的,而值域是有限的(只有16^32个结果).也就是说,一定存在不同的字符串,它们进行MD5码运算后,输出结果是相同的.
那么我们可以通过分布式运算的方法,找到所有MD5码对应的最短明文,并以数据库的形式供所有人查询MD5对应的明文.

意义:好像也说不出什么特别重大的意义,只不过这样一个项目如果真的能开始的话,很多的计算机系统就面临开发新的加密算法的需求了.

建议:
1,如何获取待检测的明文
可以通过监测Windows中的Temp文件夹中的临时文件,随机抽取文件内容进行MD5运算
2,个人信息统计的内容
分为几项:已检测的字符串数,计算出的最短明文的数目(即目前为止个人检测的字符串中,保持最短的个数)

问题:
该项目对服务器的要求非常的高.如果假设每个检测的明文有8Byte,那么所有明文和对应的MD5码将需要TB级的磁盘阵列了。


大家讨论一下,觉得怎么样?

[ Last edited by youyancao on 2006-2-18 at 19:38 ]





Good bye UD!
And hello BOINC!


Blog
顶部
[广告] Einstein@Home 官方优化程序,推荐使用!
JUST
版主
Rank: 6Rank: 6



UID 1265
精华 0
积分 1725
帖子 1378
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2006-2-18 21:00  资料  短消息  加为好友 
MD5已经有碰撞算法了








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
youyancao
论坛担当
Rank: 4



UID 7591
精华 1
积分 741
帖子 325
阅读权限 10
注册 2005-10-1
来自 浙江
发表于 2006-2-18 22:04  资料  主页 短消息  加为好友  添加 youyancao 为MSN好友 通过MSN和 youyancao 交谈


QUOTE:
引用 JUST 在 2006-2-18 21:00 时的帖子:
MD5已经有碰撞算法了

我听说过,不过算法算出来的不是最短明文
这个项目是将所有MD5对应的最短明文找出来





Good bye UD!
And hello BOINC!


Blog
顶部
JUST
版主
Rank: 6Rank: 6



UID 1265
精华 0
积分 1725
帖子 1378
阅读权限 100
注册 2004-5-4
来自 北京
发表于 2006-2-18 22:46  资料  短消息  加为好友 
是否是最短并不重要

首先,一个碰撞算法足以摧毁MD5(我记得好像是几个小时破解一个),是否最短无所谓
另外,不可能把每个MD5所对应的最短原文存下,最好情况下每个原文平均需要log(16^32)bit
这样总共就需要,(16^32)*128bit=2^135bit=2^132byte=2^92Tbyte
即使能存下来,普通计算机算MD5大概是128Mbps,这样共需CPU时间2^108秒,即10790283070806014188970529154990CPU年
显然不太现实








中国分布式计算项目Pi Segment(已结束)
www.pisegment.net
顶部
Youth
管理员
Rank: 7Rank: 7Rank: 7
勿忘国耻~振兴中华



UID 1613
精华 29
积分 8931
帖子 8631
阅读权限 102
注册 2004-6-30
来自 上海
发表于 2006-2-19 11:02  资料  主页 短消息  加为好友 
我觉得还不如像primegrid项目那样,挑战RSA的那套加密的东东,比较有现实意义
平台上可以就利用BOINC那套东西

http://www.primegrid.com/





欢迎所有 BOINC 用户加入 Team China 团队 | my Stats...
顶部
youngfan
版主
Rank: 6Rank: 6


UID 1531
精华 0
积分 123
帖子 115
阅读权限 100
注册 2004-6-16
发表于 2006-2-19 20:09  资料  短消息  加为好友 
主要是需要海量的数据库空间存储结果,这一点目前我的资源还办不到





茶能醉人无需酒,书能香我何必花 [url]http://www.aitech.cn/grid/[/url]
顶部
碧城仙
管理员
Rank: 7Rank: 7Rank: 7



UID 403
精华 54
积分 8767
帖子 8081
阅读权限 102
注册 2004-1-24
来自 华东理工大学
发表于 2006-2-19 22:31  资料  主页 短消息  加为好友 
MD5 的分布式计算项目曾经有过一个:http://www.equn.com/distributed/past.html





快是快乐的一半,快乐才是计算的全部。
癌症研究相关项目:Folding@home、Rosetta@home、Help Conquer Cancer(WCG)、Cels@Home
顶部
884443
新手上路
Rank: 1


UID 10738
精华 0
积分 39
帖子 39
阅读权限 10
注册 2006-3-8
发表于 2006-3-15 23:14  资料  短消息  加为好友  添加 884443 为MSN好友 通过MSN和 884443 交谈 QQ


QUOTE:
引用 youngfan 在 2006-2-19 20:09 时的帖子:
主要是需要海量的数据库空间存储结果,这一点目前我的资源还办不到

再整个分布式存储不就行了





顶部
 



当前时区 GMT+8, 现在时间是 2008-7-5 00:24
沪ICP备05042587号

本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.5.0 © 2001-2007 Comsenz Inc.
清除 Cookies - 联系我们 - 中国分布式计算总站 - Archiver - WAP