口袋社区-Poke The BBS's Archiver

youd 发表于 2009-9-20 16:02

搜索大质数的算法PHP版本【算法导论实践】

产生大质数是现代公钥加密的基础(一般为RSA)。
在这里,我们需要搜索一个大质数(二进制,可能长达上千位!)必然会存在着很多问题。

[b]1.质数有多少?[/b]
根据公式n/lgn,在n趋于无穷的情况下,这个式子的结果=数字n包含的质数数量。
虽然说是约等于,但是误差还是很小的(在原书中著有,10^9数量级的n误差为6%左右)
那么假设我要找一个长度为512位的质数的概率是多少呢?
[512/lg(2^512)-511/lg(2^511)]/(2^512-2^511) 必须注意,这个对数以2为底数。
原书中有歧义的是,原书中给出的概率应该包含0~512位的概率,所以这里给予修正。
如果你计算过的话,会发现概率不低,这就为我们搜索质数提供了可能。
我们可以找一个位数足够的随机数进行素数测试,测试几百个就应该会出现一个素数。
如果我们只测试奇数,那么上面得出的概率还会倍增!

[b]2.产生一个随机数[/b]
对于2^n这样一个数量级的数字而言,用普通的算法来产生已经很困难了(在PHP中,整型的变量上限为2^31,这取决于cpu的寻址能力),对此我们可以用巧妙的方法迅速的产生一个大的随机数。
[php]function random_int($digit)
{
$digit_pro=floor($digit/16);
for($i=1;$i <= $digit_pro;$i++)
{
  $random.=decbin(mt_rand(0,65536));
}
return "1".decbin(mt_rand(0,16384)).$random."1";
}[/php]
这里提出要求,我们要产生的是一个二进制的随机数,那么$digit务必要求为16的倍数。
这个函数产生的随机数必定为一个奇数。

[b]2.a^b mod n[/b]
解决了随机数的问题,我们接下来要解决的问题就是素数的测试。
通常我们所用的算法是
对待测数字n进行试除,一直到sqrt(n)的时候为止,若没有能使之模数字为0的数字,就说它是一个质数。
然后对于一个巨大的数字而言,这工作简直太可怕了,所以我们要另外寻找方法。
原书给出的通常算法是Miller-Rabin。在这里我不做介绍,这里给出它的前身。
首先给出求a^b mod n的方法。
对于巨大的数字求a^b 再对其模n几乎是不可能的(试想(2^n)^n)的增长率),但是我们由其公式可以得知
a*a mod n=a mod n * a mod n
这就对我们的运算产生了极大的方便。于是便有了反复平方法求解的思想。
[php]//m-e
function modular_exponentiation($a,$b,$n)
{
$d=1;
for($k=strlen($b);$k > 0;$k--)
{
  $d=bcmod(bcmul($d,$d),$n);
  if(substr($b,0-$k,1)==1)
  {
   $d=bcmod(bcmul($d,$a),$n);
  }
}
return $d;
}[/php]
上面给出了算法,里面的bc函数代表PHP的高精度数学运算函数,尽管说这样做避免了恐怖的运算,但是数字仍然很大,以至于我们不能直接对其进行普通数学运算。

[b]3.判断质数[/b]
判断一个数是否为一个质数是很容易的。根据费马定理(page545)的逆命题(几乎和原命题同真)
我们可以得到一个测试素数的算法:
[php]function pseudoprime($n)
{
$dec=bindec_pro($n);
if(bcmod(modular_exponentiation(2,decbin_pro(bcsub($dec,1)),$dec),$dec)!=1)
{
  return false;
}
else
{
  return true;
}
}[/php]
这个过程用到了上面一节所写的函数,这个函数所进行的运算是整个算法中最为复杂的。
通过这个函数我们就可以判断这个数究竟是不是质数了。
必须注意!这个方法的判断是可能出现错误的。比如是合数,却被判断为了质数,是质数却被判断为合数。但错误的概率随着n增加,将变得微乎其微(Miller-Rabin正是对此的改进,它通过选用不同的基数来对其进行判断,但十分遗憾,对于所有的基数都有Carmichael数符合条件,也就是说凡是Carmilchael数都会被当做质数输出。幸运的是这种数字是非常稀有的(随着搜索的数字的数量级变大,概率逐渐降低,如果你找到的数字是这样一个数,那么恭喜你,你可以中500万了!)。

[b]4.搜索质数[/b]
最后奉上搜索质数的主程序
[php]//查找素数
function searchprime($digit=256)
{
$i=0;
while(true)
{
  $num=random_int($digit);
  if(pseudoprime($num))
  {
   return $num;
  }
}
}[/php]
对于256位及以下的质数的搜索,该算法能在30s内找到(我尝试搜索了一个4096位的质数,在运气十分好的情况下(只测试了92个随机数),仍然用去了超过7000s的时间,这取决于CPU的运算能力以及语言的高效性)

[b]*赠品:[/b]
输出的结果居然是二进制数字!这简直太难看了吧?(真正应用的时候应该没人看)
我们可以通过简单的转换把它转化为其他进制的数字。以下为几个进制转换的小程序。
[php]//10->2
function decbin_pro($num)
{
$b=0;
$i=0;
do
{
  $q=bcdiv($num,2);
  $r=bcmod($num,2);
  $b=$r.$b;
  $num=$q;
  $i++;
}while($q!=0);
return $b;
}
//2->10
function bindec_pro($num)
{
$b=0;
$t=str_split($num);
$len=strlen($num)-1;
for($l=$len;$l >= 0;$l--)
{
  $b=bcadd(bcmul($t[$len-$l],bcpow(2,$l)),$b);
}
return $b;
}
//2->16
function binhex_pro($num)
{
$arr=array(
"0000"=>"0",
"0001"=>"1",
"0010"=>"2",
"0011"=>"3",
"0100"=>"4",
"0101"=>"5",
"0110"=>"6",
"0111"=>"7",
"1000"=>"8",
"1001"=>"9",
"1010"=>"A",
"1011"=>"B",
"1100"=>"C",
"1101"=>"D",
"1110"=>"E",
"1111"=>"F");
$len=strlen($num);
$d=8-$len%8;
for($i=1;$i <= $d;$i++){
  $num='0'.$num;
}
$t=str_split($num,8);
$p=ceil($len/8)-1;
for($i=0;$i <= $p;$i++)
{
  $k=str_split($t[$i],4);
  $b.=$arr[$k[0]].$arr[$k[1]]." ";
}
return $b;
}[/php]

liuyanghejerry 发表于 2009-9-20 16:28

你是不是疯了,现在看算法导论?顺便问下,你看的是中文版还是英文版……

youd 发表于 2009-9-20 16:45

机械工业出版社的翻译版。当当买了,打了8折也就68.
每周总得给自己留两个小时的娱乐时间对吧

roywillow 发表于 2009-9-20 20:36

算法导论……
我们学计算导论……
不过还没仔细看,好像讲到了指针了都……

这种东西……感觉就像数学题一样……

六边形的梦 发表于 2009-10-6 19:53

算法。给我的感觉其实就是考数学。

页: [1]

Powered by Discuz! Archiver 6.1.0F  © 2001-2007 Comsenz Inc.