恢复BLOG

好久没写了,学的东西不记录下,复习都没地方。算法好久没系统的看看了,以前读书的时候,每个书上的算法都自己在电脑上实现并测试通过,现在就是照着书估计也得花点时间才能实现一个简单的排序算法了,悲剧。还得好好向德文同学学习啊,该同学在航信的时候就认真刻苦,现在跑到成都去养老了,不错。

 

假设这有一个各种字母组成的字符串(长度M),假设这还有另外一个字符串(长度N),而且这个字符串里的字母数相对少一些。从算法是讲,什么方法能最快的查出所有小字符串里的字母在大字符串里都有?

比如,如果是下面两个字符串:

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOM

答案是true,所有在string2里的字母string1也都有。如果是下面两个字符串:

String 1: ABCDEFGHLMNOPQRS

String 2: DCGSRQPOZ

答案是false,因为第二个字符串里的Z字母不在第一个字符串里。

对于这种操作一种幼稚的做法是轮询第二个字符串里的每个字母,看它是否同在第一个字符串里。从算法上讲,这需要O(N*M)次操作。
一个稍微好一点的方案是先对这两个字符串的字母进行排序,然后同时对两个字串依次轮询。两个字串的排序需要(常规情况) O(MlogM)+O(NlogN)次操作,之后的线性扫描需要O(M+N)次操作。
再好点的算法就是对第一个字串进行轮询,把其中的每个字母都放入一个Hashtable里(成本是O(M))。然后轮询第二个字串,在Hashtable里查询每个字母,看能否找到。如果找不到,说明没有匹配成功。算法复杂度为O(M+N)

上面是一般人都想得出的解决办法,比如我们算法界的巨擘德文文同学,更是直接就提出最优解决办法。我承认,我也只能想出这几种办法。但是。。。但是。。。有人(Guy)提出了一种新颖的解决该问题的办法。该办法如下:
假设我们有一个一定个数的字母组成字串 —— 我给每个字母分配一个素数,从2开始,往后类推。这样A将会是2,B将会是3,C将会是5,等等。现在我遍历第一个字串,把每个字母代表的素数相乘。你最终会得到一个很大的整数,对吧?然后 —— 轮询第二个字符串,用每个字母除它。如果除的结果有余数,这说明有不匹配的字母。如果整个过程中没有余数,你应该知道它是第一个字串恰好的子集了。这样不行吗?

现在我想告诉你 —— Guy的方案(不消说,我并不认为Guy是第一个想出这招的人)在算法上并不能说就比我的好。而且在实际操作中,你很可能仍会使用我的方案,因为它更通用,无需跟麻烦的大型数字打交道。但从”巧妙水平“上讲,Guy提供的是一种更、更、更有趣的方案。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章