遺傳算法介紹(內含實例)

 

現代生物遺傳學中描述的生物進化理論:
遺傳物質的主要載體是染色體(chromsome),染色體主要由DNA和蛋白質組成。其中DNA爲最主要的遺傳物質。
基因(gene)是有遺傳效應的片斷,它存儲着遺傳信息,可以準確地複製,也能發生突變,並可通過控制蛋白質的合成而控制生物的狀態.生物自身通過對基因的複製(reproduction)和交叉(crossover,即基因分離,基因組合和基因連鎖互換)的操作時其性狀的遺傳得到選擇和控制。生物的遺傳特性,使生物界的物種能保持相對的穩定;生物的變異特性,使生物個體產生新的性狀,以至於形成了新的物種(量變積累爲質變),推動了生物的進化和發展。

遺傳學算法和遺傳學中的基礎術語比較

染色體(chromosome)    數據,數組,序列
基因(gene) 單個元素,位
等位基因(allele) 數據值,屬性,值
基因座(locus)  位置,iterator位置
表現型(phenotype)  參數集,解碼結構,候選解
遺傳隱匿(epistasis)  非線性

染色體又可以叫做基因型個體(individuals),一定數量的個體組成了羣體(population),羣體中個體的數量叫做羣體大小。各個個體對環境的適應程度叫做適應度(fitness)

遺傳算法的準備工作:
1)數據轉換操作,包括表現型到基因型的轉換和基因型到表現型的轉換。前者是把求解空間中的參數轉化成遺傳空間中的染色體或者個體(encoding),後者是它的逆操作(decoding)
2)確定適應度計算函數,可以將個體值經過該函數轉換爲該個體的適應度,該適應度的高低要能充分反映該個體對於解得優秀程度。非常重要的過程!

遺傳算法的基本步驟
遺傳算法是具有"生成+檢測"(generate-and-test)的迭代過程的搜索算法。
基本過程爲:
1)編碼,創建初始集團
2)集團中個體適應度計算
3)評估適應度
4)根據適應度選擇個體
5)被選擇個體進行交叉繁殖,
6)在繁殖的過程中引入變異機制
7)繁殖出新的集團,回到第二步

一個簡單的遺傳算法的例子:求 [0,31]範圍內的y=(x-10)^2的最小值
1)編碼算法選擇爲"將x轉化爲2進制的串",串的長度爲5位。(等位基因的值爲0 or 1)
2)計算適應度的方法是:先將個體串進行解碼,轉化爲int型的x值,然後使用y=(x-10)^2作爲其適應度計算合適(由於是最小值,所以結果越小,適應度也越好)
3)正式開始,先設置羣體大小爲4,然後初始化羣體 => (在[0,31]範圍內隨機選取4個整數就可以,編碼)
4)計算適應度Fi(由於是最小值,可以選取一個大的基準線1000,Fi = 1000 - (x-10)^2)
5)計算每個個體的選擇概率.選擇概率要能夠反映個體的優秀程度.這裏用一個很簡單的方法來確定選擇概率
P=Fi / TOTAL(Fi).
6)選擇.
根據所有個體的選擇概率進行淘汰選擇.這裏使用的是一個賭輪的方式進行淘汰選擇.先按照每個個體的選擇概率創建一個賭輪,然後選取4次,每次先產生一個0-1的隨機小數,然後判斷該隨機數落在那個段內就選取相對應的個體.這個過程中,選取概率P高的個體將可能被多次選擇,而概率低的就可能被淘汰.

下面是一個簡單的賭輪的例子
   13%               35%                    15%                 37%       
----------|----------------------------|------------|-*-------------------------|
   個體1              個體2                  個體3    ^0.67    個體4

隨機數爲0.67落在了個體4的端內.本次選擇了個體4. 

被選中的個體將進入配對庫(mating pool,配對集團)準備開始繁殖.
7)簡單交叉
先對配對庫中的個體進行隨機配對.然後在配對的2個個體中設置交叉點,交換2個個體的信息後產生下一代.
比如( | 代表簡單串的交叉位置)
 ( 0110|1, 1100|0 ) --交叉--> (01100,11001)
 ( 01|000, 11|011 ) --交叉--> (01011,11000)
2個父代的個體在交叉後繁殖出了下一代的同樣數量的個體.
複雜的交叉在交叉的位置,交叉的方法,雙親的數量上都可以選擇.其目的都在於儘可能的培育出更優秀的後

8)變異
變異操作時按照基因座來的.比如說沒計算2萬個基因座就發生一個變異(我們現在的每個個體有5個基因座.也就是說要進化1000代後纔會在其中的某個基因座發生一次變異.)變異的結果是基因座上的等位基因發生了變化.我們這裏的例子就是把0變成1或則1變成0.
至此,我們已經產生了一個新的(下一代)集團.然後回到第4步,周而復始,生生不息下去:)

僞代碼實例(適合愛看代碼的朋友~):

//Init population
foreach individual in population
{
     individual = Encode(Random(0,31));
}

while (App.IsRun)

     //計算個體適應度
     int TotalF = 0;
     foreach individual in population
     {
      individual.F = 1000 - (Decode(individual)-10)^2;
      TotalF += individual.F;
     }

     //------選擇過程,計算個體選擇概率-----------
     foreach individual in population
     {
          individual.P = individual.F / TotalF;
     }
     //選擇
     for(int i=0;i<4;i++)
     {
          //SelectIndividual(float p)是根據隨機數落在段落計算選取哪個個體的函數
          MatingPool[i] = population[SelectIndividual(Random(0,1))];
     }
     //-------簡單交叉---------------------------
     //由於只有4個個體,配對2次
     for(int i=0;i<2;i++)
     {
          MatingPool.Parents[i].Mother = MatingPool.RandomPop();
          MatingPool.Parents[i].Father = MatingPool.RandomPop();
        }

     //交叉後創建新的集團
     population.Clean();
     foreach Parent in MatingPool.Parents
     {
          //注意在copy 雙親的染色體時在某個基因座上發生的變異未表現.
          child1 = Parent.Mother.DivHeader + Parent.Father.DivEnd;
          child2 = Parent.Father.DivHeader + Parent.Mother.DivEnd;
          population.push(child1);
          population.push(child2);
     }

小結:
遺傳算法中最重要的過程就是選擇和交叉。
選擇要能夠合理的反映"適者生存"的自然法則,而交叉必須將由利的基因儘量遺傳給下一代(這個算法很關鍵!)
還有就是編碼的過程要能夠使編碼後的染色體能充分反映個體的特徵並且能夠方便計算。

這篇文章是原來學習的一些回憶的整理,因爲最近要實用了.不正確的地方還希望大家多多指出~

 

 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章