查看原文
其他

详解遗传算法(含MATLAB代码)

(给算法爱好者加星标,修炼编程内功

来源:CSDN - 草莓酱土司

一、遗传算法概述

遗传算法(Genetic Algorithm,GA)是进化计算的一部分,是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。该算法简单、通用,鲁棒性强,适于并行处理。


二、遗传算法的特点和应用


遗传算法是一类可用于复杂系统优化的具有鲁棒性的搜索算法,与传统的优化算法相比,具有以下特点:

1. 以决策变量的编码作为运算对象。

传统的优化算法往往直接利用决策变量的实际值本身来进行优化计算,但遗传算法是使用决策变量的某种形式的编码作为运算对象。这种对决策变量的编码处理方式,使得我们在优化计算中可借鉴生物学中染色体和基因等概念,可以模仿自然界中生物的遗传和进化激励,也可以很方便地应用遗传操作算子。

2. 直接以适应度作为搜索信息。

传统的优化算法不仅需要利用目标函数值,而且搜索过程往往受目标函数的连续性约束,有可能还需要满足“目标函数的导数必须存在”的要求以确定搜索方向。

遗传算法仅使用由目标函数值变换来的适应度函数值就可确定进一步的搜索范围,无需目标函数的导数值等其他辅助信息。直接利用目标函数值或个体适应度值也可以将搜索范围集中到适应度较高部分的搜索空间中,从而提高搜索效率。

3. 使用多个点的搜索信息,具有隐含并行性。

传统的优化算法往往是从解空间的一个初始点开始最优解的迭代搜索过程。单个点所提供的搜索信息不多,所以搜索效率不高,还有可能陷入局部最优解而停滞;

遗传算法从由很多个体组成的初始种群开始最优解的搜索过程,而不是从单个个体开始搜索。对初始群体进行的、选择、交叉、变异等运算,产生出新一代群体,其中包括了许多群体信息。这些信息可以避免搜索一些不必要的点,从而避免陷入局部最优,逐步逼近全局最优解。

4. 使用概率搜索而非确定性规则。

传统的优化算法往往使用确定性的搜索方法,一个搜索点到另一个搜索点的转移有确定的转移方向和转移关系,这种确定性可能使得搜索达不到最优店,限制了算法的应用范围。

遗传算法是一种自适应搜索技术,其选择、交叉、变异等运算都是以一种概率方式进行的,增加了搜索过程的灵活性,而且能以较大概率收敛于最优解,具有较好的全局优化求解能力。但,交叉概率、变异概率等参数也会影响算法的搜索结果和搜索效率,所以如何选择遗传算法的参数在其应用中是一个比较重要的问题。

综上,由于遗传算法的整体搜索策略和优化搜索方式在计算时不依赖于梯度信息或其他辅助知识,只需要求解影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通用框架。它不依赖于问题的具体领域,对问题的种类有很强的鲁棒性,所以广泛应用于各种领域,包括:

  • 函数优化
  • 组合优化生产调度问题
  • 自动控制
  • 机器人学
  • 图像处理(图像恢复、图像边缘特征提取......)
  • 人工生命
  • 遗传编程
  • 机器学习

三、遗传算法的基本流程及实现技术

基本遗传算法(Simple Genetic Algorithms,SGA)只使用选择算子、交叉算子和变异算子这三种遗传算子,进化过程简单,是其他遗传算法的基础。

3.1 遗传算法的基本流程

  1. 通过随机方式产生若干由确定长度(长度与待求解问题的精度有关)编码的初始群体;
  2. 通过适应度函数对每个个体进行评价,选择适应度值高的个体参与遗传操作,适应度低的个体被淘汰;
  3. 经遗传操作(复制、交叉、变异)的个体集合形成新一代种群,直到满足停止准则(进化代数GEN>=?);
  4. 将后代中变现最好的个体作为遗传算法的执行结果。

其中,GEN是当前代数;M是种群规模,i代表种群数量。

3.2 遗传算法的实现技术

基本遗传算法(SGA)由编码、适应度函数、遗传算子(选择、交叉、变异)及运行参数组成。

1.编码

(1)二进制编码

二进制编码的字符串长度与问题所求解的精度有关。需要保证所求解空间内的每一个个体都可以被编码。

优点:编、解码操作简单,遗传、交叉便于实现

缺点:长度大

(2)其他编码方法

格雷码、浮点数编码、符号编码、多参数编码等

2.适应度函数

适应度函数要有效反映每一个染色体与问题的最优解染色体之间的差距。

3.选择算子

通过选择算子模拟“优胜劣汰”,适应度高的个体被遗传到下一代的概率较大,适应度低的算子被遗传到下一代的概率较小。

常用的选择算法:轮盘赌选择法,即令"∑fi"表示群体的适应度函数值的总和,

"fi"示群体中第i个染色体的适应度值,则它产生后代的能力刚好为其适应度值所占的份额"fi/∑fi"

4.交叉算子

  • 交叉运算是指对两个相互配对的染色体按某种方式相互交换其部分基因,从而形成两个新的个体;
  • 交叉运算是遗传算法区别于其他进化算法的重要特征,是产生新个体的主要方法。

在交叉之前需要将群体中的个体进行配对,一般采取随机配对原则。

常用的交叉方式:

  • 单点交叉
  • 双点交叉(多点交叉,交叉点数越多,个体的结构被破坏的可能性越大,一般不采用多点交叉的方式)
  • 均匀交叉
  • 算术交叉

5.变异算子

遗传算法中的变异运算是指将个体染色体编码串中的某些基因座上的基因值用该基因座的其他等位基因来替换,从而形成一个新的个体。

就遗传算法运算过程中产生新个体的能力方面来说,交叉运算是产生新个体的主要方法,它决定了遗传算法的全局搜索能力;而变异运算只是产生新个体的辅助方法,但也是必不可少的一个运算步骤,它决定了遗传算法的局部搜索能力。交叉算子与变异算子的共同配合完成了其对搜索空间的全局搜索和局部搜索,从而使遗传算法能以良好的搜索性能完成最优化问题的寻优过程。

6.运行参数

  • 编码长度。编码长度取决于问题解的精度,精度越高,编码越长;
  • 种群规模。规模小,收敛快但降低了种群的多样性,“N=20 — 200”
  • 交叉概率。较大的交叉概率容易破坏种群中已形成的优良结构,使搜索具有太大随机性;较小的交叉概率发现新个体的速度太慢,一般取值为“Pc=0.4— 0.99”
  • 变异概率。变异概率太小,则变异操作产生新个体的能力和抑制早熟现象的能力会较差;变异概率过高随机性过大,一般建议取值范围为0.005~0.01
  • 终止进化代数。算法运行结束的条件之一,一般取100~1000

四、遗传算法的基本原理

4.1 模式定理

定义1:模式H是由{0,1,*}中的元素组成的一个编码串,其中“*”表示通配符,既能被当作0,也能被当作1。e.g. H=10**1

定义2:模式的阶,是指模式中所含有0,1的数量,记作O(H) e.g. O(11*00**)=4

定义3:模式的矩,即模式的长度,是指模式中从左到右第一个非*位和最后一个非*位之间的距离,记作

e.g. 

定义4:模式的适应度值,是群体中所包含的全部个体的适应度值的平均值。

定义5:在选择、交叉、变异遗传算子的作用下,低阶、长度短、超过群体平均适应值的模式的生存数量,将随迭代次数以指数规律增长。

模式定理不仅说明基因块的样本呈指数增长,也说明用遗传算法寻求最优样本的可能性,但它并未指出遗传算法一定能够寻求到最优解,积木块假设说明了遗传算法的寻找最优解的能力。

4.2 积木块假设

具有低阶、定义长度短,且适应度值高于群体平均适应度值的模式称为基因块或积木块。

积木块假设:个体的基因块通过选择、交叉、变异等遗传算子的作用,能够相互拼接在一起,形成适应度更高的个体编码串。

积木块假设说明了用遗传算法求解各类问题的基本思想,即通过积木块直接相互拼接在一起能够产生更好的解。

五、遗传算法编程实例(MATLAB)

https://github.com/strawberry-magic-pocket/Genetic-Algorithm.git


- EOF -

推荐阅读  点击标题可跳转

1、白话讲解遗传算法

2、详解遗传算法

3、遗传算法中几种不同选择算子及 Python 实现


觉得本文有帮助?请分享给更多人

推荐关注「算法爱好者」,修炼编程内功

点赞和在看就是最大的支持❤️

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存