遗传算法的matlab实现及其在氨基酸聚类分析中的应用
目录
摘要 1
关键词 1
Abstract 1
Key words 1
1 遗传算法的Matlab实现 1
1.1 遗传算法概述 1
1.1.1遗传算法的历史 2
1.1.2遗传算法的基本过程 3
1.2 Matlab实现遗传算法 3
2 遗传算法在氨基酸聚类分析中的应用 4
2.1 生物信息学概述 4
2.1.1生物信息学的成长史及现状 5
2.1.2生物信息学所研究的主要内容 5
2. 1. 3遗传算法与生物信息学的联系 6
2.2 遗传算法在氨基酸聚类分析中的应用 6
2. 2. 1在遗传算法的基础上对氨基酸序列聚类进行分析 6
2. 2. 2基于遗传算法的K均值聚类分析—用遗传算法对传统的数据挖掘法进行改善 6
2. 2. 3K均值法简述 6
2. 2. 4单纯使用遗传算法的氨基酸聚类 7
2. 2.5使用遗传算法与K均值的氨基酸聚类分析 7
2. 2. 6算法流程 8
2. 2.7仿真实验 9
2.2. 8其他 9
3 讨论 9
致谢 10
参考文献: 10
遗传算法的Matlab实现及其在氨基酸聚类分析中的应用
信息与计算科学 王帅
引言
引言 *51今日免费论文网|www.jxszl.com +Q: #351916072#
遗传算法(Genetic Algorithm, GA)最先是由美国Michigan大学的霍兰德(John Holland)教授于1975年提出的,它通过模拟达尔文的遗传选择和自然淘汰的生物进化过程,形成一个新的计算模型[1]。它的思想来自生物学中遗传和适者生存这两种自然规律,将“生存+检测”这两种思想加入到迭代过程中去的搜索算法。所以在学会了matlab后,用matlab实现遗传算法,并将他投入到对氨基酸序列进行聚类分析的应用中去,可以帮助我们进一步了解氨基酸序列。
1 遗传算法的Matlab实现
1.1 遗传算法概述
遗传算法的思想源于生物学中遗传和适者生存这两种自然规律,将“生存+检测”这两种思想加入到迭代过程中去的搜索算法,这种计算模型对达尔文对生物过程中的遗传选择及自然淘汰的的特点进行模拟。
遗传算法的优点有很多:1.它拥有快速随机搜索与问题无关领域的能力;2.它搜索起点是群体,具有潜在的并行性,能够同时比较很多个个体;3.它的搜索使用的是评价函数启发,过程简单明了;4.它的迭代过程使用的是概率机制,使得其具有一定的随机性;5.它还具有可扩展性,使用简单,使其应用范围比较广泛,容易与其他算法结合使用。
当然,遗传算法目前还拥有一些缺点:1.首先想要编程实现遗传算法比较的困难,需要对问题进行编码,进而最优解,之后还需对问题进行解码;2.其他三个算子的实现具有如交叉率和变异率等许多参数,同时解的品质也会比较严重的受到这些参数的选择会的影响,并且就现在而言,选择这些参数大部分是依靠经验;3.其并不能及时采用来自网络的信息反馈,因此导致较慢的算法搜索速度,想要得到较为精确的解就得花费较长的训练时间。4.算法本身对于目标的初始种群的选择有一些依赖性,所以可以结合一些启发算法对其实施改进。
因而虽然遗传算法仍有许多问题有待进一步的研究关于其在理论及具体应用方法上面,不过在对于组合优化问题求解、规划设计、机器学习、生物信息学及人工生命等领域的应用中,它仍然拥有其自己的特色和魅力。
遗传算法的历史
生命科学与数学技术的互相影响,互相渗透和互相渗透是现如今科学技术飞速发展的显著特点之一,与此同时遗传算法也进入了蓬勃发展的时期,恰好体现了近代科学发展的趋势和特征。遗传算法(Genetic Algorithm, GA)是一种计算模型,它模拟了达尔文提出的自然淘汰及遗传选择的生物进化过程,它是由美国Michigan大学的霍兰德(J. Holland)教授于20世纪70年代率先提出的。霍兰德(J. Holland)教授代领着他的研究伙伴对遗传算法进行研究,在这之中确定了两个宗旨,选取和说明自然系统所有的自适应过程以及设计一种人工系统使其拥有自然机理。显而易见,霍兰德教授的研究不管是对于自然系统还是对于人工系统都拥有重要的意义。
随之步入到八十年代初,当以利用符号系统进行模仿人类的传统人工智能模式暂时遇到了难题,神经网络和遗传算法等自原来所在的生物系统末端模拟智能的研究中重新焕发生机并进行质的飞跃,在遗传算法的科学研究工作中Goldberg担任着至关重要承上启下的重要角色,其在编写于1983年的博士论文中首次把遗传算法运用于现实的工程系统,即煤气管道优化问题,自此以后,对于遗传算法的理论研究更为丰富,应用研究也更为广泛同时也进一步的完善了遗传算法,自1985年后,就“遗传算法及其应用”这个主题每两年举办一次国际会议,相关人工智能的会议和杂志报刊上均有开设遗传算法的专题,Goldberg的课本,及其他学者的专著的出版也对遗传算法的传播起到了不可磨灭的作用。直到步入九十年代,以复杂问题为对象,以不确定性、非线性、时间不可逆为内涵的科学新范式在学术界得到了普遍的认同,例如广义进化综合理论等。因为遗传算法属于NPC类型的组合优化问题和非线性多模型、多目标函数优化问题等问题具有有效的操作能力,这些能力使得其被诸多学科所重视,绝大部分学者也认识到想要得到复杂问题的最优解是不够现实的,因而能得出满意解的遗传算法成为了他们的最佳工具之一,生物进化史相较于任何数学证明都更加的强而有力,同样的遗传算法在吸收应用遗传学、进化论和分子生物学研究成果后,通过各种实验得到证明且证伪的同时,其自身也在飞速发展之中[2]。
因而可以说自八十年代以来,在科学领域,对遗传算法的研究及其应用步入了新的高潮。就现在而言,它已被广泛的应用于机器学习、自动控制、模式识别、经济预测等其他领域。由此可见对遗传算法的研究与应用现如今己变为国际学术界重点关注的许多热点之一[3]。
Matlab是一种高效率高级语言,它的面向对象是科学与工程计算,Matlab遗传算法工具箱能够提供一个完整的解决方案对于各种优化问题[4]。
原文链接:http://www.jxszl.com/jsj/jsjkxyjs/43929.html