高中遗传学概率计算方法范例(3篇)

来源:

高中遗传学概率计算方法范文

关键词:遗传;仿真;算法;计算;模式识别

1遗传算法原理

交叉:根据上面给出的Pr(hi),从P中按概率选择r・p/2对假设。对于每一对假设应用交叉算子产生两个后代。把所有的后代加入PS。变异:使用均匀的概率从PS中选择m百分比的成员。对于选出的每个成员,在它的表示中随机选择一个位取反。更新:PPS。评估:对于P中的每一个h计算Fitness(h)

(4)从P中返回适应度最高的假设。算法每次迭代里,基于当前群体产生新一代假设。从当前的群体中选择一定数量的假设包含在下一代中。

2遗传算法的特点

2.1优势

⑴对可行解表示的广泛。遗传算法的处理对象不是参数本身,而是针对那些通过参数集进行编码得到的基因个体。这一特点使得遗传算法具有广泛的应用领域。⑵许多传统的搜索方法都是单点搜索,遗传算法采用的是同时处理群体中多个个体的方法,使遗传算法具有较好的全局搜索效率,也使得遗传算法本身易于并行化。⑶不需要辅助信息。仅用适应度函数的数值来评估基因个体。⑷内在启发式随机搜索特性。

2.2不足

⑴编码不规范及编码存在表示的不准确性。⑵单一的遗产算法编码不能全面地将优化问题的约束表示出来,计算时间增加。⑶遗传算法通常的效率比其他传统方法低。⑷遗传算法容易出现过早收敛。⑸遗传算法对算法精度、可行度、计算复杂度,还没有有效定量分析方法。

所以综上,对于遗传算法,应该充分认识到其优缺点,确定应用场合和环境,结合硬件条件、时间特性、计算规模,充分发挥其优势,尽可能压缩其缺点。

3遗传算法改进

为提高遗传算法的运算速度、改善其性能,在并行机或局域网环境下开发出了一些并行遗传算法,大体可分为标准并行方法(standardparallelapproach)和分解型并行方法(decompositionparallelapproach)。前者利用共享存贮器结构的并行机,可对群体的进化过程进行并行计算以达到提高遗传算法运行速度的目的。后者从全局的角度开发群体进化的并行性,改变了简单遗传算法的基本特点,各子群体独立地进行进化。

4极值应用与仿真

遗传算法可以较好的达到局部最优,用来求解局部的极大或者极小值。所以这里极值问题为f(x)=x+9*sin(4x)+8*cos(3x)的最大值,其中4

群体M小时可以提高遗传算法的运行速度,但是降低了群体的多样性有可能引起算法的早熟现象,当M大时使得运行效率降低。交叉操作是产生新个体的主要方法一般应取值较大,但太大会破坏群体的优良模型,对进化产生不利影响。取值太小产生新个体速度又较慢。变异概率较大时虽能产生比较多的新个体,但有可能破坏掉较好的模型使得遗传算法的性能近似于随机搜索算法性能,Pm太小变异操作产生新个体和抑制早熟的能力较差,最佳范围

遗传代数增加,变异概率增加,全局最忧解收敛性最优,计算出来最优解17.34。

[参考文献]

高中遗传学概率计算方法范文

Abstract:Testpapercompositionalgorithminsystemofautomatictestpaperconstructioncanaffecttheefficiencyandthequalityoftestpapercomposition.Inthispaper,avarietyofcommonlyusedtestpapercompositionalgorithmwasanalyzed,andtheimprovedadaptivegeneticalgorithmusedtosolveissuesoftestpapercompositionwasproposed,soastoimproveitsefficiency.Theimplementationprocessofstrategiesforautomatictestpapercompositionbasedongeneticalgorithmwasdiscussedindetail.

关键词:自动组卷;组卷算法;遗传算法

Keywords:automatictestpapercomposition;testpapercompositionalgorithm;geneticalgorithm

中图分类号:TP39文献标识码:A文章编号:1006-4311(2012)20-0223-02

0引言

自动组卷就是利用计算机在试题库中按照用户要求抽取相应的试题组成试卷。而如何保证计算机生成的试卷能最大程度的满足用户的不同需要,并具有随机性、科学性、合理性,这是实现中的一个难题[1]。目前存在一些组卷系统,但由于课程科目繁多,即使同一门课程,各类学校、各种专业课程目标不同,也使组卷系统的应用很难推广普及。

1自动组卷算法

组卷系统中决定试卷质量的关键是抽题算法,目前出现的自动组卷系统中所采用的抽题算法大致分为三种,即随机算法、回溯试探法和遗传算法。

基于随机法的自动组卷利用系统提供的随机函数,在试题库中抽取符合要求的试题组成试卷。这种方法实现简单,并已经有很多实际应用。[2]随机法组卷过程中,容易出现由于某个要求未满足,如预计考试时间超过给定时间,而会使整个组卷过程失败的情况,这样导致很多无效试卷,降低了组卷效率。

回溯法是在随机抽取试题的过程中,验证所选试题是否满足给定条件从而决定是否抽出该试题,当无满足条件的试题而组卷又未完成时,采用回溯试探废弃前一段时间所做的操作重新进行组卷,由于仅是部分操作废弃,降低了无效组卷次数。[3]回溯法虽然组卷成功率比较高,但它是以大量的时间作为代价的。

遗传算法是一种新型的、模拟自然界生物进化过程的随机搜索、优化方法。它采用简单的编码技术来表示各种复杂的结构,并通过对一组编码表示进行简单的遗传操作和优胜劣汰的自然选择来指导学习和确定搜索的方向。遗传算法采用一种群体型操作,该操作以群体中的所有个体为对象,选择、交叉和变异是遗传算法的3个主要操作算子,它们构成了所谓的遗传操作[4]。遗传算法的操作步骤如下:①生成初始群体;②计算群体中个体适应度值;③对群体中个体进行遗传操作(即选择、交叉和变异);④如果满足停止搜索条件,叠代停止,输出问题的最优解;否则,转向步骤③。

由于组卷问题是一个典型的多重约束目标问题,而约束目标的多样性,造成采用传统的搜索算法往往存在成功率低、组卷时间长,缺乏专家知识的启发性搜索等缺点。遗传算法具有的全局寻优、智能搜索技术和收敛速度快等特性正好满足自动组卷的需要。但基本的遗传算法会产生早期的盲目搜索、过早收敛、收敛于局部最优解、局部搜索能力不强等弊端,目前已有研究人员将改进的遗传算法应用到组卷中,文献[5]提出稳态策略的单亲遗传算法,使整个种群保持在最有可能获得成功的状态,加快了算法向全局最优值的逼近速度。本文结合遗传算法理论,将编码方法、遗传算子进行改进后的遗传算法用于试题组卷中,得以在组卷问题上获得良好的解。

2基于改进的遗传算法的组卷算法设计

2.1改进的遗传算法遗传算法应用时的关键问题在于串的编码方法、适应度函数的确定、遗传算法自身参数设定,不同的编码方案、选择策略和遗传算子相结合,构成了不同的遗传方法。

2.1.1改进选择算子改善选择算子操作的目的是为了避免有效基因的缺失,提高遗传算法的全局收敛性和搜索效率。本文将最优法和轮赌法相结合,采用最优保存策略进行优胜劣汰操作,轮赌法确保全局搜索。

2.1.2改进交叉算子Pc和变异算子Pm交叉算子主要作用是产生新个体,实现算法的全局搜索能力,变异算子主要起维持种群多样性、抑制早熟的作用。本文中,采用如下的改进自适应遗传算法[6]:

交叉概率计算公式:

mtmp=pcmax×e■

Pc=mtmpmtmp>pcminpcminmtmp?燮pcmin

高中遗传学概率计算方法范文篇3

关键词:网络考试系统;改进型遗传算法;组卷系统

中图分类号:TP311文献标识码:A文章编号:1672-7800(2013)005-0051-03

0、引言

现代网络技术的迅猛发展推动了网上考试系统的改革,以往人工出卷的方式已经逐渐被淘汰,使用电子技术来组卷的模式日益成熟,成为各大院校广泛使用的方式之一。自主组卷系统充分考虑了试题库的结构问题,避免了传统人工考试中极易出现的知识点堆积、难度失衡、曝光度过大等问题,秉承公平公正的出题原则,使得自动生成的试卷质量过关、难易适宜。遗传算法作为一类传统运算方式,在各个领域均有涉及与应用,为了更好地提高出题速度、保证出题质量,对遗传算法进行改进并将其运用在教育领域具有极强的可行性,通过随机选择合适的题库来得出最优解,使得组卷模块下的每个项目都如序进行。改进型遗传算法保持了传统模式中的优势之处,同时针对组卷工作进行了研究和改进,使最终推出的模式能符合出题要求,完成对组卷系统的设计和实现。

1、试题库结构

整个组卷系统由试题库和组卷算法组成,试题库作为可以实际看到的部分而存在,对其结构的安排也要体现公平性、合理性,帮助组卷算法更快速、流畅地解决问题。网络考试中使用的试题库要置于考试范围之内,让学生有所准备、有所发挥,充分考察考试系统的合理性、可行性。试卷上的每个题目都应该按照出题标准和相应比例进行斟酌和考虑,使其符合相应的属性指标。从题型和知识点上要考虑学科的范围和轻重点,选择难度和区分度合适的类型,使试题的曝光度和内容都能有效地考察学生的学习情况。对于出题时间、答题时间的统计也要科学、合理,让学生在考试过程中形成对学科知识的概况把握,同时能起到复习、巩固知识内容的作用。试题库对曝光度、难度系统、试题类型的挑选无疑使得数据库更加完整,减少了出题教师不必要的操作工作,同时便于将试题库结构调整至最佳状态。如表1所示为试题库结构。

2、遗传算法

美国大学首次提出遗传算法的计算模型,在达尔文生物进化论和遗传学机理的前提下进行非数值计算,使得成本投入最少、回收结果最佳。这种优化方法在不同领域的广泛应用促进了其改进,成为教育领域经常使用的算法之一。遗传算法的应用原理主要是利用问题的解来代替字符串的位置,实际上字符串代表着不同的人工染色体,以个体的形式存在而逐渐形成群体。群体的产生归因于不断的进化和演变,遵循“优胜劣汰”的自然原则,而群体中的个体也会沿着这个机制而发生质的变化,最后得到的仍然是问题的最佳答案。子代个体的产生是通过遗传算子来实现的,个体发挥实际带头作用。人们会使用适应度函数来处理对个体优劣的判断问题,这种评价函数综合考虑了个体适应环境及生存的能力,使得统计记录有据可依。遗传算法在多个领域的应用使其形成了一条极其优化的道路,并不会局限于任何固定模式或空间,而是在问题出现时做出最快速、合适的调整和套用,使计算变得简单便捷。

2.1问题编码方式和适应度函数描述

求解的第一步是确定问题的编码方式,使问题的解和字符串相通。二进制编码在遗传算法中广泛应用,二进制位串仍然表示问题的解,而通过遗传算子的方式使得整个算法的操作更加简单、流畅,但是针对解码工作的方式仍然比较困难和繁重,使得约束条件难以满足,最终获得解的精度普遍降低,花费时间也急剧增长。现阶段针对二进制编码算法的理论众多,为实际应用提供了有效的指导和借鉴。自然数编码、实数编码都是遗传算法中较为常见的编码方式,为不同问题的解决提供了选择。实数编码中的实数值都是染色体的基因或基因所带的编码方式,所以不存在解码问题,极易满足约束条件,唯一的不足之处就是针对该项解码方式的理论知识较少,使得其实际应用次数减少,最终使用遗传算子计算的效率较低。自然数编码将染色体的基因变成不同事物的序号,采取最优化方案来求解,计算速度快、作用强。对适应度函数f(x)的定义包括多方面,首先要满足所有个体适应度的正值,通过数值即可判断个体的优劣程度和生存能力。本文所采取的算法利用目标值与全部约束条件之间的误差值来确定f(x),适应度函数f(x)和个体的适应能力值完全成反比,当数值不断增加时个体基因的生存能力就会越来越强。

2.2形成初始群体

对个体的选择具有很大的随机性,当满足一定数量时即可形成初始群体,N个个体中用N代表整个群体的规模,在使用遗传算法时经常要使用到这个数值,直接影响到计算速度。选择初始群体时N值过小,会使下一步获得的染色体数量减少,直接导致搜索效率下降,最终得到的答案也只是局部的最优化形式,难以代表整体最优解。而针对N值过大的问题也存在缺点,对于适应度值的算法容量不变,并不断提高计算量,而过多的计算会降低整体计算效率。

2.3完成个体评价

适应度值,(z)能准确地判断个体的适应能力,所以要完成个体评价势必要先科学计算出个体的适应度。当f(x)偏大时,说明个体适应环境的能力较差,继而减弱了繁殖后代的能力;当f(x)偏小时,则说明个体适应和繁殖能力更强。因此,可通过f(x)来判断个体状况。

2.4停机条件裁定

对于停机条件的裁定要根据个体的评价来完成,当群体中已经出现最优个体,或原先设定的停机条件已经完全满足时即可马上执行停机命令,如果不满足上述条件则需要通过下一步流程来执行。

2.5选择

依据不同的选择策略来决定群体中的个体去向,被选中的个体会在池内进行下一代的繁殖,按照遗传算子来产生新一代群体。适应度值会决定个体选中机会的大小,f(x)越大则被选中的机会越小。使用频率最高的选择策略包括确定性选择和赌轮选择两种。

2.6繁殖

发挥遗传算子的作用会使得池产生一群新个体,继而形成下一代群体。纵观传统遗传算法的操作流程,繁殖是通过交换算子的作用来完成的。遍历性并不是附着在每个交换算子的搜索工作中,就算单独使用也不具备全程的收敛性。通过变异算子来重现生物进化的全过程,即可判断基因突变的原因和问题,多样性会随之得以保存,这就决定着突变算子同时具有收敛性和遍历性。

遗传算法经过以上6个步骤即可完成最基本的优化活动,通过对个体的优劣评价、适应度选择、繁殖来选取最优秀的下一代个体,循环往复地遗传和搜索会最终得到问题的最佳解。

3、遗传算法改进

传统遗传算法在收敛性、遍历性上有所欠缺,所以采用分组自然策略来避免欠缺点的出现,保证各种性质的稳定性。每个编码代表着一类题型,在分组自然数策略的帮助下进行数据编码。对题型的选择和染色体一样,试题等同于染色体,所以最终获得的试题编号就代表着这个染色体的编码。根据所需可以对染色体进行各种处理,如变长编码的行为即是为了合并试题集,但是每个试题之间仍然保持独立自主的关系,不同的试题组也不会彼此影响,如图1所示为两张试卷的染色体编码。

迭代次数的减少会带来收敛性增加的结果,对题量的要求不同会直接导致题型的选择或改变,试题分库会提供最适合下一代繁殖的初始种群。随机抽取的方式能满足基本的知识约束性,在属性条件不变的基础上选择题型和题量无疑让算法的运行更加简易,针对染色体的运算效率也会随之提高。二进制编码占取了大量的搜索空间,而自然数编码不存在占据空间的问题,能直接减小编码的长度,在小空间内寻找最好的对象,进一步缩短了解码时间,帮助在最短速度内获得所需问题的解。

图2为染色体交叉操作过程,随机选取两个不存在必然联系的双亲染色体,通过遗传算法得出两者之间发生交叉的概率,用O或1来表示随机数,对交叉操作结果的判断也需要拿捏交叉概率和随机数两个标准。一旦出现随机数小于交叉概率的情况,则放弃交叉操作,如果随机数大于交叉概率,交叉操作就会如序进行。对交叉点的选择也是随机的,确定交叉点后操作交叉运算,使最终获得的新个体满足各项条件。关于试卷染色体的交叉操作和种群一样,只是分别代表填空、判断、概念、计算等题型,帮助调配出最佳组合。

概率系数b值的大小需要在变异操作中确定,平均适应值和最佳适应值相减所得值即为概率系数,得出b值后就可确定变异概率Pm。变异概率Pm会和随机数形成一个硬性比较,当变异概率大于随机数时则进行变异反应,对变异点和流程的确定都是随性的,当变异概率小于随机数时则放弃进行变异反应。概率系数b并不是一成不变的,当染色体适应度开始变化时,b也会随之上下浮动,初期阶段的染色体适应度会急剧上升,此时概率系数会出现反向减弱,等待进化进入另一稳定阶段后概率系数b会和染色体适应度持平,度过平稳阶段后概率系数b又会发生一个极大的变化,随着数值的增大变异程度也会加剧,帮助种群扩大繁殖空间,增加全局搜索的度,同时提高个体繁殖的多样性。

4、组卷系统设计与实现

如图3所示为系统功能模块。本系统使用了高内聚、低耦合的设计标准,使得组卷系统可细分成三类。

对主窗体的设计可以使用多文档界面技术,使得第一模块就有试卷设置管理、多维细目表管理、已有试卷查询等部分,而每个模块下面都会继续细分成两三个部分。应用程序会为系统提供很好的索引,使其和WM_COM-MAND形成良好的互动,如果有回馈消息则表示模块通过,即可进行下一子菜单的选择和使用。主窗体为多维细目表管理提供了有效途径,系统也会呈现出管理或设置试卷的属性。系统通过试卷设置管理检查后就可进入下一菜单,选择录入试卷设置、修改试卷设置或删除试卷设置,而3个选项下面会涉及试卷难度、题型、内容3个方面。当选择了细目表数据或试卷生成界面时会出现图4所示情况。

组卷操作会直接影响到试卷质量的好坏或学生考试的难度,所以当启动程序后要从遗传算法组卷和细目表组卷中选择一项。如果选择了遗传算法模式,就会生成图5所示的界面,里面涉及的题型、题量、难度等问题都是平衡均匀的,界面下面会有标准生成的答案,通过点击保存或生成Word试卷来完成工作。

你会喜欢下面的文章?

    年级写人的作文范例(整理5篇)

    - 阅0

    年级写人的作文篇1我最熟悉的人当然是我的弟弟啦,我的弟弟是个瓜子脸,乌黑的眉毛下有一双水汪汪的大眼睛。他还有一张会说的嘴,如果你和他斗嘴,他肯定斗得你无话可说。我弟弟特.....

    党员酒驾检讨书范例(精选3篇)

    - 阅0

    2020年党员酒驾检讨书范例篇1尊敬的交警同志:关于我酒后驾驶的行为,几天来,我认真反思,深刻自剖,为自己的行为感到了深深地愧疚和不安,在此,我谨向各位做出深刻检讨,并将我几天来的.....

    中医内科主治相关专业知识范例(3篇

    - 阅0

    中医内科主治相关专业知识范文高职院校医卫类专业的主要培养对象是基层医卫类人才,其特殊的生源结构、人才培养目标、培养模式使得其思想政治教育有着自身的特点和规律,所开.....

    艺术品营销策划方案范例(3篇)

    - 阅0

    艺术品营销策划方案范文【关键词】人才培养艺术管理产业化目前,文化产业在我国方兴未艾,文化产业的发展已列入国家发展的战略规划,成为我国21世纪最重要产业之一。而艺术产业.....

    海外市场调研研究范例(3篇)

    阅:0

    海外市场调研研究范文篇1【关键词】海绵城市村镇广场雨水景观优化设计【中图分类号】TU2【文献标识码】A以....

    高中遗传学概率计算方法范例(3篇)

    阅:0

    高中遗传学概率计算方法范文关键词:遗传;仿真;算法;计算;模式识别1遗传算法原理交叉:根据上面给出的Pr(hi),从P中按概....

    中医内科主治相关专业知识范例(3篇)

    阅:0

    中医内科主治相关专业知识范文高职院校医卫类专业的主要培养对象是基层医卫类人才,其特殊的生源结构、人才培....