数学建模和数据分析(6篇)

来源:其他

数学建模和数据分析篇1

【关键词】共享数据时代;数据挖掘;应用统计

【中图分类号】C81【文献标识码】A【文章编号】1004-5937(2016)22-0024-02

第八届国际数据挖掘与应用统计研究会年会于2016年7月23―26日在油城大庆隆重召开。本届会议由国际数据挖掘与应用统计研究会主办,东北石油大学、厦门大学数据挖掘研究中心、台北医学大学大数据研究中心、重庆允升科技大数据研究中心和重庆誉锋宸数据信息技术有限公司联合承办。会议主题为“卓越数据共享统计的理论及应用研究”。来自国内外近百所高校、政府和企事业单位的200多位专家学者参会。

会议开幕式由东北石油大学数学与统计学院院长王玉学教授主持。东北石油大学副校长吕延防教授介绍了大庆市貌、学校环境和铁人精神等,对本次会议的作用和意义进行了高度评价。教育部统计学类专业教学指导委员会主任、厦门大学曾五一教授从统计学科如何适应大数据时代的发展角度,对会议的召开提出了进一步的期望。台北医学大学谢邦昌教授结合大庆石油,畅谈了大数据的应用前景。厦门大学朱建平教授从学会的起源到现状,对学会未来的发展前景作了展望。

本届大会除特邀报告外,入选论文52篇。按照论文所涉及的理论领域和方法应用,将入选论文分为数据挖掘与大数据应用、统计理论、统计方法应用及实证分析等专题进行了分组交流讨论。主要学术观点综述如下:

一、数据挖掘与大数据研究现状及未来趋势研究

谢邦昌教授在《大数据发展现况与未来发展趋势》中首先阐述了何谓BIGDATA。当你连上脸书按赞打卡、上传照片到网络相簿与朋友分享、上班收发e-mail、用悠游卡买杯咖啡、通过ATM领钱、走进大卖场刷卡购物甚至是进家门开灯,都正在源源不断地创造“海量数据”。这正是云端时代的新金脉。其次是BIGDATA的理论及其应用。最重要的是如何对大数据进行分析,其基本方面如下:(1)数据可视化分析。决策者需要的不是数据本身及分析后的数值,而是庞大数据经分析之后的结果、趋势或现象,利用可视化效果易于被接受。(2)DataMining算法。这是大数据分析的理论核心,而深入挖掘和快速处理是两大重要课题。(3)预测性分析。如何找出特性、科学建模、预测未来。(4)语义引擎。非结构化数据的多元化给数据分析带来新的挑战,要提高语义引擎设计的智能化水平。(5)数据质量和数据管理。高质量的数据和有效的数据管理可保证分析结果的真实和有价值。最后,真正制约或者成为大数据发展和应用的三个瓶颈:数据收集的合法性、产业链各个环节企业的均衡、大数据有效解读。

国家统计局潘[博士在《我看当前对大数据的一些非议――兼议大数据应用面临的问题》中指出近几年中国的大数据应用取得了一定的进展,但面临的诸多障碍依然存在,且不断出现一些对大数据的非议之声。这些非议有的有一定道理,有的则失之偏颇。潘[博士针对这些非议指出大数据是科学技术及社会生产力发展到特定阶段的必然。尽管其发展进程中确实出现了失密、造假等严重问题,但这正说明必须正视大数据的扑面而来,并尽快制定各种应对措施,抓住机遇,保存价值,着力解决出现的各种问题。最后,提出完善法律法规、明确牵头单位、统筹各部门和规范标准等措施。

重庆工商大学李勇在《网络舆情数据挖掘方法及其在意识形态传播新特点中的应用研究》中系统研究了当前网络舆情数据挖掘的主要方法,并将这些方法应用于网上意识形态传播新特点的研究中。对互联网出现前后意识形态传播呈现的不同特点进行了对比分析,提炼出意识形态传播在当前DT时代的本质特征,结合主流意识形态提出相应的有效传播方式和防范措施。

东北石油大学辛华博士在《基于密度分布的聚类算法研究》中通过密度聚类方法DBSCAN二次聚类提高了聚类精度。湖北经济学院陈战波、陶前功、黄小舟和王磊的《基于阿里云音乐平台大数据的歌手流行趋势预测及推荐研究》,山西财经大学舒居安、赵丽琴、刘逸萌的《基于网络舆情的居民购买力倾向指数构造研究》和重庆工商大学李禹锋的《基于网络团购的重庆火锅消费行为分析》等进行了大数据的应用研究。光环国际杨恩博的《大数据人才发展与培养》、广州泰迪智能科技赵云龙的《大数据形势下数据科学人才培养初探》和刘彬的《大数据双创实践探索与服务体系》,从业界不同角度探索了大数据人才培养。

二、统计基本理论及应用研究

台湾淡江大学蔡宗儒教授在《AcceleratedDegradationTests》中,回顾了可靠度分析近期的发展,指出随着制造技术的进步,产品可靠度大幅提升,进而提升了对产品可靠度分析的难度。而传统设限方法和近代加速寿命测试法具有一定局限性,通过研究加速退化测试方法,指出如何针对加速退化数据进行统计推断、评价其可靠度,如何在成本的考察下对加速退化测试实验进行设计,以利后续的测试实验参考。

北京大学房祥忠教授在《EM算法及其在置信推断中的作用》中指出医学或产品试验费用昂贵等小样本情况,其精确置信推断尤为重要;Buehler置信限在多维参数或删失数据时,难以计算,并将EM算法用于求精确置信限,给出了可靠性领域中的实证。

重庆工商大学李勇在《灰色统计基本理论及其应用》中系统研究了灰数的统计学基本理论和方法。他从随机样本产生灰色估计量和直接从灰色数据开始,构建了一套从数理统计逐步过渡到主要以灰色系统为研究对象的灰色统计方法,如灰数的区间估计、灰数的假设检验、灰数的相关分析和回归分析等,并进行了实例分析。

哈尔滨工业大学张孟琦、田波平在《空间模型参数拟极大似然估计量的渐近性和实证》中提出了双权重矩阵空间回归模型参数的极大似然估计量,包括对数似然函数、集中似然函数和参数估计;证明了相合性和渐进分布性质,并实例进行了空间自相关检验和空间计量模型分析。

天津财经大学杨贵军、于洋、孟杰的《基于AIC的粗糙集择优方法》和杨贵军、孙玲莉、董世杰的《三种线性回归多重插补法的模拟研究对比分析》分别从粗糙集择优和回归插补进行了研究。云南财经大学张敏博士在《基于高层次结构的多水平发展模型的统计建模及应用》中研究了拟合高层次嵌套数据的多水平发展建模问题。集美大学纪的《模糊数据Jonckheere-Terpstra检验法及应用》探讨了模糊数据检验。广东财经大学的刘照德、林海明在《因子分析五个争议的解答》中定量分析了因子分析的争议问题。湖南大学周四军、王佳星、罗丹在《基于门限面板模型的我国能源利用效率研究》中,基于柯布―道格拉斯生产函数理论构建了我国能源利用效率门限面板模型,并进行了实证分析。

三、统计方法及实证研究

天津财经大学杨贵军、孟杰、邹文慧在《基于模型平均的中国总和生育率估计》中指出目前国内学者对中国总和生育率的估计尚未形成一致性的结论,缺少高质量的数据源以及不完善的估计方法是影响总和生育率估计的主要问题;提出使用社会和经济等“人口系统”外部数据,引入当前统计学和计量经济学前沿的模型平均方法对中国总和生育率进行估计。

华侨大学项后军和浙江财经大学何康在《自贸区的影响与资本流动――以上海为例的“自然实验”估计》中,从自然实验角度考察了样本期内上海自贸区的设立对上海地区资本流动的影响。得出:基于双重差分模型估计的自贸区对上海资本流动的影响显著;基于改进后合成控制法得到的“合成上海”对上海设立自贸区之前的模拟程度更高;基于安慰剂检验,证实了自贸区政策的有效性。

湖南大学晏艳阳、邓嘉宜、文丹艳在《邻里效应与居民政治信任――基于中国家庭追踪调查(CFPS)的证据》中,指出近年来居民对政府的信任危机频发,矛盾不断出现,严重制约着政府的行政效率;基于中国家庭追踪调查(CFPS)截面数据,建立回归模型进行实证分析,证实了其他信息获取渠道与社会互动之间具有相互替代的关系,有效解决了关联效应和反射性问题对邻里效应估计带来的影响。

中国南方电网科学研究院冷媛、傅蔷、陈政和厦门大学范新妍在《基于MCP,GroupMPC的先行、一致、滞后指标筛选》中,提出了基于MCP惩罚法的单一指标先行、一致、滞后性的判定方法和基于GroupMCP的多指标系统下各个指标的先行、一致、滞后性的判定方法。冷媛、傅蔷和厦门大学孙俊歌、梁振杰在《经济景气指数研究比较及思考》中梳理了国内外景气指数的研究状况。辽宁大学马树才、宋琪在《中国人口年龄结构变动对资本投入及经济增长影响研究》中通过构建数理模型,就人口年龄结构对资本投入及经济增长的影响进行研究,得出充足的劳动供给会提高教育人力资本和物质资本的使用效率,促进经济增长,政府公共教育支出增加会提高教育人力资本对经济增长的贡献;并对面板数据进行实证分析。厦门大学刘云霞在《我国高技术产业创新绩效影响因素动态比较研究――基于状态空间和门槛模型相结合的研究》中确定了反映创新绩效的指标以及影响创新绩效的因素,再将状态空间模型和门口模型进行有机结合,找出了各影响因素对创新绩效的动态影响轨迹以及轨迹改变的关键点,并提出对策建议。

数学建模和数据分析篇2

【关键词】计算机控制技术;教学改革;系统建模;数据驱动

0引言

随着计算机技术的飞速发展,计算机控制技术被广泛应用于工业生产、电子通讯、机械设备等各个领域。因此,许多高等院校都开设了《计算机控制技术》这门课程,它是以自动控制原理为基础,以计算机控制技术为核心,综合测控技术、可编程控制技术、计算机网络技术等的综合性学科,致力于培养企业生产技术的精密化、生产设备的信息化、生产过程的自动化的专业人才。计算机控制技术本身的特点决定了可以利用软件来实现控制算法,通过强大的的运算功能和逻辑判断功能来实现最优控制、自适应控制等连续控制系统难以胜任的复杂规律[1]。鉴于《计算机控制技术》课程的重要性,对课程教学的研究、探索和实践是十分必要的。

近年来,随着互联网、物联网、云计算的迅猛发展,由“人、机、物”三元世界在网络空间(Cyberspace)中交互、融合所产生的数据多元化将当今的信息社会推向了“大数据”时代[5],大数据的涌现正逐步改变人们的生活和工作方式、企业的运营模式,IBM公司提出了“智慧地球”的理念,德国提出了步向“工业4.0”的目标,今年总理在政府工作报告上也提出了“互联网+”的概念。同时,大数据也吸引了不少学术界的广泛关注,2008年,英国《自然》杂志推出大数据专列,专门探讨“P8时代的科学”以及科研形态的变化,指出:“数据为准绳的理念指导,以及强大的计算能力支撑,正在驱动一次科学科学方法的革命”。美国《科学》杂志也在2011年推出专刊“DealingwithData”,围绕“数据洪流”展开讨论,将大数据深度分析作为未来研究的重要突破点[2]。所以顺应时代的潮流,将“大数据”的思想融入到《计算机控制技术》的教育改革,既是一项严峻的挑战也是一个宝贵的机遇。

1课程教学中的普遍问题

《计算机控制技术》课程所涉及内容丰富,大体可以分为控制系统和计算机系统两大方向。具体的内容主要包括如下几个方面:①以控制理论为主体,阐明离散系统和连续系统在建模、推理、结论上的区别;②将计算机系统与控制系统进行融合;③传统控制论优化算法及其仿真模拟;④智能算法、模糊识别的应用;⑤微型计算机的嵌入式开发,如ARM、PLC、等;⑥计算机系统的软件开发等[3]。

目前,多数院校对于《计算机控制技术》这么课程,主要采用“以课堂为主,实验为辅”的教学模式,加上该课程是一门专业性和综合性较强的学科,涵盖的内容较多,所以学生在学习过程中普遍感到吃力[4]。此外,课程教材和参考书种类众多,但内容并不统一,基本分为偏重理论教学和实际工程应用两大类。然而,真正能运用到当今主流的大数据、云计算相关技术的并不多。所以,基于上述问题,对目前《计算机控制技术》教学中存在的不足总结如下:

(1)数据的概念不强

目前,许多院校对于《计算机控制技术》这门课程的重心停留在理论授课上,即使开设的实验课程还是以演示性为主,如A/D转换实验。学生没有系统的将所学知识转化为实践,更谈不上对实验数据的信息进行有效的存储,并结合所学习的理论知识对其进行分析和验证。此外,对于当今主流的数据挖掘算法,提供相应的实践机会较少。

(2)传统建模思维的束缚

传统控制理论过于依赖模型的建立,为了保证所建立模型的精确性,模型的阶次有时会变得很高,基于高阶系统模型的控制器设计、稳定性分析等问题就会变得很复杂。事实上,数据只是为了辅助算法,实现对模型进行较好的评估和预测等功能。

(3)数据挖掘算法的普及不深

利用计算机技术对大数据进行挖掘分析,发现蕴含的知识,研究运行的规律和发展的趋势是挖掘网络大数据的深层价值和实现社会行为可计算的主要途径[5]。然而,许多院校在《计算机控制技术》这门课程中,并没有在数据驱动这个方向上进行改革和突破。

值得注意的是,很多院校对《计算机控制技术》教学的思维方式还停留在工业时代,即以控制系统相关学科作为理论基础,再通过科学实验来强化学生在计算机软硬件方面的学习。但是随着信息技术的快速发展,“物联网、云计算、大数据”的提出,迅速取代了人们对于传统行业的认知。所以,有必要借助“大数据”的思维方式来思考《计算机控制技术》的课程改革。

2基于“大数据思维”的《计算机控制技术》课程教学改革

在传统建模仿真研究中,数据不是模型的本体,它只是为模型的仿真运行提供基础条件。然而,随着大数据的迅速发展,由“人、机、物”三元世界的互相交融将数据的来源也变得多元化,通过仪器采集、网络存储、仿真模拟生成等方式来获取数据,所以数据对建模的作用也愈发重要,并开始逐渐成为主导地位。只要数据足够大,只靠数据就可以完成科学发现,因此不再需要数学模型。这就是所谓的“数据优先”模式[2],一种由数据驱动的新模式、新思维。正如《连线》主编ChrisAnderson所断言:“数据的洪流是传统科学方法变得过时,相互关系已经足够,没有了具有一致性的模型、统一的理论和任何机械式的说明,科学也可以进步”。换句话说,传统建模方法对于科学而言并不是必须的,大数据建模方法将会是一种新的科研范式。

2.1将“数据驱动建模方法”作为思考问题的出发点

数据驱动的概念最早来自计算机科学领域,在设计过程中以数据库中的数据为导向,利用受控系统大量的在线、离线数据,实现对系统的评价、诊断、决策、调度及监控等功能[6],探索背后的科学规律。近年来,随着人工智能技术的发展,特别是机器学习领域,迅速丰富了经验建模方法。通过获得系统的各过程变量(输入、输出和中间变量)描述表达式,这种方法称为“数据驱动”建模方法。

基于实际工业生产系统的数学模型复杂、测控信号精度差且不完整、易受随机扰动的影响、状态维数高等特点,传统的建模方法,为了保证模型的精确性,模型的阶次会变得很高,这样研究系统的控制方法和动态特性会变得复杂,而利用“数据驱动”建模方法,将已知的输入、输出数据在线或离线学习计算与当前状态相匹配的控制量,再将模式识别、人工智能方法作为补充,从而满足系统的静态和动态性能要求。目前,利用“数据驱动”的思想建立研究对象的预测和控制模型是主流的趋势,而已经形成系统的建模方法主要有:线性/非线性自回归模型、神经元网络模型、基因算法模型、模糊人工智能模型、贝叶斯分析网络模型以及支持向量机模型等。

2.2基于“数据驱动建模”的教学方法

一般来说,数据驱动建模流程可分为:数据初始化、变量的统计分析、算法模拟和模型的在线校正等过程。

(1)数据初始化

通常,数据的初始化大致可以分为数据的采集、选择、预处理。具体的步骤如下:①通过采集的数据,对数据结构有一定的认识,同时对数据辨识可能产生的问题及建模的复杂程度有所估计,从而决定适宜的训练模型。②对数据模型评估之后,即可以对数据进行选择,一般选取70%的比例作为算法数据,其余的30%数据作为测试数据;③选择好训练数据以及测试数据之后,为了能够获得较好地训练效果,必须对数据进行预处理,使其满足所选辨识方法的要求。例如归一化处理,填补缺失值,异常值检验等。

(2)变量的统计分析

通常,在完成第一步的基础上,需要结合统计理论方法对输入、输出变量进行相关性分析、主元分析等,以研究二者间的关联关系,从而对模型进行预估判断。此外,为了更好地定性分析,需要适当地增加与主导变量有关的辅助变量,通过机理、经验构造辅助变量与主导变量的数学关系,从而更好地对主导变量进行估计。

(3)算法模拟

在经过统计方法的分析之后,利用模糊识别、人工智能算法对训练数据进行回归分析,例如神经网络、支持向量机、贝叶斯网络等工具实现线性或非线性的预测逼近能力。然后再利用测试数据在预测模型上进行测试,得到的输出结果和目标数据进行比对,根据预先制定的统一规则进行评判。通过不断训练学习的办法获取输入、输出之间的函数逼近关系式,得到合适的模型。

(4)模型的在线校正

在线校正是数据驱动建模应用中不可缺少的一部分,尽管已有不少离线校正的方法,但在线校正的方法十分有限。因此,开发更多实用方法,以适应复杂工业过程控制的需要。判断预测模型的某个关键参数是否最优,其本质上就是如何对参数值进行调优,使预测模型的错报率最小化[7]。目前,解决参数寻优问题的研究成果主要有两种:①定期进行非训练样本与固定参数值得的错误率敏感性分析,依据敏感性分析曲线优化关键参数值,如交叉性验证技术、留一交叉验证法等;②根据知识经验或统计分析确定机器学习方法错误率的上界,并不断优化错误率的上界,使边界差距尽可能小,从而实现参数校正目的[8]。

3结语

本文围绕“数据洪流”展开讨论,尝试对《计算机控制技术》进行教学改革,提倡培养“大数据”的思维对系统进行建模。通过调整教学内容,结合各种交互式教学方法,提出了一种基于“数据驱动建模”的教学方法,致力于培养学生的学术理论的融合贯通能力,技术创新思维和动手实践能力。

【参考文献】

[1]李元春.计算机控制系统[M].北京:高等教育出版社,2005.

[2]胡晓峰,贺筱媛,徐旭林.大数据时代对建模仿真的挑战与思考―中国科协第81期新观点新学说学术沙龙综述[J].中国科学:信息科学,2014,44(5):676-692.

[3]邢航,张铁民.“计算机控制技术”教学改革探索与实践[J].实验室研究与探索,2007,26(12):370-371.

[4]周欣欣,宋人杰,牛斗.《计算机控制技术》课程教学改革初探[J].东北电力大学学报,2008,28(3):29-31.

[5]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138.

[6]候忠生,许建新.数据驱动控制理论及方法的回顾与展望[J].自动化学报,2009,35(6):650-667.

数学建模和数据分析篇3

研究生论文2300字(一):“双一流”建设背景下研究生课程设置的优化策略论文

【摘要】课程设置是研究生培养的基础环节,关乎高校人才培养质量。在当前“双一流”建设背景下,研究生课程设置要适时调整,以符合国家和社会经济的发展需要。本文通过分析我国研究生课程设置中存在的问题,提出相应的优化策略,以期进一步完善研究生课程设置结构,促进研究生教育质量的提升。

【关键词】“双一流”建设;课程设置;优化策略

“双一流”建设是党中央、国务院作出的为了促进高等教育战略发展的重大决定,对于提高高等教育发展水平具有非常重要的意义。怎样在“双一流”建设中树立研究生培养目标,稳步提升人才培养质量,已经成为高等教育发展面临的主要问题。如今,人才市场对研究生人才能力的需求发生了较大变化,因此,研究生课程只有不断进行有效创新,才能适应时代的持续变化和社会经济发展。

课程设置是研究生培养的基础环节,对巩固知识、打好理论基础、培养创新思维和实践能力非常重要,也对研究生教育的质量和水平产生直接影响。由此可见,深入分析我国研究生课程设置中存在的问题,优化并完善课程设置,将对提高人才培养质量、建立世界一流大学、培养高水平的创新人才具有重大意义。

一、研究生课程设置中存在的问题

(一)课程设置缺乏规范性合理性

目前,许多高校在设置研究生课程时具有较大的随意性,课程间缺乏层次和逻辑性。研究生课程设置在广度和深度上,应该高于本科教育,为后续博士课程教育打下基础。但实际上,很多高校在其课程的设置上大多是对本科生阶段课程内容的重复,并未达到这一需求。

(二)课程设置重理论轻方法论

研究生不仅要有必备的专业理论知识,还需要养成科研思维,能学习并熟练使用各种研究方法。然而,目前许多高校只重视对研究生的基础理论教育,忽视了科学研究方法论教育,对人文社会科学来说,方法论相关教育十分重要。在课程设置上忽视方法论教育,将会影响人才培养的水平,也将造成毕业论文质量的下降。

(三)必修课与选修课的设置比例不合理

由于硕士研究生实行学分制管理,高校在必修课程、公共课程上设定了很多学分,而专业选修课学分很少。为培养研究生的创新能力和思考能力,除专业基础科目外,也需要开设一定数量的选修课,为研究生提供更广泛的学习领域。

二、研究生课程设置的优化策略

(一)進一步完善课程内容,适当提高实践类课程比重

研究生培养应当坚持理论与实践紧密结合的原则,《教育部关于改进和加强研究生课程建设的意见》指出,研究生课程设置要提高实践课程比重,优化课程设置。高校应根据自身情况适当开设实践类课程,对于应用型学科,应鼓励学生进行实地考察和调研活动。针对理论型学科,可以通过实践活动、案例分析、课堂讨论等方式向学生提出社会前沿理论和热点问题,进而提高学生的创新思维、实践能力。只有当高校积极组织研究生参与到科研实践工作中,才能够促使他们努力成为科研学术前沿探索的开拓者。在当前学分制管理下,可以适当提高实践类课程的学分,使学生重视实践能力的培养。

(二)逐步优化课程结构,丰富教学内容

在新时代,研究生课程设置要适时调整,以符合国家和社会经济的发展需要。在“双一流”建设背景下,高校可以通过科学引进CDIO课程体系,结合自身特色课程资源和人才培养发展要求,合理设计出最佳的研究生课程计划,优化设置课程结构内容。高校教师要有效树立起先进的CDIO理念,强化创新实践科研能力校企合作项目课程与现有课程的互补工作,最终构建出具有综合性特征的研究生创新型人才课程体系。同时,应适当提高选修课的比重。这个比重不仅体现在学分上,还体现在选修课的开设种类和数量上,要给学生们更多的选择空间。

(三)提升学生满意度,完善课程评价机制

高校应重视并构建合理的课程评价体系,通过学生对课程的评价不断完善课程设计方案,提高课程质量。一方面,高校应定期收集学生的评价和反馈信息,在此基础上进行内部评估,评估内容包括教师的教学态度、教学内容、教学方法等各方面的信息。另一方面,可以引入第三者评价机制,委托第三方机构定期评核课程的科学性、适用性和尖端性。创新应用互联网渠道方式,加强与研究生的互动交流,及时获取到研究生的课程学习反馈意见和想法,结合研究生学习的不足和需求,及时优化改进课程标准内容和发展计划。

(四)加强师资队伍建设,规范课程教学设计

以实践能力和科研成果为指导,学校应建立相应的奖惩制度对研究生课程设置进行规范化设计。导师应根据所带研究生的实际情况,因材施教,合理规划课程培养计划,根据每位学生的学习基础和自身情况及时调整课程内容和难度。同时,利用各种先进的手段创新开发设计课程项目,有效创建出“教、学、做”三位一体的情境教学模式,凸显出研究生在教学中的主体位置,发挥他们的主观能动性,使其将所学课程专业知识转化为项目开发设计工作的能力,培养其良好的创新实践能力。此外,还应该建立合理的监督体系,引导教师重视教学环节,重视研究生课程设置,督促教师提高自身教学能力,促进研究生教育质量的提升。

课程设置关乎高校人才培养质量,在提高研究生的学术能力、科研能力、创新能力等方面发挥着重要作用。课程设置是一项复杂的系统工程,需要学生、教师、高校等多方面的共同努力。研究生培养除重视专业基础理论学习外,也应重视方法论的学习,培养学生的实践操作能力;作为指导教师也应该与时俱进,适时改变传统的教学方式,注重师生之间的互动交流和问题反馈;高校应该重视和构建课程评价体系,努力提升学生的课程满意度。

研究生毕业论文范文模板(二):交通数据分析与应用研究生课程教学的思考与探索论文

[摘要]数据分析技术的发展和交通数据产业链的形成对交通数据分析师的培养提出了新需求。基于同济大学交通工程专业硕士研究生课程交通数据分析与应用的教学实践,从课程培养目标、内容设置和实验平台建设等方面对教学实践中的思考和探索进行总结,为交通数据的课程教学和人才培养提供参考。

[关键词]交通数据分析;交通工程;大数据;研究生课程

[作者简介]段征宇(1978—),男,博士,副教授,研究方向:交通运输规划与管理、交通数据分析;余荣杰(1989—),男,博士,副教授,研究方向:交通安全、驾驶行为、交通数据分析;李玮峰(1990—),男,博士,助理研究员,研究方向:交通运输规划与管理、交通数据分析。

[中图分类号]G643[文献标识码]A[文章编号]1674-9324(2022)25-0200-03[收稿日期]2019-10-11

一、学科发展和人才培养需求

我国高等学校交通工程专业旨在培养从事交通规划、设计和运行管理等方面的人才。近年来,在第四次工业革命的背景下,信息技术、能源技术等的快速发展,引起了交通工程领域的巨大变化。信息技术与控制技术的结合推动了车辆的自动化(自动驾驶)、共享化和电动化[1];互联网与共享经济的结合,催生了“出行即服务”(MobilityasaService,MaaS)的新型交通服务模式;新能源技术的发展,推进了电动汽车的应用[2]。在上述背景下,基于多源、海量、异构的连续数据环境,应用新兴数据分析技术支撑更安全、高效的交通系统构建,成为交通工程专业人才培养的新要求。

交通工程学科经历了近70年的发展。其中,微观交通流理论与方法形成于20世纪50年代,主要研究道路路段、交叉口的交通流特征和规律,以及车辆跟驰、换道、排队等行为规律。到了20世纪60年代,随着城市化的发展和大规模交通基础设施建设,形成了以“四阶段法”为代表的网络交通流理论与方法。20世纪70年代,随着交通供需矛盾的日益突出,人们逐渐意识到需要从交通需求管理等交通政策角度来寻找解决交通问题的途径,因此,需要研究个体的交通选择行为,由此形成了交通行为分析方法。从20世纪90年代开始,随着智能交通系统(IntelligentTransportationSystem,ITS)技术的不断发展,通过感应线圈、微波雷达、视频等自动采集设备,以及移动通信数据、公交IC卡数据等位置获取技术,可以对交通系统的运行状态、出行者和交通工具等进行实时、连续和全面(大样本甚至全样本)的观测,这为交通工程研究者提供了一种全新的数据环境。更为完备的数据环境和新的科学研究范式对交通工程学科产生了革命性的影响[3]。

传统交通工程专业主要培养交通规划师、交通设计师和交通模型师三类技术人才。随着交通数据分析和信息服务产业的发展,交通数据分析人才的需求越来越大,交通数据分析师的培养迫在眉睫。交通数据分析师是一种复合型人才,不仅要精通数据分析方法,还需要深入理解交通业务,能运用数据分析方法发现和解决交通问题[3]。

同济大学交通工程专业从2003年开始,通过深圳城市交通仿真系统一期和二期项目、国家自然科学基金重点项目等一系列课题的研究和实践,初步形成了交通大数据分析领域的系统性成果[4,5]。从2010年开始,在交通工程专业的课程体系中增加了交通数据分析课程,形成了覆盖本科生、硕士生和博士生的交通数据分析课程体系。其中,本科课程包括交通调查与分析、交通统计分析、交通数据处理与统计分析课程设计;硕士研究生课程包括交通数据分析与应用;博士生課程包括城市与交通数据及信息分析方法。

二、课程目的和能力培养

面向交通数据分析师的培养需求,一方面,在本科相关课程的基础上,硕士阶段的课程要求学生掌握高阶数据分析方法,为研究工作的开展提供基础;另一方面,需要培养学生数据分析方法的应用能力,切实解决实际交通问题。因此,硕士研究生课程交通数据分析与应用的目的是重点培养学生的以下五大能力。

1.利用常规数理统计模型处理交通数据的能力。在本科阶段的课程中,已经讲授了描述性统计、线性回归模型、计数模型、离散选择模型等常规数理统计模型以及相关统计分析软件的使用;在硕士研究生阶段,重点培养学生综合运用这些数理统计模型处理实际交通数据的能力。

2.理解和掌握高阶数理统计模型的能力。在本科阶段的课程基础上,围绕数理统计分析方法(时间序列分析模型、空间相关性分析模型和多层数据分析模型等)和机器学习分析方法(决策树模型、神经网络模型、深度学习模型等)的基础理论及在分析交通数据中的适用性,使学生能够理解和掌握这些高阶数理统计模型的基本原理和建模过程。

3.多源、异构、大规模交通数据的处理能力。在交通工程的研究和应用过程中,面对的交通数据通常是来自不同的数据源或传感器,具有不同的数据结构或数据格式,并且具有较大的数据规模,因此,需要培养学生理解多源、异构交通数据的能力,能够识别和修复数据质量问题,并处理为表征交通状态和交通行为的特征信息,使学生了解常用的数据库软件、并行计算平台,并能通过编程工具处理较大规模的交通数据。

4.数据挖掘模型、深度学习模型的应用能力。在讲授高阶数理统计模型的基础上,通过道路交通运行状态分析、公交运行状态分析、公交客流需求分析、交通需求分析、交通安全管理和驾驶行为分析等专题,培养学生应用数据挖掘模型、深度学习模型等高阶数理统计模型的能力。

5.基于数据分析结果,分析和解决交通问题的能力。对于交通工程专业的学生,除了需要掌握交通数据处理、建模和应用,还需要能够理解数据分析结果所反映的交通问题,建立交通数据与传统交通流模型、交通行为模型和交通规划模型之间的关系,运用交通设计、管理和规划方法,提出解决实际交通问题的思路和方案。

三、課程内容设置

硕士研究生课程交通数据分析与应用采用理论与实践相结合的教学模式,强调课堂讲授和数据分析实践并重,通过实践深入理解和掌握数据分析方法。

在课程内容上,衔接本科阶段的通识课程概率论与数理统计和专业基础课程交通调查与分析、交通统计分析。课程教学内容分为数据分析方法、数据应用专题两大板块。

1.数据分析方法板块。讲授数理统计分析方法,包括多元线性回归模型、计数数据模型、离散选择模型、时间序列分析模型、多层数理统计模型;机器学习分析方法,包括决策树模型、神经网络模型、深度学习模型等。

2.数据应用专题板块。结合实际交通数据和交通应用,讲授交通数据质量控制方法、道路交通运行状态分析、公交运行状态分析、公交客流需求分析、基于多源数据的交通需求分析、交通安全管理数据分析和驾驶行为分析等应用专题。

课程作业采用实际交通数据集,包括感应线圈数据、浮动车车速数据、公交IC卡数据、公交GPS数据和车辆牌照识别数据等。

课程作业分为应用型作业和综合型大作业。应用型作业主要是运用所学的某一类数据分析方法或模型,利用实际交通数据进行分析和建模。目前的应用型作业包括基础数理统计模型、数据挖掘模型、交通数据质量控制和道路交通运行状态分析等。由于班级人数近70人,未来考虑采用分组方式设置综合型大作业,培养学生综合运用数据分析方法解决实际交通问题的能力。

在考核形式上,作业成绩和期末考试成绩各占50%的权重,强调通过平时作业实践掌握数据分析方法、理解和解决实际交通问题的能力。

四、实验平台建设

为更好地支撑数据分析课程的教学与实践,同济大学交通运输工程学院的交通数据科学研究中心正在建设交通大数据教学实验平台。平台从功能认知、基础数据和模型算法三方面支撑交通数据分析与应用课程。

1.功能认知。这部分内容穿插在课堂教学的数据应用专题板块,通过城市级的交通大数据分析功能和可视化,给学生更为直观和具体的认知,了解目前城市交通大数据应用现状,激发学生的学习兴趣。比如,交通拥堵指数、等时线分析、公交客流需求分析、公交可达性分析、公交线路优化决策支持等。

2.基础数据。通过教学实验平台,为学生作业提供基础数据集。数据集包括两大类,一是原始数据,也就是来自于传感器或ITS系统的数据,比如,线圈检测器数据、出租车GPS数据、公交IC卡数据等;二是指标数据,即从原始数据中提炼的交通特征信息或分析指标数据,比如,交通指数数据、道路车速数据、公交OD数据等。

3.模型算法。教学实验平台对常用的交通数据分析算法和模型进行了封装,在此基础上提供了二次开发的功能。学生可以根据研究的需要,编写Python程序嵌入到平台的分析模块,对原有算法或模型进行改进。比如,交通拥堵识别算法、公交乘客换乘识别算法等。

数学建模和数据分析篇4

关键词:历史建筑;保护;建筑信息模型

中图分类号:TU201.4

文献标识码:A

文章编号:1008-0422(2013)10-0090-02

1我国历史建筑保护发展与现状

改革开放以来中国的社会经济迅猛发展各类建设活动高潮迭起,城市化和现代化进程飞速推进。历史建筑作为一种文化旅游资源的载体越来越被广泛的发掘。对于城市、地区及国家而言,它也日益成为一个经济来源。在经历了20世纪90年代的复古、仿古风之后,开始逐渐发展到对历史建筑进行维修和保护。保护历史建筑使得城市的优秀历史和文化在弘扬社会文明、丰富城市内涵中发挥独特作用。保护城市历史建筑对继承和发扬优秀文化传统,研究国家和民族地域性特征,研究政治、社会、经济、思想、文化、艺术、工程技术等方面的发展史,均有重要意义。然而,出于交通、居住、商业等多方面的需求必将引发大规模的土地开发和城市建设活动,引发城市建设和文化遗产保护之间的矛盾,这给历史建筑保护工作带来巨大的挑战。城市化进程中,随着城市向大型化、现代化、经济化方向发展,历史文化遗产赖以生存的环境正日益遭到侵蚀。如何处理好保护与发展的关系,既是学术界要研究的重大课题,也是各级政府要解决的现实问题。

从历史建筑保护工程的研究领域来看,发达国家由于对于历史建筑的保护工作开展的较早。国内历史建筑保护工作起步到建立相对来说比较晚,遗产保护概念、立法、现代保护理论技术、保护专业等从无到有并逐步深入成熟,尤其是改革开放三十多年来,随着世界遗产保护事业的进行,我国建筑遗产保护取得巨大进步。1930年产生了中国关于古建筑保护的最初的法律《古物保存法》。1980年专门了《关于加强历史文物保护工作的通知》,并批转了国家文物事业管理局、国家基本建设委员会《关于加强古建筑和文物古迹保护管理的报告》。我国历史建筑的保护工作正在逐步开展,同时很多历史城市与建筑保护工程都有评估工作做为先导。

然而,目前各地的历史建筑保护工作的信息,大多数仍停留在纸质文档,或者是单个计算机的电子文档,这些电子文档没有形成统一的规范的数据库。个别地方开展了基于计算机技术的历史建筑的虚拟复原,如西安的大明宫复原工程,也需要形成统一的规范的数据库,实现资源共享,开展更深入的研究。各地的建筑规划设计施工部门已经开始采用建筑信息模型,这些建筑信息模型多是针对一个建筑的具体操作。一些单位如大型设计院已经将本单位的建筑信息模型在内部联网,但是这种联网还没有形成统一的规范的数据库或数据仓库,无法在统一的指标体系下在海量信息中自动搜集到相关的信息。

历史建筑价值包括历史价值、科学价值、经济价值、使用价值、环境价值、保护价值,需要科学的评估;历史建筑保护的先进技术包括虚拟复原技术需要进行大量的数据处理;历史建筑保护的材料选购、价格计算,也需要数据分析;历史建筑的分类、寿命分析预测,也需要运用数学模型。这些分析工作需要强大的分析工具,因此历史建筑保护工作急需与信息技术紧密结合。

2建筑信息模型技术的概况与应用

与其它专业相比,建筑学专业由于专业的特殊性,技术的开发和应用水平相对较为落后,设计工作具有较大的随机性和经验型。随着科学技术的发展和人们生活的日益复杂化,单纯以经验、直觉和灵感等传统建筑方法已不能满足现代社会的需求。因此需要引入科学理论研究建筑设计和方法,引入各种计算机分析技术对建筑作出客观、正确和符合实际的评价。

20世纪八十年代,计算机辅助设计(ComputerAidedDesign,简称CAD)技术的应用,给建筑行业带来了一场革命。它让设计师们摆脱了制图板的束缚,使传统的纸质图纸电子化,为设计的增添和修改带来了很大的便利。不过,CAD技术只是一种二维图形数据处理方式,虽然很大程度上提高了出图效率,但是在后续阶段的再利用方面并不理想。在这种情况下建筑信息模型(BuildingInformationModenng,简称BIM)技术产生并发展起来。

建筑信息模型(BuildingInformationModeling,BIM)是近年来出现的一项新的建筑数字技术,这个模型包含了建筑所有信息的综合数据库,可以管理建筑生命周期的全部信息。其对于信息的交流与共享、提高决策速度与准确性、降低成本、提高生产质量等方面具有显著的价值优势。美国国家建筑科学协会(AmericanNationalInstituteofBuildingSciences,简称NIBS)给出BIM在实用中的定义:建筑信息模型是利用先进的数字技术建立存储项目全生命周期的所有物理和功能特性的计算机模型,便于业主和经营者利用信息进行建筑物全生命周期的维护。

BIM是一个基于3D的面向应用对象的工程数据库技术,包含了设计意图、项目资料、建造信息、设计管理数据等可视化信息。设计师运用BIM技术进行设计的过程,其实就是建造一个真实建筑的过程。这个虚拟的建筑模型其实是一个包含了建筑物从规划到设计、施工、运营、改造、拆除等全生命周期所有信息的综合大型数据库。

建筑信息模型为历史建筑保护项目提供从最初概念设计开始到整个生命周期里做出任何决策的可靠共享信息资源,使得历史建筑的管理和开发工作进入量化、科学化和法制化轨道。建筑信息模型将这些极其珍贵的历史文献发展为数字资源库,使得规划设计、文物保护和相关管理部门能够及时掌握各种能反映现状的动态资料,并将此作为管理部门保护和管理的依据。将建筑信息模型技术运用到日常的历史建筑管理和维护中,能够将历史建筑各方面的资料和信息整合起来,有助于这些数据的收集、整理、更新、检索、维护和交流,避免这些资料和信息因为分属不同部门而难以共享,同时可以避免有关的纸质书面资料因年代久远而破坏、遗失。同时,在前项工作的基础上,对历史建筑进行客观、公正、适时的追踪评估,建立历史建筑开发的监测和激励机制,保证历史建筑保护的有效性,并及时发现旅游开发带来的危害。

3基于建筑信息模型技术的历史建筑资源管理

历史建筑保护研究需要着眼于拓宽视野,从历史建筑的生态观、历史文化观、法制观和经济价值观等方面,从更广阔长远的视角挖掘当今的城市建设中历史建筑的价值并提出相应保护对策。这种保护模式是系统的过程,其模式与方法研究能够最大限度的发挥历史建筑所蕴含的各种价值,提高现代城市的核心竞争力。建筑生命周期管理以及建筑信息模型的提出,为实现历史建筑保护建设项目全生命期的信息交换与共享,从根本上解决历史建筑保护项目建设各阶段的信息断层和使用维护阶段的信息流失问题。

3.1基于云服务体系的建筑信息模型系统

实际中建筑信息模型中的指数测评都是同时针对多个对象进行的,每个对象的属性更加复杂和多样,而且多数信息是图像信息,因此需要建立更为复杂的数学模型,需要运用更为高效的数据分析软件。云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,以服务的方式提供。这种新型的计算资源组织、分配和使用模式,有利于合理配置计算资源并提高其利用率,实现绿色计算。

3.2基于多维数据分析的云服务平台

基于云服务体系的建筑信息模型系统需要大量的数据分析,需要功能强大的、能根据需要及时更新的、实现集群计算的动态数据分析软件。基于多维数据分析的建筑信息管理平台BIM数据的存储与访问是实现面向历史建筑生命期工程信息管理的底层数据支持。然而由于BIM模型的复杂性,使其计算机实现十分困难,成为了推动基于BIM的信息集成和管理的障碍。这就提出了一个迫切需要解决的关键技术科技问题,即适应数据仓库下的多维数据集如何用数学模型和算法的多维矩阵表达。建立在多维数据模型基础上的BIM数据仓库与进行数据分析和查询的联机分析处理,使用户直观地理解、分析数据,最终能多角度、多侧面地观察数据,深入地了解包含在数据中的信息、内涵。数据仓库和联机分析处理是建立在多维数据模型基础上的,这种模型是以数据立方体的形式展现数据。

4基于多维数据的建筑信息模型系统实现

基于云服务系统平台的物理基础,将以网络中心为支撑;并制定一定的资源共享规则,将武汉市近代建筑保护规划设计与施工等相关部门的历史建筑信息模型子系统连接入我们的云服务系统,汇集在统一的历史建筑的保护和管理信息系统平台,基于这个平台能够开展更加深入细致的研究工作,并实现部分信息的查询与交互。具体能够为用户提供如下功能:

1)提供历史建筑环境数据,了解武汉近代历史建筑分布情况;

2)显示历史建筑的相关数据,特别是其现状影响信息,包括平、立、剖面。通过虚拟建造、信息化建模实现建筑的可视化和信息数据的可查询化,能够根据建筑数据的各种属性,对其进行统计和分析;

3)辅助具体建设项目的计算,包括材料选择、结构优化、方案优化和决策;

4)建立武汉近代历史建筑价值的专家评判体系,并统计辅助保护规划;

5)构建针对武汉近代历史建筑保护的相关海量数据的集快速采集、存储、计算和分析的云计算服务体系,构建和配置联网云服务平台。

其中历史建筑测评系统的数据涉及到不同时间段多个专家的多个样本,因此我们采用数据仓库来存储这些从日常运行数据库中分离出来,分散的数据。其多维数据库技术提供上钻和下钻功能,易于投影转换,使用方便;且可以有效地根据不同的需要增加不同的指标,又可以方便快捷地对事实数据进行分析。

因此我们可以充分运用多种学科理论和方法,利用跨学科优势对城市建筑学、文化学进行完善与补充。从根本上解决历史建筑保护项目建设各阶段的信息断层和使用维护阶段的信息流失问题。实现历史建筑保护建设项目全生命周期的信息交换与共享。具体内容包括:

1)设计具有广泛性的时空观架构下的历史建筑保护的模式和方法,增进人们对城市历史建筑潜在价值的认识。并综合应用建筑信息模型、信息标准以及信息集成技术的最新研究成果,研究BIM构建的关键理论和技术,为-实现武汉近代历史建筑信息交换、共享和集成化管理提供理论、方法、技术和平台。

2)建筑信息模型的历史建筑保护的数据涉及到多个指标的不同时间的多个样本,因此可以设计开发面向多对象的基于多维数据分析的数学建模与动态数据分析软件,采用数据仓库来存储这些从历史建筑的日常运行数据库中分离出来,分散的数据。其多维数据库技术可以有效地根据不同的需要增加不同的指标,又可以方便快捷地对历史建筑的事实数据进行分析。

3)发展基于云计算服务架构的信息快速采集、存储、计算和分析技术。实现历史建筑信息海量基础数据的存储。

数学建模和数据分析篇5

关键词:数据驱动;决策支持;教育质量;质量管理;数据仓库

中图分类号:G647文献标志码:A文章编号:1673-8454(2016)03-0060-03

正如维克托教授在《与大数据同行:学习和教育的未来》一书中指出:“大学率先感受大数据的浪潮”,“高校必须做出极大的改变,才能从大数据中受益”。当前,高校学生规模庞大,课程类型多样,学生在学习过程中产生了大量的学习行为与学习绩效数据,但这些数据并未被有效收集、储存、处理与分析,专业的设置、课程的开设、学习的评价等关乎教育质量高下的教学关键环节的决策,在很大程度上依赖于教师与管理者的直觉与经验。信息技术的发展使得在海量数据基础上应用数据驱动决策支持系统,能发现、理解进而满足学生的多样化学习需求,改善学习绩效,提升教育质量水平,使高校管理者的决策更加具有科学性。

一、高校数据驱动决策支持系统的建设目标

《国家中长期教育改革和发展规划纲要(2010-2022年)》中明确指出,未来10年“提高质量是高等教育发展的核心任务,是建设高等教育强国的基本要求。”质量是教育事业的生命线,教育质量产生于教学过程之中。教育质量信息搜集和分析评价是教育质量管理活动的重要内容,通过基于教学信息的分析评价,发现影响教育质量的重要因素和关键环节,从而有针对性的采取改进措施,促进教育质量持续提升,确保教学满足学生全面、和谐发展需求。[1]

目前,国内高校都非常注重在教育质量管理过程中加强基于网络的教学管理信息系统建设。特别是国家教育部已牵头搭建了本科教学状态数据库,定期采集教学状态信息数据,状态数据库包括了教育教学、师资队伍、学科建设、科研情况、学生基本情况、教学科研仪器、教育经费、教学条件、学生课外活动等11大类的近860个状态数据项。[2]该数据库目前已成为教育部制定宏观教育政策,提高高校教育质量管理不可或缺的重要支撑。

本科教学状态数据库包含的数据非常全面,这些数据有利于不同高校之间进行对比分析,但是对高校教育质量管理的支撑作用却非常有限。高校教育质量管理的重点是把握教育质量“动”的特性,需要在动态数据、明细数据中发现教学运行过程中的问题及教育质量的变化。因此,建立满足高校教育质量管理需要的数据驱动决策支持系统,不仅有利于推进全国高校教学基本状态数据库建设、高校教育质量报告编写等管理工作的效率和水平,而且能够为高校持续改进教学工作、学生管理工作、行政管理工作等提供决策支持服务。[3]高校数据驱动决策支持系统建设目标主要有:

(1)通过运用标准规范的信息数据采集方法,构建基于二级教学单位的教学基本信息数据库,确保高校整体教学基本信息数据的唯一性、准确性、共享性。

(2)通过构建全面系统的教学运行指标分析,及时全面了解教学运行状况,为教育管理科学决策提供支撑。

(3)为开展教师教学绩效评价、专业评估等提供相关信息服务,成为高校教育质量管理体系的重要基础信息平台。

二、高校数据驱动决策支持系统的功能特点

1.教学信息的共享性

高校数据驱动决策支持系统提供基于浏览器的共享信息数据服务,并通过严格的用户权限划分,在实现数据信息共享的同时保障数据信息应用的安全性。系统应当划分至少五类用户,拥有不同权限,主要包括:信息管理、信息审核、信息查看、教师个人查看、学生个人查看。不同的用户权限划分,有利于保障数据的唯一性、准确性、完整性,有利于不同岗位员工共享数据集成、数据分析的便利。

2.数据处理的灵活性

高校数据驱动决策支持系统在数据采集、数据查看、报告输出的各环节都可提供灵活的数据处理方法和便捷的系统操作功能。在数据采集方面,系统不仅支持以Excel文件方式从其他业务系统导入数据,还能够支持在线录入与审核数据。此外,结合一线教学管理的需要,系统还能够根据预先的配置,将采集的基础信息表进行计算分析后形成相应的信息采集表,替代原来工作中在需要在业务系统之外利用Excel进行传统手工数据计算分析的方法,提高数据处理的效率。在报告输出方面,高校数据驱动决策支持系统能够支持不同的二级教学单位按照各自的情况定制不同内容组合的运行报告与质量报告,并允许依据用户根据数据自定义数据分析的文字描述,这种灵活个性化的报告输出设置,方便二级教学单位根据各自的教育质量管理侧重点进行重点分析报告。此外,系统还能够提供多样化的数据查询方式、便捷的数据在线编辑操作、多类型文件的数据输出等功能。

3.系统的拓展性

高校数据驱动决策支持系统在现有功能框架基础上,能通过扩大采集表的范围,拓展系统基础数据的覆盖面;能通过增加交叉查询表,拓展教育质量信息数据库的规模;能通过增加数据分析指标,加深教育质量信息的分析层次;能通过增加数据业务处理流程,将更多传统手工的业务数据处理集成在系统中。系统能够在现有框架基础上充分运用现代信息技术手段和先进数据分析处理技术,成为高校教育质量管理的有力工具。[4]

三、高校数据驱动决策支持系统的基本框架

“高校数据驱动决策支持系统”包括“教学基本数据采集”、“教育质量信息数据库”、“分析决策指标定义”、“分析决策报告输出”四个功能模块(如图1所示)。基础数据以多种方式输入或者导入系统,经过一定的数据验证和重新组合,组成教育质量信息数据库,并通过事先设定的不同指标统计方法,将数据加工成为与原始数据保持动态链接的以指标存储的教学信息,同时这些指标信息能按照教育质量管理的需要形成报告输出。[5]

1.“教学基本数据采集”模块

能够通过Excel文件导入、表单录入审核、在线表格填写等方式进行教学基本信息数据采集工作,并提供数据验证、数据转换、数据筛查、数据扩展等功能,主要由系统一级菜单“数据采集”、“数据审核”及其所属功能选项实现。该模块的技术重点在于保证数据导入的易操作性,并解决来自不同来源的不同结构的数据能有效重构和组合,以便建立符合系统应用要求的基础数据库。

2.“教育质量信息数据库”模块

在数据采集表的基础上形成的交叉查询表格或多表联动查询表格,并提供数据模糊条件查询、分类条件查询、查询结果导出等功能,主要由系统一级菜单“数据查看”及其所属功能选项实现。该模块的技术重点在于在建立准确的基于多个采集表的数据关联及良好的数据库查询性能,将零散的数据采集表通过优良的数据库结构,集合成为教学基础信息数据网络。

3.“分析决策指标定义”模块

在教学基础信息库中实时查询统计各类指标,为指标计算创建动态图表,并提供指标的数据来源索引,建立规范的指标统计口径、数据来源、统计方法等方面的详细说明,主要由系统一级菜单“指标统计”及其所属功能选项实现。该模块的技术重点在于良好的指标实时统计能力和清晰的指标溯源功能,能够帮助用户及时了解指标各项数据的来源,增强指标计算的可信赖度。

4.“分析决策报告输出”模块

能够按学期或学年形成教学运行分析报告和教育质量分析报告,报告包括文字描述、数据表格、图形图表等多项内容,以Word文件形式输出,主要由系统一级菜单“分析报告”及其所属功能选项实现。该模块的技术重点在于实现图文并茂的报告内容及支持个性化输出报告定义,以支持不同管理侧重的需要。

四、数据仓库技术在系统设计方案中的应用

(1)数据层。用于实现对数据的转换、抽取、汇总等处理过程,形成信息数据,并存储在中心信息数据库中。在系统设计方案中,主要由“教学基本数据采集”功能模块完成原始数据的采集,需要注意的是,数据源的丰富必须以管理需要为前提,系统必须围绕反映教学运行和教育质量为核心进行数据采集,不论是从现有的教务管理系统中直接采集信息还是以其他方式采集信息,首先要保证信息采集的准确性。

(2)应用层。通过联机分析处理实现对信息数据的分析。在系统中,主要由“教育质量信息数据库”功能模块和“分析决策指标定义”两个功能模块共同完成数据仓库的这一层次功能。教育质量信息数据库的建立,必须依赖ETL技术,ETL是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。面对教育质量信息数据库中的各类信息,不能仅仅据现在某一个指标数据上,因为在庞大的状态数据库中,单一数据并不一定有意义,但在很多情况下,一些数据与其他数据相互关联后才会有用。

(3)表现层。用户可以通过系统前端分析工具,可以将统计分析、状态报表、数据发掘、联机分析的结论展现在眼前。在系统中,主要由“分析决策报告输出”功能模块完成数据仓库的这一层次功能,根据具体管理需求,将用户关心的指标、查询表格以图文并茂的形式展现给用户,并能通过邮件系统发送给指定管理者,以满足精细化管理的需求。[6]教学信息产生后,必须要保证信息在业务流程中进行使用。否则,整个数据驱动决策支持系统将失去应用价值。

目前,高校数据驱动决策支持系统的设计实施引入了数据仓库技术的理念,但在历史性分析、趋势性分析、相关性分析等方面还不够深入,需要进一步引入在商业企业取得诸多成功应用经验的联机分析处理技术、数据挖掘技术、商业智能技术等,结合高校教育质量管理的需要,提升大数据时代高校教育教学的数据分析水平,为提高高校管理决策科学化水平提供有力支撑。

参考文献:

[1]胡守敏.高等教育强国视域下大学实践教学宏观制度创新[J].中国成人教育,2013(4):42―44.

[2]蔺跟荣,赵秀元.高等学校本科教学基本状态数据库建设探讨[J].上海教育评估研究,2014(1):66-69.

[3]许晓东.全国高校教学基本状态数据库的研究与应用[J].中国大学教学,2012(4):83-87.

[4]柳叶青.国外教育领域数据驱动决策研究述评[J].上海教育科研,2013(9):14-18.

数学建模和数据分析篇6

关键词:数学建模日常生活数学化生活

一、数学模型和数学建模基本含义

数学模型:在准确把握事物系统内部具体突出特征和关系的基础上,整合抽象关系表现,运用数学语言进行近似概括和表达,生成一种数学结构系统。数学模型的建立是类似性反映客观存在形式和各种复杂关系的方式。[1]

数学建模:是在现实生活中建立数学模型来解决问题。

二、数学建模程序

数学建模在理论上只是对于具体数学模型的宏观规范,需要在实际操作中进行必要具体问题的具体分析,达到数学建模形式的灵活运用。[2]

数学建模的一般程序:

1.准备模型。此阶段的实现是建立在对于实际问题的熟悉基础上,熟悉问题出现的原因、背景,明确数学建模所要实现的目的。

2.建立模型。在准备的基础上,对于收集的数据和资料进行分析和处理,利用数学语言找出假设条件,保证数学语言的相对精确性。具体问题所涉及到的相关变化因素以及其中的不确定关系需要数学工具的恰当协作,建立起数学模型。其具体数学模型可以包含方程、不等式、图形函数和表格等。注意在建模时,为了达到模型的广泛普及和推广,应该力求数学工具的简单化。简单化的建模工具可以贴近现实生活,可以广泛被采纳、接受和运用。

3.求解模型。求解模型需要利用数学工具,数学工具可能使用到方程、逻辑推理和证明、图解等直观或间接方式。模型求解的结果需要根据实际问题各因素关系的正确分析加以确定,结果分析中需要根据结果预测数学公式、完成最优决策的选择和控制的最佳实现。最优决策的选择是解决实际问题中比较常见的难题,在综合衡量多种选择的前提下,进行最优的选择是关键的决定,而数学模型的建立可以在数学工具的辅助下,更快、更简洁、更直观的实现选择最优化,解决实际问题。

4.检验模型。模型建立后综合分析的结果完成后,需要及时将分析结果归于实际生活中,进行检验。检验模型建立的正确性和科学性要利用实际现象和数据对模型相对应的数据和结果进行对比分析,分析其吻合性和出入性,准确把握数学模型的合理性和实用价值。数学建模的成功性认定,一般要求模型在解释已知现象的基础上,还有进行超越性的预测未知现象的能力和价值。建模检验过程中,模型假设可能存在问题,其确定原因一般来源于检验过程中,结果与实际不符合,但是求解过程无差错的情况。模型假设错误的弥补措施主要是及时修改和适当补充,以弥补其错误性。在修改和补充模型假设时,当结果相符合,精度达到规定要求时,可认定为模型假设可以使用,那么模型也可以实现其应用价值和推广功能。

三、数学建模与生活中最优化问题

最优化问题包括工农业生产、日常生活等方面,方案优化的选择、试验方案的制定等均涉及到数学建模的应用。对于最值问题,一般的方法是通过建立函数模型的方式,将实际问题和方案转化为函数形式,求最值问题。方案的最优化类似也是建立起不同方案的相应函数。[3]

例如:

1.有关房间价格最优化问题

星级旅馆有150个客房,其定价相等,最高价为198元,最低价为88元。经营实践后,旅馆经理得到了一些数据:当定价为198元时,住房率为55%;定价为168元时,住房率为65%;定价为138元时,住房率为75%;定价为108元时,住房率为85%。如果想实现旅馆每天收入的最高值,每间客房应怎样定价?

数学建模分析:

据数据,定价每下降30元,入住率提高10个百分点。也就是每下降1元,入住率提高1/3个百分点。因此,可假设房价的下降,住房率增长。

建立函数模型来求解。设y为旅馆总收入,客房降低的房价为x元,建立数学模型:y=150×(198-x)×0.55+x解得,当x=16.5时,y取最大值16471.125元,即最大收入对应的住房定价为181.5元。这里建模的关键是把握房价与住房率的关系,模型假设二者存在着某种线性关系。

2.生活中的估算―挑选水果问题

关于挑选水果挑选最大个的水果合理性问题分析与思考

首先从水果的可食率角度分析。水果尽管种类繁多形状不规则,但总体来说较多的近似球形。因此,可以假设水果为球形,半径为R,从而建立一个球的模型。

挑选水果的原则是可食率较大。依据水果的果肉部分的密度是比较均匀的原理,可食率可以表示为可食部分与整个水果的体积之比。

2.1对于果皮厚、核小的水果,如西瓜、橘子等。假设水果的皮厚度差异不大,且是均匀的,厚为d,可推得:可食率==1-

2.2对于果皮厚且核大的水果,如白梨瓜等。此类水果可食率的计算需要去掉皮和核,才能保证其可食率计算的准确性。设核半径为k*R(k为常数)。那么,可推知:可食率==1-3-k3,其中d为常数,R越大说明水果越大,水果越大,其可食率越大,越合算。

2.3有些水果皮薄,但出于卫生考虑,必须去皮食用,如葡萄等。此类水果与(1)类似,可知也是越大越合算。

关于挑选水果最大合理性的数学建模的关键在于:首先从可食率切入,模型假设之前分析水果近似球形的较多这一特性,假设球型,建立数学模型,将求算可食率转为求算水果半径R的便捷方式。

生活中涉及到数学建模的应用很多,初等数学知识是解决实际问题的重要途径和有效方法。数学建模应该紧密的联系生活实际,将数学知识综合拓展,使数学学科的魅力和情景呈现出新的形式和样貌,充满时代特征。数学建模生活中的应用有利于解决实际生活的种种难题,进行最优选择和决策,同时还可以培养思维的灵活性和深刻性,增加思维方式转变的速度和知识的广泛性和创造性。

参考文献:

[1]《中学数学应用》金明烈新疆大学出版社2000

你会喜欢下面的文章?

    家政培训心得体会(6篇)

    - 阅59

    家政培训心得体会篇1论文关键词:农民工;培训政策;学分银行;创新;路径政策创新的核心要义是用新的政策理念拟定完....