搜索
您的当前位置:首页正文

强化一论文

来源:意榕旅游网


题目:课程关系量化分析模型

摘要

如何准确合理的分析评价学生的学习成绩,对于检验学生的整体水平以及配置恰当的课程资源有着深远的意义。透过正确的分析结果,学生可以清楚地认识到自己的优势和不足,学校也可以有针对性地对教学过程做出一些调整,所以本

文对课程成绩做的分析模型是必要的。

本模型首先对专业一、专业二的所有成绩进行分段处理,利用SPSS软件,应用独立样本T检验的方法,得出两专业针对每门课程的分数差异。然后再根据不同课程对整体的学习水平的影响程度建立层次分析模型,判断两专业的整体学习水平,并对模型进行一致性检验。最后建立高级语言程序设计和离散数学两门课程分别与数据结构和数据库原理两门课程之间的相关回归模型,利用Matlab进行回归检验,从而分析出高级语言程序设计和离散数学两门课程的学习对其他

课程的影响,从而提出合理的规划与建议。 所建模型充分利用了附表中的数据,并合理地分析、假设、验证,可以推广

并用以帮助学生建立更有效的学习计划。

关键词: SPSS T检验 层次分析 一致性检验 回归模型 MATLAB

1.问题重述

表一、表二分别是某高校专业一和专业二的高级语言、离散数学、数据结构、数据库原理四门课程的期末考试成绩数据,根据数据分析并解决下面几个问

题: (1)针对每门课程分析,两个专业学生的分数是否有明显差异? (2)针对专业分析,两个专业学生的学习水平有无明显差异? (3)通过数据分析说明:说明高级语言程序设计和离散数学两门课程学习的优

劣是否影响数据结构和数据库原理两门课程的学习? (4)根据以上分析,写一篇关于大学专业基础课程学习方面的看法。

2.问题分析

在问题一中,需要对所有数据进行预处理,通过SPSS软件,应用独立样本T

检验的方法,得出两专业针对每门课程的分数关系。

在问题二中,通过美国运筹学家托马斯·塞蒂(T.L.Saaty)在20世纪70年代中期提出的层次分析法进行比较,将判断分为三层,认真地考虑不同专业的分数差异和不同课程对总体水平的相对重要性,并利用矩阵学的相关知识检验模型

的正确性并进行一致性检验。

在问题三中,建立高级语言程序设计和离散数学两门课程分别与数据结构和数据库原理两门课程之间的相关回归模型,利用Matlab进行回归检验,从而分析

出高级语言程序设计和离散数学两门课程的学习对其他课程的影响

在问题四中,根据分析结果给出实际有效的建议来解决专业课程学习方面的问题,包括各门课程学习时间的安排以及根据课程间的逻辑关系改变学习方式。

3.模型的假设

假设一:所给的成绩数据都是合理可靠的 ;

假设二:专业一和专业二两专业考试题目相同 ; 假设三:老师的教学水平相当; 假设四:学生的学习水平仅与题中所给的四门成绩有关; 假设五:人对一个复杂的决策问题的思维判断过程大体上是一样的 ; 假设六:成对比较矩阵都是正互反矩阵 ; 假设七:高级语言与离散数学成绩的平均值用‘GL‘表示。

4.符号说明 N 样本数 相关系数 p x 把高级语言与离散数学成绩的平均值(即GL)作为一元线性回归模型的自变量 把数据结构成绩作为一元线性回归模型的因变量1 y1 把数据库原理成绩作为一元线性回归模型的因变量2 y2

一元线性回归模型的回归系数 0、1、2、3 一元线性回归模型的回归系数的估计值 ˆ、ˆ、ˆ、ˆ 0123  随机误差(均值为0的正态分布随机变量) 相关系数的平方 R2 5.模型建立与求解 问题一:针对每门课程分析,两个专业的分数是否有显著差异?

模型一.独立样本T检验

独立样本T检验是指两个总体独立,并且均值未知利用T分布统计量进行的

检验。

问题一中针对每门课程分析两个专业的分数是否有明显差异?可以采用独立样本T检验(Independent-Samples T Test)分别对各门功课单独检验,对每门

课程分析两个专业的分数是否有明显差异

在此之前,我们需要证明:两个专业每门课程的成绩服从正态分布 Spss软件具有正态性检验的功能,我们直接运用spss进行正态性检验。首先,我们针对专业一的高级语言利用柱状图进行统计分析,运用spss软件做频

数分析。

激活数据管理窗口,定义变量名成绩、专业,输入各专业学生的成绩。运行

analyze-> nonparametric test -> 1-sample K-S. 运行结果如下:

图1

图2

由图1和图2中偏度(Skewness)、峰度(Kurtosis)的值可以看出,专业一的高级语言的成绩近似服从正态分布。 用同样的方法可得到专业一的离散数学、数据结构、数据库原理的成绩和专业二的高级语言、离散数学、数据结构、数据库原理的成绩也近似服从正态分布(图见附表1)。

在专业一、专业二各门课程满足正态分布的条件下 ,我们运用spss软件进一步进行独立样本T检验,对于专业一和专业二的高级语言我们进行独立样本T检验可得到如下数据

图3

由图3知,该结果分为两大部分:第一部分为方差相等的Levene检验,用于判断两总体方差是否相等,这里的检验结果为F0.355,p0.5520.05,可

见在本课程中方差是相等的;第二部分则分别给出两组所在总体方差相等和方差不等时的t检验结果,由于前面的方差相等检验结果为方差相等,第二部分就应选用方差相等时的T检验结果,即上面一行列出的p0.2840.05,表明差异不显著,即专业一和专业二的高级语言课程成绩无明显差异。

在解决其它三门课程两个专业学生的分数是否有明显差异时,运用同样的方法进行分析(数据见附件二),得到的结果为:

(1).专业一和专业二的离散数学成绩有明显差异; (2).专业一和专业二的数据结构成绩无明显差异; (3).专业一和专业二的数据库原理成绩无明显差异。

问题二:针对专业分析,两个专业的学习水平是否有显著差异?

为计算两个专业的学习水平,首先通过所给数据,利用excel的CORREL函数功能求出四门成绩间的相关性,然后通过相关系数估计出不同科目对整体学习水平重要性之比,再结合问题一中的单科专业差异,建立数学模型,得出两专业的学习水平,最后根据实际数据验证模型的准确性。 1.计算成绩的相关性,只分学科不分专业

图4 高级语言——离散数学

图5 高级语言——数据结构

图6高级语言——数据库原理

图7 离散数学——数据结构

图8 离散数学——数据库原理

图9数据结构——数据库原理

由于所有相关系数基本上都在0.4-0.6的范围内,代表相关程度较大,因而有以下结论:

高级语言的成绩影响离散数学、数据结构、数据库原理的成绩; 离散数学的成绩影响数据结构、数据库原理的成绩; 数据结构的成绩影响数据库原理的成绩。

从而估计出各个科目对学习水平的重要性排名: 高级语言,离散数学,数据结构,数据库原理。 2.计算两专业的学习水平 1)建立层次分析结构模型

学习水平 高级语言离散数学数据结构数据库原理 专业一 专业二

图10

由成绩相关性的计算结果,我们可以定量出四门课程对学习水平的成对比较矩阵

114A161741151655113763 1其中aij代表各课程对学习水平的重要性之比,则A的最大特征根

 4.2624

再由特征根法

A得出它的权向量

=0.8928,0.4215,0.1404,0.0750

注:在进行定性的成对比较时,我们利用saaty等人提出的1-9尺度,如下表: 标度 含 义 1 表示两个因素相比,具有相同重要性 3 表示两个因素相比,前者比后者稍重要 5 表示两个因素相比,前者比后者明显重要 7 表示两个因素相比,前者比后者强烈重要 9 表示两个因素相比,前者比后者极端重要 2,4,6,8 表示上述相邻判断的中间值 倒数 若因素i与因素j的重要性之比为aij,那么因素j与因素i重要性之比为

aji1aij。

一致性检验:

CInn-1 CRCI0.09780.1 RI所以一致性检验通过,上述可作为权向量. 注: 随机一致性指标RI的数值如下表所示 N 1 2 3 4 5 6 7 8 9 10 11 RI 0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51 由问题一的结论再次定量出专业对课程的成对比较矩阵

1B11551 B12177 1B311221 B14122 1这里矩阵Bk(k1,2,3,4)中的元素bij(k)代表决策层专业一与专业二对于准则层高级语言、离散数学、数据结构、数据库原理的优越性的比较尺度。

通过第三层的成对比较矩阵Bk计算出权向量k(3),最大特征值k和一致性指标CIk,结果如下表

k 1 0.9806 0.1961 2 0 2 0.9806 0.1961 2 0 3 0.9806 0.1961 2 0 4 0.9806 0.1961 2 0 k(3) k CIk 由于n2时,成对比较矩阵必为一致阵,因为1、2阶的正互反阵总是一致阵,故省去一致性检验。

2)第三层对第一层组合权向量的计算 专业一:1=W1

(3)(3)=0.5126

'

其中

(3) ,=0.8928,0.4215,0.1404,0.0750W1=(0.9806,0.9806,0.9806,0.9806)

专业二:2(3)(3)=W2=0.4874

(3)其中 W=0.1961,0.1961,0.1961,0.1961 2所以由此可得专业一的学习水平高于专业二的学习水平。 组合一致性检验 定义

(p)p)(p)(p1)CI[CI(CIn] 1, (p) RI[RI1(p),RIn(p)](p1)则第p层的组合一致性比率为

CR(p)CI(p),p3,4,(p)RI

第p层通过组合一致性检验的条件为CR(p)0.1 定义最下层对第一层的组合一致性比率为

(p) CR=CR

*p=2s通过检验的条件为:CR*适当的小一般小于0.1,才认为整个层次的比较判断通过一致性检验。

(3)(3)(2)=0, CR=0.0987,在本问题中RI不存在,故记为0。而前面已经有CR于是CR*=0.0987,组合一致性检验通过,前面得到的组合权向量k(k=1,2)可以作为最终决策的依据。

问题三:高级语言程序设计和离散数学两门课程学习的优劣是否影响数据结构和数据库原理两门课程的学习? 一元线性回归模型的建立

由于是分析高级语言程序设计和离散数学两门课程(组合学科记作:‘高数’假设中有说明)学习的优劣与数据结构、数据库原理相互影响关系,因此用高级语言和离散数学两门课的平均成绩即‘高数’的成绩来描述两门课程学习的优劣,建立关于‘高数’——数据结构成绩的一元线性回归模型和‘高数’——数据库原理成绩的一元线性回归模型。

(3)y101xy223x2E0,D

组独立观测值,

关于模型参数的估计:有

n

(x1,y1),(x2,y2),,(xn,yn)

yi0x1i,i1,2,...,n 设 2...,n相互独立Ei0,Di 且12,记 QQ(0,1)yi01xi

2i2i1i1nnˆˆ最小二乘法就是选择0和1的估计0,1使得

ˆ,ˆ)miQnQ((0,1) 010,1ˆyˆx01ˆ解得 ˆxyxy 或 11x2x2xi1nnixyiyixi1x

21n21n1n1n2其中xxi,yyi,xxi,xyxiyi

ni1ni1ni1ni1得出回归方程为:模型求解与检验

因为‘高数’分为数据结构和数据库原理,所以依据开始的假设,取两者均值来代替‘高数’成绩。再定义‘高数’成绩x为横坐标,以数据结构成绩y1(数据库原理成绩y2)为纵坐标,在平面直角坐标系上标出,利用Matlab来进

行数据的处理和图表输出。 1. 相关标示的解释

bint是回归系数的区间估计,R是残差,rint是置信区间,stats是用于检验回归模型的统计量值,相关系数R2,F统计量值,与F对应的概率p,

2alpha是置信水平(缺省的时候为0.05)。相关系数R越大,说明回归方程越

ˆˆxyˆ(xx) ˆy011显著,与F对应的概率palpha时候,回归模型成立。 2. ‘高数’——数据结构成绩的一元线性回归模型求解与检验: 1)利用Matlab处理数据

① 输入数据:

x11xx2 6 x;x1,x12 ,1xonessize;

y1y1, y2 y261;

② 回归分析及检验:b,bint,r,rint,statasregressy1,x; ③ Matlab计算的结果: b=22.5453 0.6913

bint=13.6991 31.3915 0.5653 0.8172 stats=0.3109 116.8613 0 135.7127 ④ 残差分析:作残差图 rcoplot(r,rint)

预测及作图:zb1b2x1; plot(x1,y1,'*',x1,z) 2)分析计算结果

图11 y1x1残差图

图12 y1x1散点图和y1x1回归方程

ˆ=0.6913;ˆ=22.5453,ˆ的置信区间为[13.6991, 通过Matlab计算得出100ˆ的置信区间为[0.5653, 0.8172] R2=0.3109,F=116.8613,p=0,31.3915],1估计误差方差=135.7127。从残差图可以看出,除了8个数据点外,其余数据的

残差离零点均较近,且残差的置信区间均包含零点,再观察图12发现数据点基本上均匀的分布在回归方程的两侧。这说明回归模型

ˆ122.54530.6913xy能较好的符合原始数据,而那8个数据点可视为异常点。因此可以得出结论:‘高数’成绩的好坏将影响到数据结构成绩的好坏,而且是正相关。

3. ‘高数’——数据库原理成绩的一元线性回归模型求解与检验:

1)利用Matlab处理数据

⑤ 输入数据:x11x,x2 6 x;x1,x12 1xonessize;

y2z1, z2 z261;

⑥ 回归分析及检验:b,bint,r,rint,statasregressy2,x; ⑦ Matlab计算的结果: b=30.9475 0.6328

bint=21.7481 40.1469 0.5019 0.7637 stats=0.2591 90.5560 0 146.7669 ⑧ 残差分析:作残差图 rcoplot(r,rint)

预测及作图:zb1b2x1; plot(x1,y2,'*',x1,z) 2)分析计算结果

图13 y2x1残差图

图14 y2x1回归方程和y2x1散点图

ˆ=30.9475,ˆ的置信区间为ˆ=0.6328;通过Matlab计算得出223ˆ的置信区间为[0.5019,0.7637] R2=0.2591,[21.7481,40.1469],F=90.5560,3p=0,估计误差方差=146.7669。从残差图可以看出,除了14个数据点外,其余

数据的残差离零点均较近,且残差的置信区间均包含零点,再观察图14发现数据点基本上均匀的分布在回归方程的两侧。这说明回归模型

ˆ230.94750.6328x能较好的符合原始数据,y而那14个数据点可视为异常

点。因此可以得出结论:‘高数’成绩的好坏将影响到数据库原理成绩的好坏,而且是正相关。 4. 结论:

ˆ122.54530.6913x和通过2个模型的建立,得出yˆ230.94750.6328x两个线性回归方程,这就说明了高级语言程序设计y和离散数学两门课程学习的优劣将影响到数据结构、数据库原理两门课程的学习

好坏,而且是正相关。

问题四:问题四的解答见附页。

6. 模型分析 6.1模型优缺点

(1)充分利用了附表中的数据,提高了模型建立的可靠性及准确性;

(2)运用spss软件使得在问题的解决上相当的便捷、准确,从而免去了其它方

法在处理大量数据的时候容易出错及繁琐;

(3)该模型具有普适性,适于推广到会计学考试,司法考试,公务员考试等各

种水平测试;

(4)该模型具有实用性,可以为实际学习过程提供有效帮助。 6.1模型的缺点

(1)必须要求样本的总体服从正态分布,对数据的处理限制的比较苛刻。当总

体不服从正态分布,则需要抽样样本足够大(n大于30,经验值),且总体的方差有限,那么样本均值近似服从正态分布。

(2)学习水平是一个很难定义的量,因为学习水平的衡量涉及到很多变量,这

个模型中只列出了学习水平的一些方面,不一定能反应现实学生的学习水

平。

(3)在做层次分析模型过程中指标过多时数据统计量大,且权重难以确定。特

征值和特征向量的精确求法比较复杂。最主要的是,成对比较矩阵的构造带有主观的定性色彩,使结果往往不能为人所信服。

7.参考文献 【1】刘新平.概率论与数理统计(第一版).陕西师范大学出版社,2010. 【2】江世宏.MATLAB语言与数学实验(第一版).北京:科学出版社,2007. 【3】姜启源,谢金星,叶俊.数学模型(第三版).北京:高等教育出版社,2003. 【4】陈水利,李敬功,王向公.模糊集理论及其应用(第一版).北京:科学出版社,2005. 【5】刘文艳,龙润生.SPSS在高等数学成绩分析中的应用[J].数理医药学杂志,2009,(03).

【6】俞能福.成绩统计与试卷分析的Excel实现[J].安徽建筑工业学院学报(自然科学版),2008,(05).

8.附录 附件一

专业一

专业二

附件二

离散数学

数据结构

数据库原理

附件三

x=[ones(size(x1)),x1];

[b,bint,r,rint,stats]=regress(y1,x) b =

22.5453 0.6913 bint =

13.6991 31.3915 0.5653 0.8172 stats =

0.3109 116.8613 0 135.7127 rcoplot(r.rint) z=b(1)+b(2)*x1;

plot(x1,y1,'*',x1,z)

y1x1残差图

y1x1回归方程和y1x1散点图

x=[ones(size(x1)),x1];[b,bint,r,rint,stats]=regress(y2,x) b =

30.9475 0.6328 bint =

21.7481 40.1469 0.5019 0.7637 stats =

0.2591 90.5560 0 146.7669 rcoplot(r.rint) z=b(1)+b(2)*x1;

plot(x1,y2,'*',x1,z)

因篇幅问题不能全部显示,请点此查看更多更全内容

Top