1
实验六用SPSS进行非线性回归分析
欧阳歌谷(2021.02.01)
例:通过对比12个同类企业的月产量(万台)与单位成本(元)的资料(如图1),试配合适当的回归模型分析月产量与单位成本之间的关系
图1原始数据和散点图分析
一、散点图分析和初始模型选择
在SPSS数据窗口中输入数据,然后插入散点图(选择Graphs→Scatter命令),由散点图可以看出,该数据配合线性模型、指数模型、对数模型和幂函数模型都比较合适。进一步进行曲线估计:从Statistic下选Regression菜单中的Curve Estimation命令;选因变量单位成本到Dependent框中,自变量月产量到Independent框中,在Models框中选择Linear、Logarithmic、Power和Exponential四个复选框,确定后输出分析结果,见表1。
分析各模型的R平方,选择指数模型较好,其初始模型为 但考虑到在线性变换过程可能会使原模型失去残差平方和最小的意义,因此进一步对原模型进行优化。
模型汇总和参数估计值 因变量: 单位成本 方程 R 方 线性 对数 幂 指数 .912 .943 .931 .955 F 104.179 166.595 134.617 212.313 模型汇总 df1 1 1 1 1 df2 10 10 10 10 Sig. .000 .000 .000 .000 参数估计值 常数 158.497 282.350 619.149 176.571 b1 -1.727 -54.059 -.556 -.018 自变量为月产量。 表1曲线估计输出结果
欧阳歌谷创编 2021年2月
1
欧阳歌谷创编 2021年2月
1
二、非线性模型的优化
SPSS提供了非线性回归分析工具,可以对非线性模型进行优化,使其残差平方和达到最小。从Statistic下选Regression菜单中的Nonlinear命令;按Paramaters按钮,输入参数A:176.57和B:-.0183;选单位成本到Dependent框中,在模型表达式框中输入“A*EXP(B*月产量)”,确定。SPSS输出结果见表2。
由输出结果可以看出,经过6次模型迭代过程,残差平方和已有了较大改善,缩小为568.97,误差率小于0.00000001, 优化后的模型为:
迭代历史记录b
迭代数a 残差平方和
参数
A
B 1.0 104710.523 176.570 -.183 1.1 5.346E+133 -3455.813 2.243 1.2 30684076640.
476.032 .087 873 1.3 97312.724 215.183 -.160 2.0 97312.724 215.183 -.160 2.1 83887.036 268.159 -.133 3.0 83887.036 268.159 -.133 3.1 59358.745 340.412 -.102 4.0 59358.745 340.412 -.102 4.1 26232.008 385.967 -.065 5.0 26232.008 385.967 -.065 5.1 7977.231 261.978 -.038 6.0 7977.231 261.978 -.038 6.1 1388.850 153.617 -.015 7.0 1388.850 153.617 -.015 7.1 581.073 180.889 -.019 8.0 581.073 180.889 -.019 8.1 568.969 182.341 -.019 9.0 568.969 182.341 -.019 9.1 568.969 182.334 -.019 10.0 568.969 182.334 -.019 10.1
568.969 182.334 -.019 导数是通过数字计算的。
a. 主迭代数在小数左侧显示,次迭代数在小数右侧显示。
欧阳歌谷创编 1
2021年2月
欧阳歌谷创编 2021年2月
1
b. 由于连续残差平方和之间的相对减少量最多为 SSCON = 1.000E-008,因此在 22 模型评估和 10 导数评估之后,系统停止运行。
表2非线性回归的输出结果
传统手工运算求解,运算量与迭代次数成正比;而使用SPSS求解,只要输入了初始参数值和模型表达式,无论迭代多少次,都可快速得到最后结果,不仅减轻了计算强度,而且提高了数据准确度,相比Excel又有了极大的进步。
欧阳歌谷创编 1
2021年2月
因篇幅问题不能全部显示,请点此查看更多更全内容