经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其依存因素。其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。
本章由1个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。
上市公司年报数据分析案例的教学目的:数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对1999年沪深股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。
案例的背景分析与数据资料 一、案例的现实意义
上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。
本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。
二、案例所依托的总体及其现状与研究目的 (一)案例所依托的客体
本案例所依托的客体是1999年上市公司年报中的有关财务指标。1999年末,沪、深两市共有上市公司949家。这些上市公司分布在13个行业部门。根据中国证监会的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。截止2000年4月30日,已公布年报的有560家。所以本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。
(二)案例研究的目的与任务
1. 上市公司年报财务数据统计分析的目的
通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。
2.上市公司年报财务数据统计分析的任务
对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。
3.上市公司年报财务数据统计分析的对象
本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。共选有8个财务指标:
4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。
4.数据的初步分析——制造业上市公司行业结构
在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据《上市公司分类指引》,制造业进一步分为10个行业种类,编码为C0、C1、C2、„、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。
表2—1 制造业上市公司行业分布 代 码 行业分类 上市公司数 比重(%) C0 食品、饮料 48 8.57 C1 纺织、服装、皮毛 45 8.04 C2 木材、家具 2 0.36 C3 造纸、印刷 16 2.86 C4 石油、化学 130 23.21 C5 橡胶、塑料 10 1.79 C6 金属、非金属 96 17.14 C7 机械、仪表、设备 151 26.96 C8 通讯、电子 51 9.11 C9 其他 11 1.96 合 计 560 100.00
这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999年560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业政策导向,在1999年新发行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。
方 案 设 计
一、 案例设计的思路
本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:
1.分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。
2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。
3.分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。
4.分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。
.分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。
6.在上述研究分析的基础上给出关于对对象的定性认识结论。 二、案例设计的工作过程 (一)数据整理与描述
1.编制按各财务指标的变量数列 (1) 将数据顺序排列。 (2) 计算描述统计指标。
在Excel“工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是;
平均——算术平均数,即x=xn
标准误差——抽样平均误差,即
n
中值——中位数,即Me; 模式——众数,即Mo; 标准偏差——标准差,即; 样本方差——方差,即2
4峰值——峰度,即
m4
m3偏斜度——偏度,即3;
区域——全距,即最大值减最小值; 求和——标志总量;
计数——总体单位总数; 最大(K)——第K个最大值; 最小(K)——第K个最小值;
置信度——“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。
(3)分析描述统计指标——比较平均数、众数、中位数的大小;偏度系数的大小、方向等。 (4)确定组数和组距——当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以K倍标准差为组距。
(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。 2.制造业公司主要财务指标的分布 (1)总资产分布数列和直方图
总资产描述统计1
平均 158315.1 标准误差 8970.946 中值 95296.9 标准偏差; 212291.3 样本方差 4.51E+10 峰值 30.19077 偏斜度 4.705128 区域 2178598 最小值 12256.69 最大值 2190846 求和 88656452 计数 560 置信度 17620.89 (95%)
总资产描述统计2
平均 144640.7 标准误差 6388.948 中值 95410.48 模式 标准偏差; 149424.9 样本方差 2.23E=10 峰值 9.916375 偏斜度 2.885238 区域 955269.6 最小值 21671.49 最大值 976941.1 求和 79118478 计数 547 置信度 12549.92 (95%)
从描述统计1看,560家公司的总资产呈高度偏态。总资产最大值是上海石化219亿元,最小值是ST黔凯涤1.2亿元,相差近200倍。将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。
不论何种分布,均值和方差其分布的两个主要特征值。根据切比雪夫定理,可以平均数为中心,以K倍的标准差为组距,因为此时平均数K倍的标准差所涵盖的数据范围不小于1-1/K2。
本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布为右偏态。若以1个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。
表2—2 560家上市公司总资产分组统计
频数 频率(%) 75000以下 209 37.32 75000~150000 192 34.29 150000~225000 64 11.43 225000~300000 33 5.89 300000~375000 18 3.21 375000~450000 15 2.68 450000~525000 4 0.71 525000~600000 2 0.36 600000~675000 4 0.71 675000~750000 6 1.07 750000~825000 2 0.36 825000~900000 1 0.18 900000~975000 3 0.54 975000~1050000 1 0.18 1050000以上 6 1.07 合计 560 100.00 从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。在各行业中,总资产规模最大的是C8——通信电子行业20.3亿元,最低的是C2——木材家具业6.38亿元,另外,C4——石油化工、C5——橡胶塑料、C6——金属非金属的总资产规模在平均之上。
频数2502001501005000000000000000000000000000000他0000000000000050505050505050其7520752075207512334566789901 图2—1 560家制造业公司总资产分布
(2)净利润分布数列和直方图
净利润描述统计
平均 6669.48 标准误差 516.2828 中值 4120.164 模式 # N/A 标准偏差; 12217.48 样本方差 1.49E+08 峰值 11.33344 偏斜度 2.485572 区域 112886.5 最小值 -37417.9 最大值 75468.6 求和 3734913 计数 560 置信度 1014.092 (95%)
态。以1/2标准差6500万元为组距,可分17组。分组后3.25亿元以上各组不仅频
数少,而且有两组频数为0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表2—3和图2—2。
表2—3 560家上市公司净利润分布
净利润分组(万元) 频 数 (个) 频 率 (%) -13000以下 14 2.50 -13000~-6500 10 79 -6500~0 22 3.93 0~6500 332 59.29 6500~13000 112 20.00 13000~19500 24 4.29 19500~26000 13 2.32 26000~32500 16 2.86 32500以上 17 3.04 合 计 560 100.00
频数350300250200150100500-13000-65000650013000195002600032500其他
净利润分组(万元) 图2—2 560家上市公司净利润分布
将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体仍为右偏态。
从整理后的净利润的资料我们注意到:
第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。
第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。79%的上市公司净利润在70万~1.3亿元之间。
第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;
4.5亿元以上的公司有16个,不足总数的3%,但它们的净利润占到制造业全行业的25.5%,充
分体现了大型国企确实是国民经济的脊梁。
第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0——食品饮料净利闰0.79亿元;C6——金属非金属净利闰0.85亿元;C8——通信电子净利闰1亿元。
(3)每股收益分布数列和直方图
每股收益描述统计 1
平均 0.199427 标准误差 0.011551 中值 0.2225 模式 0.21 标准偏差; 0.273352 样本方差 0.074721 峰值 6.75641 偏斜度 -1.51182 区域 2.632 最小值 -1.28 最大值 1.352 求和 111.6792 计数 560 置信度 0.022689 (95%)
每股收益描述统计2
平均 0.204943 标准误差 0.010571 中值 0.223 模式 0.21 标准偏差; 0.249255 样本方差 0.062128 峰值 4.912174 偏斜度 -1.27499 区域 1.8891 最小值 -0.98 最大值 0.9091 求和 113.9482 计数 556 置信度 0.020764 (95%)
每股收益是一强度相对指标。从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:
组数=1+3.322×㏒560=10;
组距=2/10=0.2,极值用开口组处理。见表2—4 和图2—3。
表2—4 560家上市公司每股收益分组统计
分 组 频数(个) 频率(%) —0.6以下 14 2.50 -0.6~-0.4 6 1.07 -0.4~—0.2 13 2.32 -0.2~0 13 2.32 0~0.2 197 35.18 0.2~0.4 231 41.25 0.4~0.6 60 10.71 0.6~0.8 19 3.39 0.8~1.0 6 1.07 1.0以上 1 0.18 合 计 560 100.00
频数250200150100500-0.6-0.4-0.200.20.40.60.81
每股收益分组(元)
图2—3 560家上市公司每股收益分布
每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。不仅在行业之间,而且可以在公司之间进行比较。从表2—4图2—3看560家公司每股收益的特点:
第一,1999年制造业的每股收益的分布略乘左偏态,即平均数为0.2元,但是相对多数的公司每股收益高于0.2元。
第二,35%的公司在0.01~0.2元的微利水平,52%的公司盈利水平再0.2~0.6元之间。26家公司盈利水平较高,在0.6元以上,但只占4.5%。1999年的改制表状元是五粮液,达到每股收益1.35元。
第三,分行也看,经营业绩差别的行业因素非常明显:最高的是C0——食品饮料,达到每股收益0.31元;大于等于每股收益0.2元的还有C1—纺织、服装,C5——橡胶塑料, C8 ——同新点子,C9——其他;最低的事C2——木材家具,只有0.08元。
(4)净资产收益率分布数列和直方图
净资产收益率1
平均 标准误差 中值 模式 标准偏差; 样本方差 峰值 2.971477 1.993256 9.04 6.21 47.08475 2216.974 117.5889 偏斜度 -10.1028 区域 736.156 最小值 -639.53 最大值 96.626 求和 1658.08 计数 558 置信度 3.915216 (95%)
净资产收益率2
平均 8.006386 标准误差 0.352228 中值 9.14 模式 6.21 标准偏差; 8.185041 样本方差 66.9949 峰值 6.881908 偏斜度 -1.63102 区域 69.26 最小值 -34.92 最大值 34.34 求和 4323.448 计数 540 置信度 0.691909 (95%)
由于资料中两个公司(0515PT渝钛白和600818ST永久)的净利润 净资产为负值,所以此处只有58个公司的数据。
558个公司的净资产旅呈高度左偏态。净资产收益率过高或过低,都数不正常情况。
舍弃40%以上和-40%以下的18个极端值后,描述指标基本正常。以1倍标准差8%为组距、48%以上和-48%一下合并各1组,共分14组。表2——5和图2——4显示,集中趋势非常明显。
表2——5 560家公司净资产收益率分组统计
分组(%) 频数 频率(%) 小于-48 13 2.33 48~-40 1 0.18 -40~-32 2 0.36 -32~-24 5 0.90 -24~-16 6 4.08 -16~-8 8 1.43 -8~0 10 1.79 0~8 190 34.05 8~16 270 48.39 16~24 39 6.99 24~32 7 1.25 32~40 3 0.54 40~48 1 0.18 大于48 3 0.54 合计 558 100.00
频数300250200150100500-48-40-32-24-16-8081624324048其他
净资产收益率分组(%)
图2—4 560家上市公司净资产收益率分布
净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:
第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有
第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。 第三,34%的公司净资产收益率在0.1%~8%之间;48%的公司在0.8%~16%之间。
第四,8%的公司净资产在16%~32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。
3.制造业各行业主要财务指标的分布
接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。
(1)制造业各行业净利润分布频数统计表和频率统计表
合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表2—6、表2—5)。
表2—6 制造业各行业净利润分布统计(频数) 代 净利润分组(万小-1.-0.0~ 0.61.3 1.92.6 大 元) 于 3 65 0.65 ~ 5 ~ 于 合码 -1.~ ~0 5 ~ 1.9~ 3.23.2计 行业分类 3 -0.1.3 5 2.6 5 5 65 C0 食品、饮料 1 27 14 3 1 1 1 48 C1 纺织、服装、皮毛 1 1 2 27 13 1 45 C2 木材、家具 1 1 2 C3 造纸、印刷 1 12 3 16 C4 石油、化工 2 2 5 81 28 6 2 4 130 C5 橡胶、塑料 8 1 1 10 C6 金属、非金属 3 4 2 53 17 4 3 5 5 96 C7 机械、仪表、设备 6 10 94 24 4 5 4 4 151 C8 通信、电子 2 2 1 22 10 3 4 4 3 51 C9 其他 7 2 2 11 合计 14 10 22 332 112 24 13 16 17 560
从表2—6、2—7中可以看到:
第一,总共45个亏损公司,占全部公司的8%,他们的行业间分布是:C7——机械、仪表、设备行业亏损面最大,有16家,占行业10.7%;其次是C8、C6和C1——分别为9.8%、9.4%、8.8%;C2——木材家具仅有2家公司,亏损1家。
第二,C5——橡胶、塑料和C9——其他行业无亏损企业,且净利润水均衡,集中在0~19500万元。 第三,净利润绝对水平的高低与行业类别有关联,3亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。
表2—7 制造业各行业净利润分布统计(频率%) 代 净利润分组(万小-1.-0.0~ 0.61.3 1.92.6 大 元) 于 3 65 0.65 ~ 5 ~ 于 合计 码 -1.~ ~0 5 ~ 1.9~ 3.23.2 3 -0.65 1.3 5 2.6 5 5 C0 食品、饮料 2.1 56.3 29.2 28.9 6.3 2.1 2.1 2.1 100.0 C1 纺织、服装、皮毛 2.2 2.2 4.4 60.0 2.2 100.0 C2 木材、家具 50 50.0 100.0 C3 造纸、印刷 6.3 75.0 18.8 21.5 10.0 17.7 16.0 19.6 18.2 20.0 100.0 C4 石油、化工 1.5 1.5 3.8 62.3 4.6 1.5 3.1 100.0 C5 橡胶、塑料 80.0 10.0 100.0 C6 金属、非金属 3.1 4.2 2.1 55.2 4.2 3.1 5.2 5.2 100.0 C7 机械、仪表、设备 3.3 6.7 62.7 2.7 3.3 2.7 2.7 100.0 C8 通信、电子 3.9 3.9 2.0 43.1 5.9 7.8 7.8 5.9 100.0 C9 其他 63.6 18.2 100.0 合计 2.3 1.8 3.9 59.4 4.3 2.3 2.9 3.0 100.0
(2)制造业各行业每股净收益分布频数统计和频率统计
表2—8、2—9显示的是不同行业每股收益的不同水平的分布。在91.8%的盈利公司中,若每股收益0.6元以上为绩优股,则绩优股的比率4.7%。绩优股的行业特征也非常明显:食品行业最高,为8.4%,其后依次是通信电子行业7.9%、机械仪表设备7.3%。从表面上看其他行业最高(9.1%),但是其他行业属于主营收入不明显的“收容”类,其较高的每股收益得益于多元化经营,因此在比较时,应予以忽略。
表2—8 制造业各行业每股收益分布统计(频数) 代 码 行业分类 净利润分组(元) 小于 -0.6 -0.6 ~ -0.4 C0 C1 C2 C3 C4 C5 食品、饮料 纺织、服装、皮毛 木材、家具 造纸、印刷 石油、化工 橡胶、塑料 1 1 1 3 2 1 -0.4 ~ -0.2 1 2 1 3 10 11 8 58 4 24 27 1 7 52 4 9 1 9 2 2 2 1 2 1 48 45 2 16 130 10 -0.0 0 0.2 0.4 0.6 0.8 大~ ~ ~ ~ 于 合计 2~ ~ 0.2 0.4 0.6 0.8 1.0 1.0 C7 C8 C9
金属、非金属 机械、仪表、设备 通信、电子 其他 合计 2 2 4 14 3 6 6 4 13 1 7 1 13 32 56 14 4 43 52 16 5 10 16 12 1 2 9 3 1 19 2 1 6 1 96 151 51 11 560 197 231 60 表2—9 制造业各行业每股收益分布统计(频率%) 代 码 行业分类 净利润分组(元) 小于 -0.6 -0.6 ~ -0.4 C0 食品、饮料 2.1 -0.4 ~ -0.2 20.9 C1 纺织、服装、皮毛 2.2 4.4 2.2 24.4 C2 木材、家具 50.0 C3 造纸、印刷 6.3 50.0 C4 石油、化工 2.3 0.8 1.5 2.3 44.6 C5 橡胶、塑料 40.0 C6 金属、非金属 2.1 6.3 1.0 33.3 C7 机械、仪表、设备 1.3 2.0 2.6 4.6 37.1 C8 通信、电子 7.8 2.0 27.5 C9 其他 36.4 合计 2.5 1.1 2.3 2.3 35.2
(二)相关和回归分析
本案例相关和回归分析研究主要是8个财务指标间的相互关系问题。各财务指标分别说明上市公司的财务状况的某一侧面。那么这些指标之间有无关系?若有关系,是什么样的关系?通过本案例的探讨,可以帮助我们筛选主要个财务指标作为分析公司业绩变动的因素。
1.制造业业绩指标之间的关系研究
表2—10是8个财务指标的两两指标间的线性相关系数。
50.0 60.0 50.0 43.8 40.0 40.0 44.8 34.4 31.4 45.5 41.3 10.7 3.4 1.1 0.2 100.0 20.0 10.4 10.6 23.5 9.1 9.1 100.0 5.9 2.0 100.0 6.0 1.3 100.0 2.1 100.0 100.0 6.9 1.5 100.0 100.0 100.0 18.8 2.2 4.4 100.0 4.2 2.1 2.1 100.0 -0.0 0 0.2 0.4 0.6 0.8 大~ ~ ~ ~ 于 合计 2~ ~ 0.2 0.4 0.6 0.8 1.0 1.0 2—10 制造业有关业绩指标相关系数矩阵
净资净利净资总资产 主营业每股 每股股东权产 润 产 务收入 收益 净资益比率 收益产 率 净资产收益率 1 净利润 0.248 1 净资产 0.074 0.676 1 总资产 0.052 0.626 0.929 1 主营业务收入 0.072 0.705 0.838 0.910 1 每股收益 0.531 0.602 0.150 0.110 0.193 1 每股净资产 0.277 0.376 0.270 0.188 0.207 0.599 1 股东权益比率 0.311 0.196 0.123 -0.111 -0.081 0.384 0.475 1
从相关系数矩阵看,可以得到以下几点共性的结论:
(1)主营业务收入与总资产、净资产、净利润这些总量指标显著相关,其中与总资产高度正相关。总资产比较大时,主营业务收入也倾向于比较大,而主营业务收入比较大时,净资产、净利润也比较高。这从实际情况看是可以理解的。在正常情况下,制造业的净资产除了货币资金外,主要就存货和厂房、设备等固定资产。尤其是固定资产,使生产活动的物质技术基础,其数量的多少、技术的高低决定了产品的方向及生产方式,从而决定了收入水平,并且决定了净资产的水平。
(2)虽然净资产收益率等于净利润除以净资产,但是净资产除了与净利润微弱相关外,与其他总量指标几乎不相关,也就是说,净资产收益率与资产规模、主营业务收入没有线性关系。主营业务收入水平高低并不决定盈利能力。
(3)几个相对指标之间,净资产收益率和每股收益显著正相关。在绝大多数行业中,这种相关程度均高于制造业总体的相关系数0.53。这一点告诉我们,在说明上市公司经营业绩时,净资产收益率和每股收益两个指标选择其中之一就够了。
(4)每股收益、每股净资产作为总量指标的派生指标,除每股收益与净利润外,其他均与净利润、净资产和总资产微弱相关,说明他们抽象了投入规模的不同,可载的行业、各类型的上市公司之间比较。
(5)一般地,派生指标与他们的分子指标相关系数要高于与它们的分母指标之间的相关系数。例如:净资产收益率与净利润的相关关系属要高于与净资产的相关系数。
(6)就不同行业来看,各指标之间的相关系数均有所差别,表2—11显示:不论从整个制造业还是个行业,主营业务收入、净资产与总资产高度正相关是一致的;在相对指标上产生了分化。其他行业由于主业不明,指标之间相关也很微弱。除此之外,净资产收益率与净利润和每股收益呈现不同程度的相关,机械行业表现得最明显。
表2—11 制造业上市公司行业有关指标的相关系数
行 业 分 类 主营业务收净资产与 净资产收益净资产收益率入与总资产 总资产 率与净利润 与每股收益 C0食品、饮料 0.81 0.90 0.59 0.85 C1纺织、服装、皮毛 0.83 0.86 0.64 0.85 C3造纸、印刷 0.85 0.88 0.55 0.92 C4石油、化工 0.96 0.95 0.36 0.89 C5橡胶、塑料 0.96 0.97 0.88 0.94 金属、非金属 0.88 0.96 0.46 0.90 C7机械、仪表、设备 0.86 0.85 0.27 0.52 C8通信、电子 0.92 0.93 0.37 0.65 C9其他 0.81 0.39 0.08 -0.06 合 计 0.91 0.93 0.25 0.53
2.制造业业绩指标间的回归分析
回归分析是用函数关系近似描述相关关系的表现形式,它反映的是变量之间的一种变动规律。一般地,选择哪种形式的回归模型可以通过:观察散点图;根据专业知识和经验判断。本案例中,除以上两点外,还可以根据相关系数判断,由于皮尔生积矩相关系数是对两变量线性相关程度的侧度,所以对显著相关程度以上的变量可建立线性回归函数来模拟变量间的关系,即:
YB0B1X1B2X2
(1)主营业务收入与总资产的回归分析
由于主营业务收入与总资产的线性相关系数最大,以主营业务收入为因变量Y, 总资产为自变量X,用560家制造业公司数据建立一元线性回归方程:
YB0B1X1
Excel“工具”栏中“数据分析”的“回归”提供了相关和回归分析的结果: Multiple R——相关系数;
R Square——判定系数;
Adjusted R Square——调整的判定系数 1n1np1SSeSS
t 标准误差——估计标准误Sxy; 观测值——X 、Y变量的对数。 方差分析有关指标含义见表2—12。
表2—12 df SS MSSSdfF值 Significance F 回归分析 回归偏差 回归偏差 回归偏差平均自由度 平方和 平方和 FSSR1F(1,n2) 残差 剩余偏差 剩余偏差 剩余偏差平均 SS2 en自由度 平方和 平方和 总计 总偏差 总偏差 总偏差平均 自由度 平方和 平方和
Intercept——截距a;
X Variable——一元回归的回归系数b;
ˆa;回归系数b的标准误差为ˆb; 标准误差——截距a的标准差为 T统计量——对a和b检验时采用的统计量; P-value —— P值;
Lower95%, Uooer95%;——截距a或回归系数b的95%置信峡县、置信上限;此为墨任值,若选择其他置信水平,相应的置信下限、置信上限在后面列出。
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析
回归分析 残 差 总 计 df SS MS F Significance F 1 1.16E+13 1.16E+13 2681.661 2.8E-215 558 2.42E+12 4.34E+09 559 1.41E+13
主营业务收入对总资产的一元线性方程: Y = -13975+0.68X
回归系数说明, 总资产每增加1万元, 制造业主营业务收入平均增加0.68万元. 从判定系数看,在总资产对主营业务收入的影响中, 有83%可以由该线性回归方程解释, 从t检验看,回归系数是显著的.
回归分析中, 对随机误差, 我们要求它均值为0, 并假定其服从正态分布. 从F检验看,假定成立, 从残差分布图看, 其分布是”杂乱无章”的, 回归方程是合适的.
建立回归方程, 不仅为我们描述了主营业务收入和总资产这两个指标间的联系形式,我们利用它还可以进行预报和控制.
给定总资产, 可以对主营业务收入水平作区间估计. 本案例样本较大, 当X=X0时,Y的1-a置信区间:
Intercept X1 Variable Coeffici- 标 准 T 统 下限 上限 ents 误 差 计 量 P值 95.0% 95.0% -13975 3473.233 -4.02362 6.52E-05 -20797.2 -7152.77 0.679562 0.013123 51.78476 2.8E-215 0.653786 0.705339 0.909813 0.82776 0.827451 65866.64 560 ˆY=YZ2SXY
这里的SXY是残差平均平方和MS的平方根, 即”回归统计”表中的”标准误差”或从”方差分析”
ˆ是X=X时回归方程得到的点估计值; Z; Y0例如, 我们想知道, 当X=20万元时, 主营业务收入95%置信区间:
2是给定a时的临界值。
ˆ =-13975+0.68×200000=122025(万元) 点估计值是Y估计值标准误差是残差MS
12 =(4340000000)1/2=65879
主营业务收入置信区间:122025-1.96×65879≤Y≤122025+1.96×65879=-7098~251148 即总资产为20亿元规模时, 估计主营业务收入的上限为25亿元,下限可能是亏损的. (2) 净利润与主营业务收入和每股收益的二元回归分析
由于指标间的关系在不同行业表现各异, 本案例仅研究了C8----通信电子行业. 通信电子行业相关系数矩阵见表2—12
表2—12 通信电子有关业绩指标相关系数矩阵 净资产 收益率 净资产收益率 净利润 净资产 总资产 主营业务收入 每股收益 每股净资产 股东权益比率 1 0.368 0.121 0.102 0.137 0.645 0.432 0.546 1 0.698 0.752 0.758 0.703 0.692 0.340 1 0.938 0.790 0.215 0.628 0.235 1 0.921 0.261 0.673 0.037 净利润 净资产 总资产 主营业务收入 1 0.336 0.682 -0.02 每股 收益 1 0.574 0.444 每股净资产 1 0.405 股东权益比率 1 从定性分析角度知道, 净利润与主营业务收入、总资产、净资产有密切关系,其相关系数又从定量角度给予证明. 另外, 从表中还看到, 净利润与每股收益、每股净资产也表现出了显著正相关的关系, 可能的解释在于: 财务指标不是孤立的,它们之间彼此有直接关系的影响, 同时包含了间接关系的影响. 可以用多元回归研究净利润和其他指标的关系. 但是, 在主营业务收入、总资产、净资产之间存在着高度关系, 研究净利润与多个指标的关系时它们或者可以相互替代, 或者必须删去以避免多重共线性对回归模型的影响. 因此, 这里选择主营业务收入和每股收益(它们之间的相关系数0.34,小于0.5), 建立净利润与主营业务收入和每股收益的二元线性回归方程.
计算结果如下:
回归统计
Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析
回归分析 残 差 总 计 df SS MS F Significance F 2 7.04E+09 3.52E+09 44.23029 1.29E-11 48 3.82E+09 79600902 50 1.09E+10 0.80514 0.64825 0.633594 8921.934 51 Coeffici- 标 准 T 统 下限 上限 ents 误 差 计 量 P值 95.0% 95.0% Intercept 3329.767 1534.467 2.169983 0.034988 244.5164 6415.017 X1 Variable 0.048945 0.005851 8.365005 6.22E-11 0.03718 0.060709 X2 Variable 35.4842 11.39523 3.113951 0.00311 12.57256 58.39583
净利润Y与主营业务收入X1和每股收益X2的线性回归方程为: Y=3329.8+0.05X1+35.5X2
T检验的P值, 除了截距B0的P值稍大, B1、B2的P值均小于0.05, 回归系数是显著的. F检验的结果证明, 模型整体也是显著的, 即净利润与主营业务收入及每股收益整体看存在线性相关关系.
复相关系数0.81, 高于净利润与主营业务收入及与每股收益的单相关系数. 偏相关系数经计算可得:
r.760.70.34y1(2)01(0.7)21(0.34)20.78r0.70.760.34
y2(1)1(0.76)21(0.34)20.72
两个指标对净利润仍旧是正相关的关系, 比较而言, 主营业务收入(X1)的影响更大些。 三、数据整理和分析的客观评价
(一) 案例对560家上市公司1999年报8个财务指标数据整理分析过程的优点
1.整理频数分布的时候首先借助于描述指标的判断, 使统计整理工作有了着眼点当面对纷繁的、大量的原始数据, 总体的分布及数据的分布特征根本无从得知. 因此编制数据的频数分布从那里着手呢? 根据的是什么呢? 当然是数据总体的几个主要特征值:平均数(众数、中位数)、全距、方差、偏度等. 而应用Excel的”数据分析”,这些特征值很容易得到. 掌握了这些特征值, 对分组的组数、组距的确定才有了依据. 所以案例提出的方法, 解决了整理频数分布的可操作性问题。
2.在研究指标(变量)间关系时, 利用相关系数矩阵全面比较判断, 使进一步确定建立回归函数的形式、建立回归模型有了明确的依据。 (二) 几个有待进一步研究的问题
1.频数分布的编制没有固定的模式, 因此不是唯一的, 采用不同的组距、组限, 就有不同的分布数列. 如何评价哪一个数列最恰当或者最确切反映总体分布特征是一个值得研究的问题。
2.统计整理中的制造业行业分组所汇总的统计表, 是按照全行业整理时的组距分组的. 对不同行业来说, 这种组距、组数的划分不一定是最恰当的. 若要研究某一行业情况, 可根据其指标(变量)差异情况另行分组。
3.相关系数矩阵表描述的是一元线性相关系数, 反映的是线性关系的程度. 线性相关系数值很小, 只是说明两指标(变量)间不存在线性相关, 但是否存在非线性相关, 需进一步测定. 本案例中, 通过散点图(图5-6、图5-7)可以发现, 有些指标如主营业务收入和每股收益之间, 就存在非线性关系, 其规律有待进一步研究。
(本案例参考李晓玉编著的《统计描述与相关回归分析》案例)
因篇幅问题不能全部显示,请点此查看更多更全内容