您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页计算机系统结构(中科院 胡伟武 2016)课后习题答案 第二章

计算机系统结构(中科院 胡伟武 2016)课后习题答案 第二章

来源:意榕旅游网
1. 解:A为10MIPS,B为20MIPS,C为40MIPS。

三台机器实际性能相同。

2. 解:加速比y与向量化比例x之间的关系是:y=1/((1-x)+x/8)=1/(1-7x/8)……(A) (1)

876321010.90.80.70.60.50.40.30.20.10(2) 在式(A)中令y=2,可解得x=4/7≈57.14%。

此时向量模式运行时间占总时间比例是((4/7)/8)/(3/7+((4/7)/8))=1/7=14.29% (3) 硬件方法,整体加速比为1/(1-0.7*(1-1/16))=2.91

软件方法,设相同加速比下向量化比例为x,即1/(1-7x/8)=2.91, x=0.75 所以推荐软件方法。 3. 解:

(1) MIPSEMUL=(I+F×Y)/(W×10);MIPSFPU=(I+F)/(B×10) (2) 120=(I+8×10×50)/(4×10) => I=80×10 (3) 80=(80×10+8×10)/(B×10) => B=1.1

(4) MFLOPS=F/((B-((W*I)/(I+F*Y))) ×10)≈18.46 (5) 决策正确,因为执行时间缩短了,这才是关键标准。 4. 解:

(1) y=12.29386-0.18295x+0.0015x (2) y=342.47443-6.36386x+0.02727x 5. 解:

1.1V下静态功耗1.1*1.1/(1.05/0.5)=0.576W 1.1V下1GHZ时动态功耗为1.1*2.5-0.576=2.174W 1.1V下0.5GHZ功耗功耗为2.174*0.5/1=1.087W 1.1V下0.5GHZ总功耗为1.087+0.576=1.663W

22

6

6

6

6

6

6

6

6

6

6. 解:

a) 先证明N=2k时,正数(a1a2当

2k-1

aN)/NNa1a2令

aN。对k进行数学归纳法即可。

aN)/N2ka(kA(a1a2,则

A(N1a2a)Nk/a1k(NNk2ak2(ak)1。若N2N))N2/Aa1a2aNA,A2a1a2aNA(2N)2kANA(2N)A,矛盾。因此当当2k-1时,(a1a2aN)/NNa1a2aN。

b) 证:假设参考机的程序分值为Z={Z0,Z1,序个数;

而A机器的程序分值为X={x0,x1, B机器的程序分值为Y={y0,y1,则有:

A机器的性能为:n,Zn1},其中n为SPEC CPU2000中的程

,xn1} ,yn1}

x0*x1**xn1y*y**yn1 ,B机器的性能为:n01

Z0*Z1**ZnZ0*Z1**Zn从而,A与B机器的性能比为:

nx0*x1**xn1Z0*Z1**Zny0*y1**yn1Z0*Z1**Znnnx0*x1*y0*y1**xn1 *yn1可见,其结果与参考样机无关。故得证。 7. 解:

AMD 4核Barcelona,2.8G,3发射每个核1个128位浮点向量功能部件和1个128位浮点加法向量部件,峰值性能4*4*2.8=44.8GFlops。 2路L1I KB;2路L1D KB 3 latency;16路L2 512KB;32路2MB共享L3,内存带宽21.34GB/s

Intel 4核Nehalem(i7),2.5G-3G,4发射每个核1个128位浮点向量功能部件和1个128位浮点加法向量部件,峰值性能4*4*3=48GFlops。4路L1I 32KB;4路L1D 32KB 4 latency;8路256KB L2 12 latency;16路8MB L3 30-40 latency;内存带宽31.92GB/s

运行SPEC测试:

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务