三台机器实际性能相同。
2. 解:加速比y与向量化比例x之间的关系是:y=1/((1-x)+x/8)=1/(1-7x/8)……(A) (1)
876321010.90.80.70.60.50.40.30.20.10(2) 在式(A)中令y=2,可解得x=4/7≈57.14%。
此时向量模式运行时间占总时间比例是((4/7)/8)/(3/7+((4/7)/8))=1/7=14.29% (3) 硬件方法,整体加速比为1/(1-0.7*(1-1/16))=2.91
软件方法,设相同加速比下向量化比例为x,即1/(1-7x/8)=2.91, x=0.75 所以推荐软件方法。 3. 解:
(1) MIPSEMUL=(I+F×Y)/(W×10);MIPSFPU=(I+F)/(B×10) (2) 120=(I+8×10×50)/(4×10) => I=80×10 (3) 80=(80×10+8×10)/(B×10) => B=1.1
(4) MFLOPS=F/((B-((W*I)/(I+F*Y))) ×10)≈18.46 (5) 决策正确,因为执行时间缩短了,这才是关键标准。 4. 解:
(1) y=12.29386-0.18295x+0.0015x (2) y=342.47443-6.36386x+0.02727x 5. 解:
1.1V下静态功耗1.1*1.1/(1.05/0.5)=0.576W 1.1V下1GHZ时动态功耗为1.1*2.5-0.576=2.174W 1.1V下0.5GHZ功耗功耗为2.174*0.5/1=1.087W 1.1V下0.5GHZ总功耗为1.087+0.576=1.663W
22
6
6
6
6
6
6
6
6
6
6. 解:
a) 先证明N=2k时,正数(a1a2当
2k-1 , aN)/NNa1a2令 aN。对k进行数学归纳法即可。 aN)/N2ka(kA(a1a2,则 A(N1a2a)Nk/a1k(NNk2ak2(ak)1。若N2N))N2/Aa1a2aNA,A2a1a2aNA(2N)2kANA(2N)A,矛盾。因此当当2k-1 b) 证:假设参考机的程序分值为Z={Z0,Z1,序个数; 而A机器的程序分值为X={x0,x1, B机器的程序分值为Y={y0,y1,则有: A机器的性能为:n,Zn1},其中n为SPEC CPU2000中的程 ,xn1} ,yn1} x0*x1**xn1y*y**yn1 ,B机器的性能为:n01 Z0*Z1**ZnZ0*Z1**Zn从而,A与B机器的性能比为: nx0*x1**xn1Z0*Z1**Zny0*y1**yn1Z0*Z1**Znnnx0*x1*y0*y1**xn1 *yn1可见,其结果与参考样机无关。故得证。 7. 解: AMD 4核Barcelona,2.8G,3发射每个核1个128位浮点向量功能部件和1个128位浮点加法向量部件,峰值性能4*4*2.8=44.8GFlops。 2路L1I KB;2路L1D KB 3 latency;16路L2 512KB;32路2MB共享L3,内存带宽21.34GB/s Intel 4核Nehalem(i7),2.5G-3G,4发射每个核1个128位浮点向量功能部件和1个128位浮点加法向量部件,峰值性能4*4*3=48GFlops。4路L1I 32KB;4路L1D 32KB 4 latency;8路256KB L2 12 latency;16路8MB L3 30-40 latency;内存带宽31.92GB/s 运行SPEC测试: 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务