512 FP32 ALU是A630的规格在极客圈里传了也不知多久了,我之前也发过详细数据的帖子http://tieba.baidu.com/p/5838758474 ,这次A640大家也相应的说是768 FP32 ALU,看了一些测试后我也认为是的http://tieba.baidu.com/p/6013948361,可实际测下来发现烤机ALU利用率并不是81.6%这个值偏低,zhu神告诉我用SnapdragonProfilerSetup测过高通GPU的ALU利用率通常91%~93%,另外也还有GPU吧吧主的详细测试http://tieba.baidu.com/p/5499887524
那么594GFlops到底是多少规格在710MHz下跑的,这个算了很多发现结果很奇怪,高通GPU的FP32烤机我大部分都是以91.75%的利用率来推算,594÷2÷0.71÷0.9175≈455.9,数值是很奇怪吧,456 FP32 ALU?没错,不出意外就是了,刚好又是4的倍数,A640多了50%应该就是684 FP32ALU,684×0.585×2×0.9175≈734.25刚好也是855烤机Vec4 MAD FP32模式的浮点,同时也刚好是4的倍数。
至于FP16 ALU的个数(Adreno的FP32和FP16是分开的,和大多数PC显卡类似),还未推算出符合官方PPT宣传50% ALU数值,因为现在A640算出FP16 ALU的数量是大于A630的1.5倍的,A630烤机Vec4 MAD FP16模式测出688.5GFlops,按照FP16的利用率93%~95%算大概是512 FP16 ALU,A640测出的FP16是887GFlops,之前的5系测了很多发现FP32和FP16 ALU数比值都是1:2,还不清楚6系的FP32:FP16的关系。





那么594GFlops到底是多少规格在710MHz下跑的,这个算了很多发现结果很奇怪,高通GPU的FP32烤机我大部分都是以91.75%的利用率来推算,594÷2÷0.71÷0.9175≈455.9,数值是很奇怪吧,456 FP32 ALU?没错,不出意外就是了,刚好又是4的倍数,A640多了50%应该就是684 FP32ALU,684×0.585×2×0.9175≈734.25刚好也是855烤机Vec4 MAD FP32模式的浮点,同时也刚好是4的倍数。
至于FP16 ALU的个数(Adreno的FP32和FP16是分开的,和大多数PC显卡类似),还未推算出符合官方PPT宣传50% ALU数值,因为现在A640算出FP16 ALU的数量是大于A630的1.5倍的,A630烤机Vec4 MAD FP16模式测出688.5GFlops,按照FP16的利用率93%~95%算大概是512 FP16 ALU,A640测出的FP16是887GFlops,之前的5系测了很多发现FP32和FP16 ALU数比值都是1:2,还不清楚6系的FP32:FP16的关系。




