TI全新TMS320C66x定点与浮点DSP内核成功挑战速度极限
>>>>>>>>白皮书
作者:ArnonFriedmann
战略营销总监
序言
德州仪器(TI全新TMS320C66x数字信号处理器(DSP内核不仅为屡获殊荣的C64x+™指令集架构(ISA带来了显著的
性能提升,同时还在同一处理内核中高度集成了针对浮点运算的支持。浮点处理技术首次能够用于传统上仅能满足定点处理运行速度要求的处理器中。该C66xDSP的ISA同时支持单精度和双精
度浮点操作,并全面兼容IEEE754标准。这一完美组合造就了无与伦比的DSP,能够在完全无损定点或浮点功能的情况下将浮点优势引入高速嵌入式架构中。与其它很多可提供浮点协作单元的嵌入式处理器不同,TI最新C66xDSP内核直接将浮点指令集嵌入到C64x定点指令集中。在C66xCPU上,用户可以选择逐条执行浮点、定点指令,因为在C66x中浮点与定点运算能力已经被完全集成在一起。正是由于这样,到底使用定点DSP还是浮点DSP已不再是设计上的挑
战,因为C66xDSP做到了双全其美。
与浮点TI全新TMS320C66xDSP内核成功挑战>>>>>>>>定点速度极限
在同一DSP内核中集成定点与浮点功能将使嵌入式系统算法的开发与部署方式发生根本性变革。这听起来似乎有点夸大其辞,不过事实的确如此。在定点数字系统中实施算法所付出的艰辛是不可估量的。但充分满足对速度的需求又使这一工作势在必行,因为到目前为止市面上还没有任何可供使用的快速浮点DSP。我们能够轻松、便捷地将采用Matlab等浮点运算工具开发的算法移植到DSP中,而无需费力转换为定点方式处理。借助TI新型C66xDSP的浮点计算能力,大多数转换工作已显得没有任何必要。
对二进制数字表示的回顾
包含TIDSP等在内的所有数字处理器均采用带比特串(0和1组成)的二进制形式表示数字。数字表示精度取决于所使用的比特位数和表示格式两个方面。定点系统使用比特表示一个固定取值范围,这些值既可以是整数,也可以是具有固定数量的整数及小数位的数字。动态取值范围因而显得十分有限,而且超出设定范围的值必须达到端点。
定点处理器通常采用每秒乘法计算次数表示其16位运算性能。为了充分利用处理器的处理能力(例如,为获得其宣称的全部性能),为这些处理器开发的算法不得不在一系列预先确定范围的数字上进行操作。在定点实施过程中无法高效执行难以预知范围或变化幅度大的数据集。
浮点表示通过采用科学计数法来提供更广的动态范围,从而可使用尾数(或叫有效数字)及指数进行表示。C66x内核可对32个比特位表示的数值实施单精度浮点运算,其采用的表示形式如下:(-15×M×2(N-127,其中S表示符号位,M表示尾数或有效数字位,而N则表示指数。S只有一个比特位,N有8个比特位,而M以23个比特位表示。这样,数字表示范围为2-127-2128,并具有24比特精度的有效位。相比而言,16比特位的定点算法仅能表示216个数值(从0到65535),故其内在数字表示的可变范围要小很多。所以当数据集或工作在该数据集上的算法不可预知、动态变化幅度很大的情况下,浮点数字表示法更受青睐。另外很重要的一点是,有效数字始终以‘1’作为第一个数字,因此其数值始终保持24位精度。
>>>>2
德州仪器
TI如何创造性地在同一内核中同时集成浮点与定点技术
>>>>>最新C66xDSP内核——图1显示的C64x+DSP是TI最新C66xDSP的前代产品。该内核由两个对称的部分(A&B组成,每部分具有四个功能单元。一个.M单元包含4个16位乘法器。
C64x+>>>>™DSP
D
L
D
L
RegisterfileS
M
Register