自动化在线 自动化在线 数据加载中... 数据加载中...
首页 | 下载系统 | 供求信息 | 新闻系统 | 企业信息 | 产品信息 | 展会信息 | 论坛
首页 > 新闻系统 > 电子技术 > 方案 > 微处理器与DSP
 
基于TMS320DM642的MPEG4编码器的设计与实现
作者:刘建 关华   发布时间:2007-10-28 06:49:40 来源:现代电子技术/ 繁体版

  3.2 代码优化

  为提高代码执行效率,必须结合DSP的特点对代码进行优化,优化主要分为3个层次:

  3.2.1 项目级优化

  TI提供了功能强大的集成开发环境CCS,包含了各种高效的编译工具,在代码编译过程中,通过使用编译器提供的编译选项(如-o3和-pm等),编译器可自动改善代码结构,减少代码中指令的相关性,通过软件流水等方法,提高指令并行性,改善循环性能,并可以优化代码的尺寸。

花费的时钟周期数比较

  3.2.2 C语言程序级优化

  通过使用CCS中的profile工具,对C代码进行评估,找出运算量最大的程序段,如DCT、量化、运动估计等,这部分代码的优化对提高编码器性能有显著影响,我们采用了以下C程序级优化方法:

  (1) 使用C6000 DSP特有的关键字和内联函数来改写C代码,如使用关键字restrict可消除数据间的相关性以提高代码并行执行能力,而使用内联函数(如_add2(),nassert())可快速优化C代码,作为直接映射为内联C6000指令的特殊函数,可提高代码在DSP中的执行效率。

  (2) 使用整型访问短型数据,使用32位整型一次访问2个16位短型数据,分别存放在32位寄存器的高、低16位字段,可减少对内存的访问次数,将程序读取数据的效率提高一倍,再使用能同时对2个寄存器对应高低16位进行操作的内联函数,如add2();mpy2()等,可大大提高代码执行效率。 本文相关DataSheet:     

  (3) 采用循环展开的方法,将多循环变为少循环甚至单循环,减少循环嵌套,消除冗余循环,可以提高指令并行执行的程度。

  (4) 没有专门的硬件除法运算单元,除法都用连续减法实现,运算量比较大,所以要尽量减少除法运算,不能减少的除法用移位运算来实现,可减少运算耗时。

  (5)使用TI图像库函数。TI提供了功能强大的IM-AGE库支持,包括了很多图像处理常用函数,如8×8子块的DCT变换(IMG_fdct_8×8)、SAD计算(IMG_sad_8×8),这些函数都是优化过的,代码效率很高,可直接应用到程序中。

  3.2.3 汇编程序级优化

  线性汇编语言是C6000系列DSP所特有的一种编程语言,类似汇编,但不需要给出指令使用的功能单元、寄存器、并行性等细节信息,汇编优化器可根据代码情况自动确定。我们将代码中运算量大、调用频率高的关键部分用线性汇编进行了改写,如量化、DCT、SAD等模块,进一步优化了循环迭代、提高了指令的并行性效果。表2给出了改写前后几个函数模块程序对3帧foreman.qcif测试序列编码时消耗的时钟周期数对比。

汇编程序级优化效果比较

  3.3 存储空间的配置

  DSP的片上存储空间有限,编码器要处理的大量视频数据(包括当前帧和参考帧等图像)必须放在片外,而CPU访问片外的速度要比访问片内慢很多。利用DM642的EDMA功能,CPU对前一帧数据编码的同时,通过ED-MA通道提前将片外的数据搬移到片上内存,二者并行工作,提高了数据由片外传输至片内的效率,可减少CPU等待时间。

  
评论】【加入收藏夹】【 】【打印】【关闭
来顶一下
近回首页
返回首页
※ 相关信息
无相关信息
关键:

※ 其他信息
基于MSP430的智能仪表与组态王的通讯设计
基于单片机PIC18F66J10的主动放线机设计
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

 
 搜索新闻
 最新新闻
·航天测控公司推出PXI-E模块
·2009第六届中国唐山国际工业
·FL 引领KVM市场潮流---全新推
·2008第三届中国(郑州)国际
·伺服器维修,伺服驱动器维修,
·新售经济型16路无纸记录仪
·2008第二届中国郑州城市供热
·华北工控新型机箱获国家知识
·华北工控加入深圳市质量协会
·华北工控工业平板电脑,服务
 热点新闻 
·PLC课程设计课题——三层电梯
·先进控制技术及应用
·CK6432(FANUC-0TD)数控车床
·变频器原理
·一般变频器常见故障及处理
·集成温度传感器AD590及其应用
·基于PLC的机械手控制设计
·谈步进电机的PLC控制方法
·3G无线接入网IP化传送承载方
·浅谈单相电度表的反转
数据加载中..

网站地图
Autooo.Net 版权所有
Copyright © 2007 All rights reserved