《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 基于StarCore SC140的優化技術

基于StarCore SC140的優化技術

2008-05-06
作者:王麗莉,董金明

  摘 要: StarCore SC140是一款采用指令級并行(ILP)技術的DSP內核,本文從C語言級和匯編代碼" title="匯編代碼">匯編代碼級兩方面探討了其優化方法" title="優化方法">優化方法。
  關鍵詞: DSP SC140內核 優化


  隨著DSP技術的不斷發展和完善, DSP廠商紛紛推出了自己的高級語言編譯器,但編譯器編譯出的匯編代碼在保證正確性的前提下很難兼顧效率。在一些實時性要求比較高的場合(如音視頻處理)必須對某些關鍵的算法和代碼進行優化。StarCore SC140這款DSP內核在體系結構、數據存取及運算上都與傳統的TI系列有明顯的差異,它可以在原來的基礎上應用一些比較有針對性的方法來大幅度提高程序優化效率。本文根據作者在SC140上開發AACPlus_v2音頻解碼器的經驗,著重從C語言級和匯編代碼級兩方面探討其優化方法。
1 StarCore SC140體系結構
  StarCore SC140內核包含三類功能單元:數據算術邏輯單元(DALU)、地址生成單元(AGU)和程序序列器單元(PSEQ)。采用指令級并行技術(ILP),共有6 個執行單元,包括4 個ALU和2個AGU,最多可以同時執行6 條指令,而且支持SIMD。SC140 采用變長執行組(VLES)模型,執行過程以執行組為單位,采用由指令預取、取址、指令分配、地址生成和執行組成的5 級流水線結構。
  SC140采用單一的內存空間,在內存和內核之間有兩組數據總線和一組程序總線,可以同時高速存取兩組數據。
2 SC140的優化技術
2.1 Profile分析
  將高級語言程序代碼用手工匯編優化固然可以降低MIPS消耗,但同時也會帶來工作量的提高及出現改寫錯誤。所以對程序進行Profile分析,找出消耗MIPS比較集中的模塊或函數進行手工匯編優化是十分必要的。
  以音頻編碼器AACPlus_v2為例,消耗MIPS集中的函數,即計算和循環集中的函數,主要包括dit_fft(快速傅立葉變換" title="快速傅立葉變換">快速傅立葉變換)、cplxAnalysisQmfFiltering(分解QMF濾波器)、cplxSynthesisQmfFiltering(合成QMF濾波器)等。
  另外還有一些函數,雖然占據MIPS的比重較大,但本身計算并不是很復雜,只是包含很多的判斷分支。這樣的函數用SC140手工匯編優化的效率很低,可以考慮在程序算法上優化。
2.2 C語言級的優化
  對既有的C代碼進行適當的調整與變換,不僅可以提高編譯效率,也可以為進一步手工匯編優化鋪平道路。
  循環通常是程序中MIPS可以集中消耗的部分,要真正做好循環優化,必須要了解所用DSP的體系結構和特點,做到有的放矢。循環的優化有三類:循環展開、循環合并和循環拆分,其中循環展開是使用頻率最高也是最有效的DSP優化技巧。由于篇幅所限,下面僅針對循環展開來說明具體的優化方法。
  循環展開就是在循環內部對循環體的內容進行重復,從而減少循環次數。這樣做首先減少了循環跳轉的消耗;其次可充分利用StarCore的結構特點,即4個DALU和2個AGU實現并行。當然,這種優化方法需要滿足一定的前提條件:
  (1)前后循環體之間不能存在依賴關系;
  (2)數據排列要滿足邊界關系;
  (3)每個循環體所需要的寄存器不大于DSP可提供的寄存器數;
  (4)循環體的次數是展開因子的整數倍。
  另外有兩個問題需說明:(1)針對SC140進行循環展開,通常取展開因子為4,因為SC140的4個ALU可以實現四條計算指令的并行;(2)若要使用SIMD實現一條指令多個數據存取,就要把存取數據的初地址放到8B的邊界上,這也是根據SC140的數據總線為64位決定的。
2.3 匯編代碼級的優化
  C語言級的優化固然可以使編譯器更有效率,但在復雜操作下,編譯器無法代替人的統籌和分析,生成的代碼會存在明顯的冗余。對于一些關鍵的操作,仍然需要通過手工匯編優化提高其執行速度。
2.3.1 利用硬件方式優化程序
  SC140中可以通過修改狀態寄存器來切換硬件的工作模式。一些常見的DSP算法在這種硬件的支持下可以大大提高優化效率。
  (1)fft倒位序
  在數字信號處理過程中有一類與“順序”相關的操作,如快速傅立葉變換中常用的按時間抽取(dit-fft)算法等,在程序中需要通過地址運算來實現。StarCore SC140針對這些運算提供了硬件尋址方式,減少了程序中的地址操作。
  在數字信號處理中有大量的fft運算,以按時間抽取的基4圖基fft(dit-tukey fft, radix 4)為例,時域倒序輸入,頻域順序輸出。軟件實現程序中有相應的倒序函數(一般是查表算法)來實現時域的倒序,而將其移植到DSP上會發現這一部分非常耗時,甚至與fft本身的算法相差無幾。正是在這樣的前提下,SC140提供了硬件上的倒序進位方式代替軟件倒序算法,提高了fft的執行效率。其精髓就是將順序存放的時間采樣數據存入存儲區內,對該存儲區使用SC140反向進位尋址方式(reverse-carry addressing)。順序和倒序的關系見表1(以32點fft為例)。


  因此,只要對順序存儲的時間數據采用方向進位尋址,就可以輕松實現倒序算法。還有一點值得注意,在反進位的使用中,如fft的輸入為2N點,數據寬度為2M字節,則分配的倒序存儲區起始地址最低(N+M)位均為零,否則會引起尋址錯誤。
  反向進位尋址只要設置MCTL寄存器中相應寄存器的狀態位即可。
  (2)環形存儲
  在實際應用中,常常需要對緩沖區進行環形處理,即處理完數據后再從頭數據繼續處理。如果采用普通的處理方法,則每次尋址都需用軟件將所尋址地址與尾地址進行比較,若超出范圍,則尋址至頭地址。這樣做將非常耗時。為此,StarCore在硬件上支持環形緩沖區的管理。為了使用該功能,需要將環形緩沖區分配到特定的存儲空間。
  環形存儲是通過設置MCTL寄存器相應比特位的值實現的。
  (3)Scale模式的選擇——用硬件完成移位操作
  由于DSP使用定點運算較多,為了精度要求運算中會有大量Scale調整,SC140通過設置硬件的Scale模式,在寄存器向內存存數據的同時完成移位。SC140的Scale模式分為三種:①Scale up:左移一位后存入;②Scale down:右移一位后存入;③no Scale:不移位直接存入。
  該模式通過設置SR狀態寄存器實現。
2.3.2 根據流水線實現并行處理" title="并行處理">并行處理
  SC140支持并行處理是該款DSP內核的一大亮點,下面具體闡述如何運用并行處理提高優化效率。
  (1)改變指令執行順序
  將相互不存在依賴關系的指令并行處理,最大并行量為4個ALU操作和2個AGU操作。這是根據流水線實現并行優化方法的基礎。
  當對某一寄存器同時進行讀和寫操作時,雖然指令流水線中讀和寫同處于“執行”指令周期" title="指令周期">指令周期內,而對時鐘周期來說,讀操作先于寫操作,即遵循先讀后寫的原則。故對同一寄存器先讀取后賦值的操作可以并行于同一指令周期內執行。
  (2)多使用后加
  根據指令執行周期可以看出,[sp + offset]取址模式需要耗費兩個時鐘周期,在實際優化時應盡量少用,而以對sp進行后加直接取址。后加(post increment)取址模式是在對sp直接取址后將指針移到sp+offset的位置,只用一個指令周期即可實現。
  (3)改變循環體的組合方式
  如果遵循“讀操作數-〉計算-〉存結果”的循環順序進行,則由于三個操作有很明顯的依賴及先后關系,使循環無法并行。若人為打亂這個順序,則執行效率會有很大改觀:
  ①將第i次循環結果儲存;②計算第i+1次循環的結果;③取第i+2次循環的操作數。
  此方法只用一個指令周期即可完成循環,較優化前的三個指令周期優勢明顯。
  (4)使用判斷執行代替分支跳轉
  傳統DSP處理判斷分支只能使用分支跳轉指令,而跳轉由于預取指序列都將被重置而非常耗時,尤其是在各個分支執行語句較少的情況下,跳轉的開銷會顯得更難以接受。SC140的指令集中有判斷執行指令IFT/IFF/IFA,對小分支判斷非常有效。
  在音頻解碼器的程序開發中,采用了上述針對StarCore SC140的優化技巧和方法,整個工程的MIPS降低至優化前的16.4%。其中按時間抽取32點基4快速傅立葉變換函數dit_fft完全采用匯編改寫,手工完成代碼337行,平均執行指令周期由優化前的5 643降到優化后的576,取得了明顯的效果。
參考文獻
1 程佩青.數字信號處理教程(第二版)[M].北京:清華大學出版社,2001
2 SC140 DSP Core Reference Manual[EB/OL].www.motorola.corn/sps/dsp,2001
3 SC100 C Compiler User′s Manual[EB/OL].www.metroworks.com,2000

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
欧美亚洲日本网站| 欧美电影在线播放| 99re在线精品| 亚洲精品亚洲人成人网| 久久精品国内一区二区三区| 欧美夜福利tv在线| 亚洲欧美日韩国产综合在线 | 亚洲一区二区三区四区在线观看 | 精品va天堂亚洲国产| 韩国av一区二区三区四区| 国产亚洲一级高清| 国产一区二区三区四区三区四| 国产精品欧美日韩| 国产精品嫩草影院av蜜臀| 国产精品国产三级欧美二区| 欧美午夜精品理论片a级大开眼界| 欧美精品尤物在线| 欧美视频一区二区三区| 国产精品久久久久av免费| 国产精品国产三级国产a| 国产精品久久久免费| 国产精品一区免费视频| 国内精品久久久久久久果冻传媒| 黑人巨大精品欧美一区二区| 在线观看亚洲视频| 91久久夜色精品国产九色| 亚洲美女黄色| 亚洲图片欧洲图片日韩av| 亚洲一区一卡| 欧美在线二区| 亚洲国产三级在线| 夜夜嗨av一区二区三区中文字幕| 亚洲网友自拍| 午夜精品福利视频| 久久久久久999| 欧美激情国产高清| 国产精品第2页| 国产字幕视频一区二区| 亚洲日本va在线观看| 亚洲影视中文字幕| 久久精品亚洲一区二区| 一本色道久久综合亚洲二区三区| 亚洲一区二区三区国产| 久久久久国产精品午夜一区| 欧美国产精品v| 国产精品麻豆va在线播放| 国产日韩欧美一区| 亚洲成人中文| 亚洲午夜久久久久久久久电影院| 欧美一区永久视频免费观看| 亚洲精品网站在线播放gif| 亚洲视频在线看| 久久久久天天天天| 欧美麻豆久久久久久中文| 国产精品丝袜白浆摸在线| 影音先锋亚洲电影| 亚洲视频图片小说| 亚洲高清久久久| 亚洲小说春色综合另类电影| 久久久久天天天天| 欧美午夜三级| 在线不卡欧美| 亚洲视频图片小说| 亚洲精品小视频| 欧美一区激情| 欧美精品一区二区高清在线观看| 国产精品一区二区久久| 亚洲激情在线观看视频免费| 亚洲欧美日韩国产一区| 99精品欧美一区二区蜜桃免费| 久久福利毛片| 欧美视频精品在线观看| 精品盗摄一区二区三区| 在线亚洲免费| 99国产欧美久久久精品| 久久精视频免费在线久久完整在线看| 欧美欧美全黄| 精品91久久久久| 午夜精品一区二区三区在线视| 亚洲视屏一区| 欧美成人午夜激情在线| 国产日韩欧美日韩| 艳妇臀荡乳欲伦亚洲一区| 亚洲人www| 久久精品人人做人人爽电影蜜月| 欧美特黄一级大片| 亚洲国产一区二区三区在线播| 久久成人国产精品| 午夜一区二区三区在线观看| 欧美人交a欧美精品| 一区二区亚洲精品| 午夜亚洲福利在线老司机| 亚洲欧美日韩一区二区| 欧美精品电影| 亚洲国产精品成人精品| 欧美在线一区二区| 欧美一区二区视频在线| 国产精品久久久久久久久搜平片| 亚洲日本成人网| 日韩天堂在线观看| 欧美成人一区在线| 伊人成年综合电影网| 欧美中文字幕第一页| 欧美专区中文字幕| 国产精品色网| 亚洲无毛电影| 亚洲综合色婷婷| 欧美天天影院| 日韩视频免费在线| 一本大道av伊人久久综合| 欧美成人免费大片| 亚洲电影av在线| 亚洲精品综合久久中文字幕| 欧美jizz19hd性欧美| 在线日韩av片| 亚洲日本va午夜在线电影| 免费亚洲婷婷| 亚洲黄网站黄| 亚洲最新合集| 欧美视频一区二区三区在线观看| 日韩一级网站| 亚洲欧美激情诱惑| 国产精品自在欧美一区| 性欧美大战久久久久久久免费观看 | 国产视频精品网| 欧美怡红院视频一区二区三区| 久久激情中文| 国内综合精品午夜久久资源| 久久精品人人做人人爽电影蜜月| 久久免费视频网| 黄色小说综合网站| 亚洲区在线播放| 欧美日韩国产va另类| 一区二区三区不卡视频在线观看 | 久久免费国产精品| 在线播放日韩| 亚洲精品一区二区在线| 欧美日韩一区二区欧美激情| 亚洲一区二区三区乱码aⅴ| 欧美在线精品一区| 激情五月综合色婷婷一区二区| 亚洲人成在线播放网站岛国| 欧美理论视频| 亚洲一区二区三区成人在线视频精品| 欧美综合国产| 在线观看亚洲精品| 一区二区三区四区精品| 国产精品视频九色porn| 久久xxxx| 欧美极品欧美精品欧美视频| 在线亚洲国产精品网站| 久久久久www| 亚洲黑丝一区二区| 亚洲影院高清在线| 国模套图日韩精品一区二区| 日韩香蕉视频| 国产乱码精品一区二区三| 亚洲国产99精品国自产| 欧美日韩无遮挡| 欧美一级片在线播放| 欧美1区2区3区| 亚洲精品字幕| 欧美性片在线观看| 亚洲综合日韩| 久久综合网络一区二区| 亚洲国产电影| 亚洲综合电影| 黄色小说综合网站| 一区二区三区日韩欧美精品| 国产麻豆视频精品| 亚洲精品乱码| 国产精品欧美经典| 最新日韩精品| 国产精品乱码一区二三区小蝌蚪| 久久激情婷婷| 欧美日韩在线精品| 欧美在线综合| 欧美四级剧情无删版影片| 久久国产直播| 欧美丝袜第一区| 亚洲二区视频| 国产精品裸体一区二区三区| 亚洲国产综合视频在线观看| 欧美系列一区| 亚洲人成77777在线观看网| 国产精品美女一区二区| 亚洲人午夜精品免费| 国产精品一区视频| 一本久道久久综合婷婷鲸鱼| 国产亚洲精品一区二区| 在线亚洲观看| 在线电影国产精品| 欧美一区二区在线播放| 亚洲精品精选| 久久躁日日躁aaaaxxxx| 亚洲一区二区三区久久| 欧美日本簧片| 亚洲国产欧美一区| 国产亚洲毛片在线| 亚洲综合色丁香婷婷六月图片|