《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 設計應用 > 一種HEVC標準中IDCT變換的FPGA實現
一種HEVC標準中IDCT變換的FPGA實現
2017年電子技術應用第5期
黃友文,董 洋
江西理工大學 信息工程學院,江西 贛州341000
摘要: 為降低新一代高效視頻編碼(HEVC)標準中解碼端多尺寸逆離散余弦變換(Inverse Discrete Cosine Transform,IDCT)中的資源消耗,設計了一種IDCT硬件電路結構。通過使用現場可編程門陣列(Field-Programmable Gate Array,FPGA)內部嵌入式RAM單元進行矩陣轉置運算,從而減少了對內部寄存器的使用。對IDCT系數矩陣進行分解得到不同尺寸下的統一運算電路結構,利用流水線技術實現對運算單元的加速,同時采用并行數據調度減少數據處理等待時間。設計結果表明,設計吞吐量為3.6點/時鐘周期,滿足了4k×2k@30 f/s視頻信號的實時處理需求。
關鍵詞: HEVC IDCT FPGA 嵌入式RAM
中圖分類號: TN919.81
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2017.05.008
中文引用格式: 黃友文,董洋. 一種HEVC標準中IDCT變換的FPGA實現[J].電子技術應用,2017,43(5):38-40.
英文引用格式: Huang Youwen,Dong Yang. An IDCT transform implementation on FPGA in HEVC[J].Application of Electronic Technique,2017,43(5):38-40.
An IDCT transform implementation on FPGA in HEVC
Huang Youwen,Dong Yang
School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China
Abstract: To reduce the mutl-sized IDCT resource consume in the decoder of the new generation HEVC(High Efficient Video Coding),an IDCT processing circuit was proposed.In order to reduce the using of inner registers ,the embedded RAM units in FPGA were used to process the matrix transposition. A uniform circuit architecture of IDCT was derived from the decomposition of coefficient matrix.Pipeline technology was used to speed up the operation.Meanwhile,parallel data schedule will help to reduce the processing latency. Result showed that the throuput is 3.6 points per clock.It can handle 4k×2k@30 f/s video signal.
Key words : HEVC;IDCT;FPGA;embedded RAM

0 引言

    為解決當前主流視頻編碼標準H.264/AVC無法滿足高分辨率視頻和圖像的問題,視頻編碼聯合開發組(Joint Collaborative Team on Video Coding)于2013年1月正式發布了新一代高效視頻編碼標準HEVC(High Efficiency Video Coding),HEVC的目標是在H.264/AVC的基礎上,在相同碼率條件下,提高50%的壓縮率[1]。HEVC標準中采用的是整數逆離散余弦變換(Inverse Discrete Cosine Transform),這樣就防止了采用浮點數在有限數據精度下編碼器與解碼器之間的誤差。

    HEVC支持的IDCT包括4、8、16、32點4種不同尺寸[1],因此,硬件結構的靈活性顯得格外重要。目前已有的設計對全部尺寸的IDCT變換支持不夠全面[2-3],文獻[4]可以實現全部尺寸的IDCT變換,但是由于采用單一IDCT計算單元,不能很好地對視頻信號進行實時處理。

    本文在研究HEVC標準中的IDCT算法之后[9],設計了一種可以統一處理各種尺寸的電路結構。通過對IDCT變換矩陣系數的分解[6],復用小尺寸的變換單元來構建更大的變換單元,采用傳統的移位加進行常系數的乘法,同時優化了移位加中的操作冗余。利用FPGA內部的雙口RAM進行矩陣轉置,減少硬件消耗[5]。為了使設計達到預期的工作頻率,采用流水線技術對其關鍵路徑進行優化,同時設計并行數據調度機制,減少硬件等待時間,提高硬件使用率,使其滿足了實時處理30幀/秒、采樣率為4:2:0的視頻信號的要求。

1 設計總體架構

    整體設計結構如圖1所示,完整的二維IDCT由兩個IDCT運算單元和一個轉置單元組成,為了使系統可以擁有更高的數據吞吐量,采用了經典的全并行結構。考慮到在HEVC解碼器中IDCT模塊需要配合其他相應的模塊進行工作,采用并行的方式輸入,圖1箭頭方向表示數據及控制信號的流動,為了簡明起見,結構圖中省略了時鐘與復位信號。IDCT_1D模塊對數據進行一維IDCT運算,IDCT_2D模塊對數據進行二維IDCT運算,Transpose模塊對內部的數據進行轉置操作,采用這種單向數據流的硬件電路,減少了控制邏輯的復雜度,數據處理過程如下:首先把使能sel信號拉高,模塊開始工作,然后輸入指示數據塊TU的尺寸大小信號blk與數據in0~in31,先按列輸入到一維變換單元IDCT_1D,計算得到的中間結果,經過轉置單元Transpose轉置之后,再在二維變換單元IDCT_2D中進行運算,輸出最終結果,rdy信號表示得到有效計算數據。

wdz2-t1.gif

2 IDCT模塊

    相比H.264/AVC,HEVC支持的整數IDCT尺寸為4×4,8×8,16×16,32×32四種塊尺寸變換[1],圖1中的IDCT_1D模塊與IDCT_2D模塊實現結構類似,不同之處在于兩個模塊輸入的數據位寬,參考HM16.0[7],IDCT_1D輸入位寬為8 bit,即預測圖像與原始圖像的殘差值數據位寬為8 bit,經過Transpose模塊的輸出數據位寬為16 bit,即IDCT_2D輸入數據位寬為16 bit,為了節約硬件資源并保證數據的準確性,在經過IDCT_1D運算之后,參考標準HM模型,數據需要進行截位操作,使其位寬保持在16 bit,這樣就統一了硬件結構與轉置操作過程中所需要的存儲器消耗[6]

    圖2顯示了IDCT運算單元的內部細節,該設計復用了硬件結構,使得在進行較大尺寸的IDCT運算時可以使用較小的IDCT模塊,IDCT32為最終的運算單元,可以進行尺寸為32×32的IDCT運算,其內部的IDCT4、IDCT8、IDCT16,分別完成4×4、8×8、16×16三種運算。

wdz2-t2.gif

    當sel信號高電平有效的時候,表示模塊開始工作,blk配合輸入數據送入到IDCT模塊,其取值為00、01、10、11,分別表示了當前變換塊為4×4、8×8、16×16、32×32的情況。ps_i模塊的作用在于調整輸入數據的順序,如在計算IDCT4的時候,送入IDCT模塊的數據為x0、x1、x2、x3,但是由于復用了硬件模塊,需要經過ps_i模塊調序后變為x0、x8、x16、x24送入內部的IDCT4單元進行計算,在計算IDCT8的時候,在圖2中可以看到,IDCT8模塊復用了IDCT4作為計算單元的一部分,輸入數據為x0、x8、x16、x24,輸出結果作為偶部分,MCM4為4位常系數乘法部分,輸入數據為x4、x12、x20、x28,輸出結果作為奇部分,奇偶部分結果進行簡單的加減操作即可得到最終的結果,IDCT16和IDCT32運算過程與之類似。每次計算開始的時候啟動IDCT32模塊,輸出的結果為32個數據,因此需要ps_o模塊選擇有效數據輸出。

3 Transpose模塊

    進行二維IDCT變換的時候需要在兩個IDCT變換單元之間使用轉置單元對中間結果進行行列轉置操作,本文的轉置操作過程如圖3所示,變換數據塊最大為32×32,所以使用32個16 bit的雙口RAM作為必要的數據存儲單元,為了減少對RAM頻繁操作,采用統一的地址寫入,列變換得到的數據依次寫入不同RAM單元的相同地址,在地址達到指示變換塊上限時,經過一個時鐘周期的延時后,利用模塊內部的有限狀態機FSM(Finite State Machine)按RAM0、RAM1、…、RAM31的順序讀取數據,由于采用了雙口RAM,定義的輸出端口位寬為512 bit,每個周期最多可以讀取32個數據,根據不同的變換塊指示標志,可以實現不同數據塊的轉置操作。

wdz2-t3.gif

3.1 RAM讀取順序

    宏觀上的轉置單元Transpose包含32個RAM,如何合理地讀取RAM是本設計要解決的一個問題,為了實現對不同變換數據塊的靈活操作,在寫入數據的時候,寫入地址單元采用統一地址寫入,即同時寫入多個RAM的相同地址,地址的寫滿通過數據塊尺寸指示標志blk判斷,這樣就簡化了多個地址的寫入控制邏輯。在讀取RAM的時候,使用FSM順序訪問RAM0~RAM31,blk指示當前需要讀取到的RAM編號,根據參考模型HM16.0[9],定義每個數據位16 bit,每塊RAM有512 bit,輸出端口也定義為512 bit,每讀取16 bit即表示一個有效數據,這樣就保證了單周期讀取數據塊的所有行數據。

3.2 并行處理的數據調度

    在全并行的結構中,轉置模塊在處理不同尺寸的數據塊時很容易發生數據覆蓋現象,即下一個數據塊到來的時候,當前數據塊較大時未能全部讀取出來,造成原來數據被下一個到來的數據覆蓋掉的現象。為解決這一問題,本文借鑒計算機指令中的流水線處理方式,數據調度如圖4所示,圖中方塊代表若干時鐘周期,Transpose處理周期中W表示寫入數據,R表示讀取數據,F表示數據轉置完畢,當前數據塊在轉置完成之后,Transpose模塊發出完成信號使能IDCT_2D模塊,即圖4中的F處,同時該信號使能外部的數據輸入單元發送下一數據塊,當前數據進行IDCT_2D運算的時候,下一數據塊進行IDCT_1D運算,這樣兩個IDCT模塊就不存在數據處理的空閑期,硬件利用率大大提高。

wdz2-t4.gif

4 電路仿真與實驗結果分析

    電路結構采用Verilog HDL設計,在Altera Arria II GX EP2AGX190FF35C4芯片上綜合通過,使用Modelsim進行仿真,并與HM標準模型中的結果進行比較,結果一致,證明本文設計的正確性。

    在結構上,DCT與IDCT并無本質的區別,因此本文也選取了DCT的相關文獻作為參考,本文的資源占用率如表1所示。

wdz2-b1.gif

    由表1可以發現,本文設計的結構可以處理HEVC中多種變換塊尺寸,并且擁有較高的吞吐率。文獻[2]擁有較大的數據吞吐量,但是不能很好地處理HEVC中所有的變換塊,文獻[4]、文獻[7]采用面積優先的方式,單周期處理量較小,文獻[8]能夠實現對不同變換塊的一維DCT運算,且效率較高,但是并未對二維DCT變換進行很好地優化。本文在面積與速度之間做了平衡,在滿足實時處理的基礎上,盡可能地減少資源的消耗。設計結果表明,最大延時為41個時鐘周期,模塊固定的流水線延時為9個時鐘周期。為了可以對采樣率為4:2:0、分辨率為3 840×2 160、幀率為30幀/秒的視頻實時處理,滿足設計要求的電路工作時鐘最小為104 MHz(3 840×2 160×30×1.5/3.6)。設計結果完全滿足4k視頻處理的要求。

5 結論

    本文提出了一種整數IDCT變換的FPGA設計,針對IDCT變換矩陣的特點,采用復用模塊的方法減少了硬件消耗。利用FPGA內嵌的RAM資源進行轉置,節約了其內部的寄存器資源,在滿足處理要求的基礎上盡量減少硬件消耗,充分利用結構特點,設計并行數據調度,提高了硬件的使用率,對工程應用具有一定的指導意義。

參考文獻

[1] SULLIVAN G J,OHM J R,HAN W J,et al.Overview of the high efficiency video coding(HEVC) standard [J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1649-1668.

[2] PARK J S,NAM W J,HAN S M,et al.2-D large inverse transform (16×16,32×32) for HEVC(high efficiency video coding)[J].Journal of Semiconductor Technology and Science(JSTS),2012,12(2):203-211.

[3] CONCEICAO R,SOUZA J C,JESKE R,et al.Hardware design for the 32×32 IDCT of the HEVC video coding standard[M].Symposium on Integrated Circuits and Systems Design. Curitiba;IEEE Press.2013:1-6.

[4] SHEN S,SHEN W W,SHEN Y,et al.A unified 4/8/16/32-point integer IDCT architecture for multiple video coding standards[M].IEEE International Conference on Multimedia and Expo.2012:788-793.

[5] 許亞軍,韓雪松,韓應征.AVS二維DCT變換的FPGA實現[J].電視技術,2013,37(11):18-21.

[6] SZE V,BUDAGAVI M,J S G.High efficiency video coding(HEVC)-algorithms and architectures[M].Springer:2014.

[7] TIKEKAR M,HUANG C T,SZE V,et al.Energy and area-efficient harware implementation of HEVC inverse transform and dequantization[M].International Conference on Image Processing(ICIP).IEEE Press.2014:2100-2104.

[8] 楊啟洲,劉一清.基于HEVC的多長度DCT變換的VLSI設計[J].微電子學,2015,45(1):100-103.

[9] Joint collaborative team on video coding(JCT-VC).HEVC Test Model HM-16.0[EB/OL].https://hevc.hhi.fraunhofer.de/trac/hevc/browser/tags/HM-16.0.



作者信息:

黃友文,董  洋

(江西理工大學 信息工程學院,江西 贛州341000)

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区免费| 欧美成人一区二区三区片免费| 亚洲电影视频在线| 亚洲欧美日韩精品综合在线观看| 一区二区三区偷拍| 99精品黄色片免费大全| 日韩网站在线观看| 亚洲日本中文字幕免费在线不卡| 亚洲高清色综合| 亚洲欧洲日韩综合二区| 亚洲电影成人| 亚洲人成人一区二区三区| 亚洲国产美女久久久久| 亚洲国产午夜| 亚洲日本欧美天堂| 一本大道久久精品懂色aⅴ| 亚洲精品久久久久中文字幕欢迎你| 亚洲日本电影| 一区二区日韩精品| 亚洲视频www| 午夜一区在线| 欧美一区日本一区韩国一区| 亚洲第一精品夜夜躁人人躁| 亚洲国产经典视频| 日韩亚洲视频在线| 亚洲一区尤物| 欧美在线一级va免费观看| 久久久亚洲人| 欧美激情第10页| 欧美三级在线| 国产免费成人| 黑人一区二区三区四区五区| 亚洲国产精品久久久久久女王 | 国产亚洲精品7777| 狠狠综合久久| 最新国产成人在线观看| 夜夜精品视频一区二区| 亚洲欧美日韩精品在线| 亚洲国产精品黑人久久久| 亚洲免费电影在线| 亚洲专区一二三| 久久精品色图| 欧美激情综合五月色丁香小说| 欧美性大战xxxxx久久久| 国产视频在线观看一区| 亚洲国产精品va在线看黑人| 99这里有精品| 欧美在线观看视频在线| 亚洲美女性视频| 性欧美在线看片a免费观看| 久久亚洲精品网站| 欧美日韩蜜桃| 国产有码在线一区二区视频| 亚洲日本免费| 欧美一站二站| 一本一本久久a久久精品综合麻豆 一本一本久久a久久精品牛牛影视 | 日韩午夜在线| 欧美一区二区高清| 美女主播一区| 欧美性事免费在线观看| 国产一区在线看| 艳妇臀荡乳欲伦亚洲一区| 性刺激综合网| 一本久久青青| 久久久亚洲欧洲日产国码αv | 在线观看视频欧美| 亚洲一区二区黄色| 最新国产の精品合集bt伙计| 午夜亚洲福利| 欧美日本精品一区二区三区| 国产丝袜一区二区三区| 日韩视频在线观看免费| 久久精品免费| 亚洲欧美日韩系列| 欧美激情第三页| 国模叶桐国产精品一区| 亚洲天堂av在线免费| 亚洲人成人一区二区在线观看| 欧美亚洲一区三区| 欧美日韩美女| 亚洲国产激情| 久久不见久久见免费视频1| 亚洲视频欧美在线| 欧美成人蜜桃| 国产在线国偷精品产拍免费yy| 亚洲视频1区| 一区二区三区视频观看| 欧美1区3d| 国精产品99永久一区一区| 亚洲图中文字幕| 制服丝袜激情欧洲亚洲| 免费日韩av电影| 国语自产精品视频在线看| 亚洲一区久久| 正在播放亚洲| 欧美美女bbbb| 亚洲高清激情| 亚洲国产精品久久久久| 欧美专区日韩专区| 国产精品一区二区三区四区| 这里只有视频精品| 亚洲天堂成人| 欧美日韩欧美一区二区| 亚洲清纯自拍| 亚洲伦伦在线| 欧美成人精品在线观看| 激情一区二区| 欧美专区日韩视频| 久久国产精品色婷婷| 国产精品一二三| 亚洲婷婷综合久久一本伊一区| 亚洲精品中文字| 欧美电影在线观看完整版| 在线精品国精品国产尤物884a| 欧美一站二站| 久久久水蜜桃| 狠狠操狠狠色综合网| 欧美一区影院| 久久人人看视频| 狠狠综合久久av一区二区老牛| 久久精品麻豆| 蜜臀a∨国产成人精品| 在线观看欧美激情| 亚洲欧洲日本国产| 欧美高清影院| 亚洲精品一二| 国产精品99久久久久久白浆小说| 欧美女人交a| 一本综合久久| 亚洲欧美日韩视频二区| 国产精品综合av一区二区国产馆| 亚洲一区二区高清| 久久国产主播| 激情偷拍久久| 亚洲日本无吗高清不卡| 欧美精品二区| 一区二区高清在线观看| 午夜视频一区二区| 国产一区二区三区免费在线观看| 欧美中文字幕在线播放| 老鸭窝亚洲一区二区三区| 91久久精品日日躁夜夜躁国产| 一区二区av在线| 国产精品国产馆在线真实露脸| 亚洲在线黄色| 久久噜噜亚洲综合| 亚洲国产高清在线| 亚洲一区二区三区免费视频| 国产精品日韩欧美一区| 欧美在线视频日韩| 欧美成人精品影院| 一区二区三区精密机械公司| 欧美一区二区日韩| 一区二区在线免费观看| 日韩视频在线免费| 国产精品久久影院| 久久国产免费| 欧美日韩一区二区在线播放| 亚洲一区二区三区中文字幕在线| 久久精品国亚洲| 亚洲肉体裸体xxxx137| 亚洲欧美一区二区三区极速播放| 国产一区二区看久久| 99av国产精品欲麻豆| 国产精品影院在线观看| 亚洲福利视频在线| 欧美日韩在线播放| 欧美在线日韩| 欧美日韩免费观看一区| 性做久久久久久免费观看欧美| 麻豆成人综合网| 亚洲一级一区| 欧美高清视频一区| 亚洲欧美成人精品| 欧美成人免费网| 亚洲伊人一本大道中文字幕| 快播亚洲色图| 亚洲在线成人精品| 欧美激情综合网| 欧美在线你懂的| 国产精品久久久久aaaa樱花| 亚洲承认在线| 国产精品免费一区二区三区观看| 亚洲国产视频直播| 国产精品美女久久久浪潮软件| 亚洲二区视频在线| 国产精品普通话对白| 日韩视频免费在线观看| 国产性色一区二区| 一区二区三区高清| 性久久久久久| 欧美v日韩v国产v| 在线综合亚洲| 美女国产一区| 午夜视频精品| 国产精品久久二区二区| 亚洲人成人77777线观看| 国产情人节一区| 亚洲影院色在线观看免费| 亚洲国产aⅴ天堂久久|