Nội dung được dịch bởi AI, chỉ mang tính chất tham khảo
Triển khai phần cứng của phép biến đổi DST xấp xỉ dựa trên PSO cho tiêu chuẩn VVC
Tóm tắt
Tiêu chuẩn H.266/Chuẩn mã hóa video linh hoạt (VVC), được phát hành vào tháng 7 năm 2020, đã cải thiện hiệu suất mã hóa so với tiêu chuẩn Mã hóa video hiệu suất cao (HEVC) trước đó với sự gia tăng đáng kể về độ phức tạp mã hóa. Những cải tiến trên mô-đun biến đổi chủ yếu liên quan đến việc giới thiệu Biến đổi Đa năng Thích ứng (AMT), điều này đã dẫn đến sự gia tăng thêm về độ phức tạp tính toán. Bài báo này nhằm giảm độ phức tạp mô-đun biến đổi bằng cách xấp xỉ lõi AMT. Phép xấp xỉ biến đổi phải đạt được MSE thấp, năng lượng lỗi tổng thể thấp, biến dạng biến đổi thấp và hiệu suất biến đổi cao. Tối ưu hóa Tập hợp Đàn Bầy (PSO) được sử dụng để giải quyết bài toán tối ưu hóa được mô hình hóa như một bài toán có ràng buộc. Các phép biến đổi xấp xỉ được đề xuất bảo tồn hiệu suất mã hóa tốt so với các phép biến đổi chính xác và cũng yêu cầu độ phức tạp số học ít hơn. Các kiến trúc phần cứng của cả phiên bản chính xác và xấp xỉ của biến đổi DST VII 8 và 16 điểm đã được thiết kế. Các phép biến đổi chính xác được định nghĩa bằng cách sử dụng các bộ nhân và các thiết kế dựa trên MCM. Các phép biến đổi xấp xỉ được mô tả bằng cách sử dụng phép cộng và phép dịch bit. Tất cả các thiết kế đều được triển khai trên thiết bị FPGA Arria 10. Kết quả tổng hợp cho thấy rằng phép xấp xỉ đề xuất tiết kiệm hơn 75% và 63% mức sử dụng logic so với các thiết kế dựa trên bộ nhân và MCM, tương ứng. Tần số hoạt động tối đa đạt 180 MHz, hỗ trợ video 2K và 4K với tốc độ 231 fps và 58 fps, tương ứng.
Từ khóa
#H.266 #VVC #biến đổi DST #PSO #tối ưu hóa #kiến trúc phần cứng #FPGATài liệu tham khảo
Ashraf, S., Saleem, S., Ahmed, T., Aslam, Z., Muhammad, D.: Conversion of adverse data corpus to shrewd output using sampling metrics. Vis. Comput. Indust. Biomed. Art 3(1), 1–13 (2020a)
Ashraf, S., Muhammad, D., Shuaeeb, M., Aslam, Z.: Development of shrewd cosmetology model through fuzzy logic. J. Res. Eng. Appl. Sci. 5(3), 93–99 (2020b)
Ashraf, S., Aslam, Z., Yahya, A., Tahir, A.: Underwater routing protocols: Analysis of intrepid link selection mechanism, challenges and strategies. Int. J. Sci. Res. Comput. Sci. Eng. 8:1–9 (2020c). https://www.isroset.org/journal/IJSRCSE/full_paper_view.php?paper_id=1808
Ashraf, S., Gao, M., Chen, Z., Naeem, H., Ahmad, A., Ahmed, T.: Underwater pragmatic routing approach through packet reverberation mechanism. IEEE Access 8, 163,091–163,114 (2020d)
Ashraf, S.: Towards shrewd object visualization mechanism. Trends Comput. Sci. Inf. Technol. 5(1), 097–102 (2020)
Bross, B.: Versatile Video Coding. (2020) https://www.digitalmedia.fraunhofer.de/content/dam/dcinema/en/documents/ ibc2020/2020_Flyer_Versatile%20Video%20Coding_final.pdf, online; accessed January 2021
Chen, J., Alshina, E., Sullivan, G.J., Ohm, J., Boyce, J.: Algorithm description of joint exploration test model 7 (jem 7). Joint Video Exploration Team (JVET) of ITU-T SG 16 (2017)
Rosewarne, C., Bross, B., Naccari, M., Sharman, K., Sullivan, G.: High efficiency video coding (hevc) test model 16 (hm 16) improved encoder description update 6. Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 24th Meeting: Geneva, Tech Rep (2016)
Chen, J., Karczewicz, M., Huang, Y.W., Choi, K., Ohm, J.R., Sullivan, G.J.: The joint exploration model (jem) for video compression with capability beyond hevc. IEEE Trans. Circ. Syst. Video Technol. (2019)
Mohammadi, A.A., Alizadeh, M.S., Sharifkhani, M.: Jvet encoder complexity analysis. In: 2018 IEEE International Symposium on Circuits and Systems (ISCAS), pp 1–5, (2018). https://doi.org/10.1109/ISCAS.2018.8351442
Cintra, R.J., Bayer, F.M.: A dct approximation for image compression. IEEE Signal Process. Lett. 18(10), 579–582 (2011)
Jridi, M., Alfalou, A., Meher, P.K.: A generalized algorithm and reconfigurable architecture for efficient and scalable orthogonal approximation of dct. IEEE Trans. Circ. Syst. I Regul. Pap. 62(2), 449–457 (2014)
Potluri, U.S., Madanayake, A., Cintra, R.J., Bayer, F.M., Kulasekera, S., Edirisuriya, A.: Improved 8-point approximate dct for image and video compression requiring only 14 additions. IEEE Trans. Circ. Syst. I Regul. Pap. 61(6), 1727–1740 (2014)
Renda, G., Masera, M., Martina, M., Masera, G.: Approximate arai dct architecture for hevc. In: 2017 New Generation of CAS (NGCAS), IEEE, pp 133–136 (2017)
Arai, Y., Agui, T., Nakajima, M.: A fast dct-sq scheme for images. IEICE Trans. (1976–1990) 71(11), 1095–1097 (1988)
Tablada, C., Bayer, F.M., Cintra, R.J.: A class of dct approximations based on the feig-winograd algorithm. Signal Process. 113, 38–51 (2015)
da Silveira, T.L., Bayer, F.M., Cintra, R.J., Kulasekera, S., Madanayake, A., Kozakevicius, A.J.: An orthogonal 16-point approximate dct for image and video compression. Multidimens. Syst. Signal Process. 27(1), 87–104 (2016)
da Silveira, T.L., Oliveira, R.S., Bayer, F.M., Cintra, R.J., Madanayake, A.: Multiplierless 16-point dct approximation for low-complexity image and video coding. SIViP 11(2), 227–233 (2017)
Jridi, M., Meher, P.K.: Scalable approximate dct architectures for efficient hevc-compliant video coding. IEEE Trans. Circ. Syst. Video Technol. 27(8), 1815–1825 (2017)
Jridi, M., Alfalou, A., Meher, P.K.: Efficient approximate core transform and its reconfigurable architectures for hevc. J. Real-Time Image Process. pp 1–11 (2018)
Oliveira, R.S., Cintra, R.J., Bayer, F.M., da Silveira, T.L., Madanayake, A., Leite, A.: Low-complexity 8-point dct approximation based on angle similarity for image and video coding. Multidimens. Syst. Signal Process. pp 1–32 (2018)
Chatterjee, S., Sarawadekar, K.: Approximated core transform architectures for hevc using wht-based decomposition method. IEEE Trans. Circ. Syst. I Regul. Pap. 66(11), 4296–4308 (2019)
Canterle, D.R., da Silveira, T.L., Bayer, F.M., Cintra, R.J.: A multiparametric class of low-complexity transforms for image and video coding. Signal Process. p 107685 (2020)
Chivukula, R.K., Reznik, Y.A.: Fast computing of discrete cosine and sine transforms of types vi and vii. In: Applications of Digital Image Processing XXXIV, International Society for Optics and Photonics, vol. 8135, p. 813505 (2011)
Zhang, Z., Zhao, X., Li, X., Li, L., Luo, Y., Liu, S., Li, Z.: Fast dst-7/dct-8 with dual implementation support for versatile video coding. IEEE Trans. Circ. Syst. Video Technol. (2020)
Cintra, R.J., Bayer, F.M., Madanayake, A., Potluri, U.S., Edirisuriya, A.: Fast algorithms and architectures for 8-point dst-ii/dst-vii approximations. J. Circ. Syst. Comput. 26(03), 1750,045 (2017)
Hamidouche, W., Philippe, P., Mohamed, C., Kammoun, A., Menard, D., Déforges, O.: Hardware-friendly dst-vii/dct-viii approximations for the versatile video coding standard. In: 2019 Picture Coding Symposium (PCS), pp 1–5, (2019). https://doi.org/10.1109/PCS48520.2019.8954535
Kammoun, A., Hamidouche, W., Philippe, P., Déforges, O., Belghith, F., Masmoudi, N., Nezan, J.F.: Forward-inverse 2d hardware implementation of approximate transform core for the vvc standard. IEEE Trans. Circ. Syst. Video Technol. (2019)
Ben Jdidia, S., Belghith, F., Jridi, M., Masmoudi, N.: A multicriteria optimization of the discrete sine transform for versatile video coding standard. Signal Image Video Process. pp 1–9 (2021)
Zeng, Y., Sun, H., Katto, J., Fan, Y.: Approximated reconfigurable transform architecture for vvc. In: 2021 IEEE Int. Sympos. Circ. Syst. (ISCAS), IEEE, pp 1–5 (2021)
Shi, Y.: Particle swarm optimization. IEEE Connect. 2(1), 8–13 (2004)
Parsopoulos, K.E., Vrahatis, M.N., et al.: Particle swarm optimization method for constrained optimization problems. Intell. Technol. Theory Appl. New Trends Intell. Technol. 76(1), 214–220 (2002)
Kennedy, J., Eberhart, R.: Particle swarm optimization. In: Proceedings of ICNN’95-International Conference on Neural Networks, IEEE, vol. 4, pp 1942–1948 (1995)
Jayalakshmi, M., Rao, S.N.: Discrete wavelet transmission and modified pso with aco based feed forward neural network model for brain tumour detection. CMC 65(2), 1081–1096 (2020)
Flury, B.N., Gautschi, W.: An algorithm for simultaneous orthogonal transformation of several positive definite symmetric matrices to nearly diagonal form. SIAM J. Sci. Stat. Comput. 7(1), 169–184 (1986). https://doi.org/10.1137/0907013
Oliveira, P.A., Cintra, R.J., Bayer, F.M., Kulasekera, S., Madanayake, A.: Low-complexity image and video coding based on an approximate discrete tchebichef transform. IEEE Trans. Circ. Syst. Video Technol. 27(5), 1066–1076 (2016)
Haweel, T.I.: A new square wave transform based on the dct. Signal Process. 81(11), 2309–2319 (2001)
Joint-Video-Exploration-Team (2019) JEVT Software Repository. https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/branches/HM-16.6-JEM-7.1-dev/, online; accessed March 2019
Bossen, F., Boyce, J., Suehring, K., Li, X., Seregin, V.: Jvet common test conditions and software reference configurations. JVET-K1010-v1 (2018)
Bjontegaard, G.: Calculation of average psnr differences between rd-curves (2001)
Mert, A.C., Kalali, E., Hamzaoglu, I.: High performance 2d transform hardware for future video coding. IEEE Trans. Consum. Electron. 63(2), 117–125 (2017)