Artykuł opisuje algorytm wyboru trybu predykcji wewnątrzobrazowej dla standardu H.265/HEVC. Przedstawione rozwiązanie zostało opracowane celem wykorzystania w sprzętowych koderach czasu rzeczywistego, co oznacza uwzględnienie problemów związanych z opóźnieniem pętli rekonstrukcji oraz skalowalnością obliczeniową. Wpływ algorytmu na efektywność kompresji został zbadany dla różnorodnych sekwencji wideo o rozdzielczościach od 416×240 do 3840×2160.
The article presents an intra mode decision algorithm for the H.265/ HEVC standard. The proposed solution was designed to satisfy the requirements of the real time hardware encoders, presenting an efficient solution for problems associated with the reconstruction loop delay and computational scalability. The influence of the proposed algorithm on the compression efficiency was examined for the various video sequences with resolutions ranging from 416×240 to 3840×2160.
Artykuł opisuje architekturę sprzętowego modułu predykcji wewnątrzramkowej (Intra) dla standardu H.265/HEVC. Umożliwia ona przygotowanie predykcji dla dowolnego trybu i rozmiaru jednostki predykcji. Aby zminimalizować zużycie zasobów każde z wymaganych mnożeń jest wykonywane za pomocą multiplekserów i sumatorów. Architektura może pracować z częstotliwością 100 MHz przy syntezie dla układów FPGA Stratix III oraz z częstotliwością 200 MHz przy syntezie dla technologii TMSC 0,13 μm.
This work presents an Intra prediction architecture, fully compliant with the H.265/HEVC standard. The design supports full range of features included in the standard i. e. all Prediction Unit sizes and all modes. To minimize the resources consumption any required multiplication is carried out using multiplexers and adders. The architecture can operate at 100 MHz and 200 MHz for FPGA Stratix III devices and the TSMC 0.13 μm technology, respectively.
Techniki wyspecyfikowane w standardach kompresji wideo pozwalają usunąć mniej istotne informacje z przetwarzanego materiału wideo przy ograniczeniach na stopień kompresji. Operacja ta jest przeprowadzana w module kwantyzacji, podczas gdy dekwantyzacja odtwarza dane wejściowe z pewnym błędem. Moduły te mogą zużywać znaczną ilość zasobów sprzętowych, gdy koder implementowany jest w układach scalonych. W artykule opisano metody optymalizacji architektur FPGA przeznaczonych dla tych modułów. Metody te pozwalają na lepsze wykorzystanie zasobów dostępnych w jednostkach DSP i zmniejszenie liczby elementów logicznych ogólnego przeznaczenia. Różne wersje architektur zostały opracowane dla układów FPGA, aby pokazać wpływ proponowanych optymalizacji na zasoby. Wyniki implementacji pokazują znaczna redukcję logiki ogólnego przeznaczenia. Co więcej wykorzystanie rejestrów wbudowanych w jednostkach DSP podwaja maksymalne częstotliwości pracy.
Techniques specified in video compression standards allow the removing of less important information from a processed video subject to bit-rate constraints. This operation is performed in the quantization module, whereas the dequantization restores input data with a certain error. The modules can consume a significant amount of hardware resources when the video encoder is implemented in integrated circuits. This paper presents optimization methods for FPGA architectures dedicated for the modules. The methods allow a better utilization of resources available in DSP units and the reduction of the number of general-purpose logic elements. Different versions of architectures are developed for FPGA devices to show the impact of proposed optimizations on resources. Implementation results show that the significant reduction of general-purpose logic is achieved. Furthermore, the utilization of registers embedded in DSP units can double the maximal clock frequency.
This paper describes a new measurement method (VS model) for determining the quality of online video services relying on modern H.265/HEVC and VP9 codecs. The said method has been developed on the basis of VQuad-HD curves (according to ITU-T J.341). This model does not refer to signal analysis, but protocol analysis instead. The parameters used are: type of video codec, encoding rate, transport technique, packet loss and burst size. The method may be implemented quickly and easily, which is one of the great advantages when using this method to measure QoS.
Nowadays, most content creators focus on distributing rich media at the highest possible resolution. Currently, the majority of sold consoles, media players, computer hardware, as well as displays and TVs are advertised as 4K-compatible. The same trend is observed in the case of popular online streaming services and terrestrial TV broadcasts. Generally speaking, it is assumed that higher bitrates provide higher subjective judgements. In this paper, we present the results of a user experience (UX) evaluation study on the quality of video content coded and transmitted in different resolutions in the internet protocol (IP) environment. The image resolutions include 1K (1920×1080 pixels; full-HD), 2K (2560×1440 pixels; wide-QHD), and 4K (3840×2160 pixels; ultra-HD) content that are processed in the H.265/HEVC (high-efficiency video coding) format. A subjective evaluation is carried out in a laboratory consisting of 20 iMacs with a 21.5-inch 4K Retina (4096×2304 pixels) display. The group of viewers included 28 individuals aged between 21‒35 years old, comprising people with and without visual impairments. The obtained UX results are compared with previous experiments, including both objective quality of service (QoS) and subjective quality of experience (QoE), as well as the impact of downscaling to 1K from 2K and 4K. The outcomes of this study may be of particular interest to any party interested in video content processing and distribution, as well as consumption and storage.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.