Decoder video MPEG-4 berperan sebagai input aliran data, deretan teratur bit-bit yang mewakili deretan gambar video yang didecodekan. Aliran data memuat informasi tersusun pada struktur deretan gambagr video, yang sepadan dengan MPEG-4 Video International Standard 14496-2. Aliran data mulai memaparkan bagian video, yang merupakan bagian gambar video yang dibentuk dari satu atau lebih struktur sintaksis yang mengidentifikasi objek video. Objek video mewakili sebuah objek yang dimuat dalam deretan gambar video dan dapat didekodekan menjadi satu atau lebih lapisan objek video. Lapisan objek video merupakan suatu struktur sintaksis yang mengidentifikasi aliran datanya sendiri dan mengizinkan untuk mendapat deretan yang dapat diskalakan. Perangkat objek video adalah struktur selanjutnya yang mengidentifikasi timbulnya objek video tunggal pada waktu singkat. Suatu Video Object Plane (VOP) dibuat dari beberapa blok makro, setiap blok makro dibangun oleh 8 x 8 blok luminan, krominan dan sering juga kejernihan nilai-nilai piksel.
Aliran data input memuat informasi tentang tekstur, gerak, dan struktur setiap VOP Bentuk informasi mengidentifikasi objek yang dipersingkat dalam VOP. Informasi gerak mengurangi pemborosan waktu sementara deretan gambar video, menghubungkan blok makro dari VOP yang sekarang dengan blok makro yang dibangun sebelumnya. Tekstur informasi didecodekan dengan menggunakan suatu algoritma yang mengurangi pemborosan ruang.
Proses decode tekstur didapat dengan pertama kali menerapkan semua algoritma Very Length Decoding (VLD) yang mengekstraksi code word dari tabel Huffman. Kemudian inversi algoritma scan membangun kembali blok 8 x 8 dari array koefisien-koefisien yang dikuantisasi. Setelah inversi algoritma prediksi AC & DC dan inversi algoritma kuantisasi, suatu Inverse Discrete Cosine Transform (IDCT) diterapkan dalam blok 8 x 8. Dalam proses decode tekstur digambarkan bahwa komputasi operasi yang lebih intensif adalah VLD dan IDCT. Decoder yang digambarkan di bawah ini memperlihatkan berapa besar biayan operasi VLD dan IDCT untuk waktu decode.
Algoritma kompensasi gerak adalah proses decode lain yang mahal. Algoritma ini membangun kembali setiap blok makro yang bermula dari blok makro yang berhubungan terhadap VOP yang dibanguan kembali sebelumnya. Jika blok makro yang berhubungan ini tidak sama (dalam ambang tertentu) dengan blok makro yang sekarang, suatu prediksi informasi error diekstraksi dari aliran data dan didecode dengan menggunakan algoritma decode tekstur. Dalam hal ini blok makro yang sekarang didapat sebagai penjumlahan dari blok makro (yang berhubungan) dengan blok makro yang dibangun kembali mendecode prediksi yang salah.
Untuk mengidentifikasi modul yang paling diharapkan, telah ditunjukkan implementasi perangkat lunak decoder video MPEG-4. Deretan pengujian yang digunakan mempunyai lapisan tunggal dan empat persegi panjang VOP (VOP berisi objek empat persegi panjang, bentuk tanpa informasi). Pengujian decoder telah dilakukan pada Pentium II 266 MHz, untuk mengetahui kekurangan pada proses VLIW. Telah diperkirakan sebelumnya bahwa waktu komputasi pada Pentium II adalah proporsional terhadap waktu komputasi pada VLIW.
Dari http://www.informatika.lipi.go.id