Couplage entre un modèle macroscopique et une loi de poursuite

Modèle hybride fondé sur un modèle générique de second-ordre GSOM

5.5 Validation du schéma de couplage

5.2.1 Couplage entre un modèle macroscopique et une loi de poursuite

O compressor de vídeo apresentado (figura 4.8) possui a estrutura baseada no DPCM, onde existe um estimador temporal, no caso a estimação e a compensação de movimentos. Os quadros da seqüência são comprimidos com GOP do tipo IPPP, onde o quadro “intra” é comprimido utilizando um JPEG modificado. Neste se utiliza a transformada e a quantização do H.264. Os quadros subsequentes são comprimidos com relação aos anteriores, e os macroblocos podem ser codificados nos modos “intra”, “inter” e skip. Implica-se assim na estimação de um novo quadro que possuirá seu resíduo (diferença entre o quadro estimado e o quadro a ser comprimido) codificado utilizando o H.264 no modo de quadros intra. A informação dos vetores de movimento e das partições dos macroblocos são comprimidos com um codificador de entropia denominado

Figura 4.7: Curva de Taxa _{× Distorção comparando várias técnicas de compensação} de movimento: sem partição de macroblocos, macroblocos particionados com quadtree, macroblocos particionados com wedge e macroblocos particionados com wedge utilizando uma algoritmo rápido [1].

por fim, um stream de bits na saída.

O stream de bits gerado pelo codificador é descomprimido utilizando um decodificador de entropia (Range Coder) resultando na informação dos quadros ainda comprimidos com o padrão H.264 intra, os vetores de movimento e as partições. Em seguida, o primeiro quadro é decodificado pelo H.264, e os quadros seguintes são compensados a partir das informações da partição e dos vetores de movimento. Estes quadros estimados são somados com seus resíduos correspondentes após uma decodificação apropriada, conforme ilustra a figura 4.9.

Para o cálculo dos vetores de movimento foi feita a busca completa dentro de uma janela de tamanho_{32 × 32 pixels, utilizando uma precisão de um pixel. Apesar de ter sido implementado} uma estimação de movimento de um quarto de pixel não foi utilizada por apresentar uma complexidade computacional intensa, mas gerando resultados similares, de acordo com testes realizados.

Figura 4.8: Esquemático do codificador de vídeo proposto

Figura 4.9: Esquemático do decodificador de vídeo proposto.

• Compensação de movimento utilizando quadtree (vide figura 3.1).

• Compensação de movimento utilizando o algoritmo rápido de wedges (vide seção 3.5). • Compensação de movimento utilizando partições wedge para skip parcial (vide seção 3.6).

Os resultados visuais em termos de partição de macroblocos são similares ao do MPEG-2 modificado, tanto nas partições to tipo quadtree (vide Figura 4.4) quanto wedge (vide Figura 4.6). Neste codificador foi utilizado a partição wedge baseada em bordas (o método rápido) associando dois vetores de movimento. Este método será comparado com o quadtree e a compensação de movimento com skip parcial (wedge com um vetor de movimento).

onde possui movimento distinguindo a região que possui (por inferência) vetor de movimento nulo e a região que possui um vetor de movimento associado.

Figura 4.10: (a) Mapa binário onde se detecta pixels que possuem movimento. (b) Sobreposição de wedges no mapa binário.

A compressão foi realizada em três seqüências de vídeo populares: Foreman, Coastguard e

Mother and Daughter. Os resultados da compressão podem ser observados nas Figuras 4.11, 4.12

e 4.13.

Observe que o comportamento esperados das curvas não foram alcançados, ou seja, os ganhos relativos às partições não foram atingidos diferente do que foi mostrado na Figura 4.7. Isso ocorre devido a uma implementação do codificador de entropia de uso geral, ou seja: sem otimização, sem contexto e tampouco uma estatística que retrate a ocorrência dos símbolos.

Outra técnica que pode contribuir para melhoria de desempenho é avaliar a distorção causada pela wedge que não possui “vetor de movimento”, remetendo assim a utilização de técnicas de otimização do sistema de forma a obter a melhor relação taxa distorção neste tipo de sistema de compressão, como a estimação empírica dos multiplicadores de Lagrange [39].

Figura 4.11: Curva de Taxa _{× Distorção comparando várias técnicas de compensação de} movimento para a seqüência de vídeo Foreman.

Figura 4.12: Curva de Taxa _{× Distorção comparando várias técnicas de compensação de} movimento para a seqüência de vídeo Coastguard.

Figura 4.13: Curva de Taxa _{× Distorção comparando várias técnicas de compensação de} movimento para a seqüência de vídeo Mother and Daughter.

5 CONCLUSÕES

Neste trabalho propôs-se técnicas de compressão de vídeo mais genéricas e mais eficientes comparadas às disponíveis no âmbito industrial e acadêmico. Para comparar as técnicas desenvolvidas e as atuais, foram desenvolvidos codecs (codificador e decodificador) de vídeo cujos módulos são baseados nos padrões de vídeo MPEG-2 e H.264. O objetivo principal seria de testar e comparar as técnicas aqui propostas com as utilizadas classicamente nos codecs de vídeo dantes mencionado, e não propor um novo sistema de compressão que seja competitivo com o estado da arte em compressão de vídeo. Esta dissertação propõe métodos mais genéricos e eficientes de compensação de movimento, especificamente de partição de macroblocos. Ou seja, nesta dissertação apenas a correlação temporal (predição entre quadros) foi explorada.

Comparamos as técnicas de compensação mais tradicionais, no caso, sem partição de macroblocos (utilizada no MPEG-2) e a partição quadtree (utilizada no H.264), além de propor três técnicas para compensação de movimento baseadas em wedgelets. Onde o tamanho do dicionário de wedges pode ser variado de acordo com a necessidade do codificador ou pela aplicação. Mas quanto maior o dicionário, maior o número de bits para codificar (representar) a partição e por conseguinte aumentam as opções de compensação e estimação de movimento (aumentando o esforço computacional). Para a viabilização desta técnica, propôs-se neste trabalho uma abordagem onde a partição do macrobloco é baseada nas bordas dos objetos encontrados no macrobloco. Resultando numa técnica sub-ótima, mas com uma redução drástica no esforço computacional sem influenciar significativamente na qualidade, uma vez que esta técnica reduz o conjunto de testes do dicionário completo. Por fim, a última proposta foi de utilizar as partições wedge para a implementação de um skip parcial.

Outros trabalhos mais recentes, denominados de “geometry-adaptive block partitioning” [36, 37, 38], que é idêntico à implementação das wedges no H.264, pode ser verificado que os resultados foram similares aos obtidos nesta dissertação.

Dans le document Modélisation et commande d'un système de trafic multimodal (Page 136-143)