• Aucun résultat trouvé

Couplage entre un modèle macroscopique et une loi de poursuite

Modèle hybride fondé sur un modèle générique de second-ordre GSOM

5.5 Validation du schéma de couplage

5.2.1 Couplage entre un modèle macroscopique et une loi de poursuite

O compressor de vídeo apresentado (figura 4.8) possui a estrutura baseada no DPCM, onde existe um estimador temporal, no caso a estimação e a compensação de movimentos. Os quadros da seqüência são comprimidos com GOP do tipo IPPP, onde o quadro “intra” é comprimido utilizando um JPEG modificado. Neste se utiliza a transformada e a quantização do H.264. Os quadros subsequentes são comprimidos com relação aos anteriores, e os macroblocos podem ser codificados nos modos “intra”, “inter” e skip. Implica-se assim na estimação de um novo quadro que possuirá seu resíduo (diferença entre o quadro estimado e o quadro a ser comprimido) codificado utilizando o H.264 no modo de quadros intra. A informação dos vetores de movimento e das partições dos macroblocos são comprimidos com um codificador de entropia denominado

Figura 4.7: Curva de Taxa × Distorção comparando várias técnicas de compensação de movimento: sem partição de macroblocos, macroblocos particionados com quadtree, macroblocos particionados com wedge e macroblocos particionados com wedge utilizando uma algoritmo rápido [1].

por fim, um stream de bits na saída.

O stream de bits gerado pelo codificador é descomprimido utilizando um decodificador de entropia (Range Coder) resultando na informação dos quadros ainda comprimidos com o padrão H.264 intra, os vetores de movimento e as partições. Em seguida, o primeiro quadro é decodificado pelo H.264, e os quadros seguintes são compensados a partir das informações da partição e dos vetores de movimento. Estes quadros estimados são somados com seus resíduos correspondentes após uma decodificação apropriada, conforme ilustra a figura 4.9.

Para o cálculo dos vetores de movimento foi feita a busca completa dentro de uma janela de tamanho32 × 32 pixels, utilizando uma precisão de um pixel. Apesar de ter sido implementado uma estimação de movimento de um quarto de pixel não foi utilizada por apresentar uma complexidade computacional intensa, mas gerando resultados similares, de acordo com testes realizados.

Figura 4.8: Esquemático do codificador de vídeo proposto

Figura 4.9: Esquemático do decodificador de vídeo proposto.

• Compensação de movimento utilizando quadtree (vide figura 3.1).

• Compensação de movimento utilizando o algoritmo rápido de wedges (vide seção 3.5). • Compensação de movimento utilizando partições wedge para skip parcial (vide seção 3.6).

Os resultados visuais em termos de partição de macroblocos são similares ao do MPEG-2 modificado, tanto nas partições to tipo quadtree (vide Figura 4.4) quanto wedge (vide Figura 4.6). Neste codificador foi utilizado a partição wedge baseada em bordas (o método rápido) associando dois vetores de movimento. Este método será comparado com o quadtree e a compensação de movimento com skip parcial (wedge com um vetor de movimento).

onde possui movimento distinguindo a região que possui (por inferência) vetor de movimento nulo e a região que possui um vetor de movimento associado.

Figura 4.10: (a) Mapa binário onde se detecta pixels que possuem movimento. (b) Sobreposição de wedges no mapa binário.

A compressão foi realizada em três seqüências de vídeo populares: Foreman, Coastguard e

Mother and Daughter. Os resultados da compressão podem ser observados nas Figuras 4.11, 4.12

e 4.13.

Observe que o comportamento esperados das curvas não foram alcançados, ou seja, os ganhos relativos às partições não foram atingidos diferente do que foi mostrado na Figura 4.7. Isso ocorre devido a uma implementação do codificador de entropia de uso geral, ou seja: sem otimização, sem contexto e tampouco uma estatística que retrate a ocorrência dos símbolos.

Outra técnica que pode contribuir para melhoria de desempenho é avaliar a distorção causada pela wedge que não possui “vetor de movimento”, remetendo assim a utilização de técnicas de otimização do sistema de forma a obter a melhor relação taxa distorção neste tipo de sistema de compressão, como a estimação empírica dos multiplicadores de Lagrange [39].

Figura 4.11: Curva de Taxa × Distorção comparando várias técnicas de compensação de movimento para a seqüência de vídeo Foreman.

Figura 4.12: Curva de Taxa × Distorção comparando várias técnicas de compensação de movimento para a seqüência de vídeo Coastguard.

Figura 4.13: Curva de Taxa × Distorção comparando várias técnicas de compensação de movimento para a seqüência de vídeo Mother and Daughter.

5 CONCLUSÕES

Neste trabalho propôs-se técnicas de compressão de vídeo mais genéricas e mais eficientes comparadas às disponíveis no âmbito industrial e acadêmico. Para comparar as técnicas desenvolvidas e as atuais, foram desenvolvidos codecs (codificador e decodificador) de vídeo cujos módulos são baseados nos padrões de vídeo MPEG-2 e H.264. O objetivo principal seria de testar e comparar as técnicas aqui propostas com as utilizadas classicamente nos codecs de vídeo dantes mencionado, e não propor um novo sistema de compressão que seja competitivo com o estado da arte em compressão de vídeo. Esta dissertação propõe métodos mais genéricos e eficientes de compensação de movimento, especificamente de partição de macroblocos. Ou seja, nesta dissertação apenas a correlação temporal (predição entre quadros) foi explorada.

Comparamos as técnicas de compensação mais tradicionais, no caso, sem partição de macroblocos (utilizada no MPEG-2) e a partição quadtree (utilizada no H.264), além de propor três técnicas para compensação de movimento baseadas em wedgelets. Onde o tamanho do dicionário de wedges pode ser variado de acordo com a necessidade do codificador ou pela aplicação. Mas quanto maior o dicionário, maior o número de bits para codificar (representar) a partição e por conseguinte aumentam as opções de compensação e estimação de movimento (aumentando o esforço computacional). Para a viabilização desta técnica, propôs-se neste trabalho uma abordagem onde a partição do macrobloco é baseada nas bordas dos objetos encontrados no macrobloco. Resultando numa técnica sub-ótima, mas com uma redução drástica no esforço computacional sem influenciar significativamente na qualidade, uma vez que esta técnica reduz o conjunto de testes do dicionário completo. Por fim, a última proposta foi de utilizar as partições wedge para a implementação de um skip parcial.

Outros trabalhos mais recentes, denominados de “geometry-adaptive block partitioning” [36, 37, 38], que é idêntico à implementação das wedges no H.264, pode ser verificado que os resultados foram similares aos obtidos nesta dissertação.

Documents relatifs