Diff of /xvidcore/src/image/image.c

-revision 1.27, Mon Mar 22 22:36:23 2004 UTC
+revision 1.37, Fri Oct 13 08:39:31 2006 UTC
 Line 3
   *  XVID MPEG-4 VIDEO CODEC
   *  - Image management functions -
   *
-  *  Copyright(C) 2001-2003 Peter Ross <pross@xvid.org>
+  *  Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>
   *
   *  This program is free software ; you can redistribute it and/or modify
   *  it under the terms of the GNU General Public License as published by
 Line 26
  #include <stdlib.h>
  #include <string.h>                             /* memcpy, memset */
  #include <math.h>
  #include "../portab.h"
  #include "../global.h"                  /* XVID_CSP_XXX's */
  #include "../xvid.h"                    /* XVID_CSP_XXX's */
  #include "image.h"
  #include "colorspace.h"
  #include "interpolate8x8.h"
- #include "reduced.h"
  #include "../utils/mem_align.h"
+ #include "../motion/sad.h"
+ #include "../utils/emms.h"
  #include "font.h"               /* XXX: remove later */
 Line 237
          }
  }
- /* bframe encoding requires image-based u,v interpolation */
  void
- image_interpolate(const IMAGE * refn,
+ image_interpolate(const uint8_t * refn,
-                                   IMAGE * refh,
+                                   uint8_t * refh,
-                                   IMAGE * refv,
+                                   uint8_t * refv,
-                                   IMAGE * refhv,
+                                   uint8_t * refhv,
                                    uint32_t edged_width,
                                    uint32_t edged_height,
                                    uint32_t quarterpel,
-Line 250
+Line 249
  {
          const uint32_t offset = EDGE_SIZE2 * (edged_width + 1); /* we only interpolate half of the edge area */
          const uint32_t stride_add = 7 * edged_width;
- #if 0
-         const uint32_t edged_width2 = edged_width / 2;
-         const uint32_t edged_height2 = edged_height / 2;
-         const uint32_t offset2 = EDGE_SIZE2 * (edged_width2 + 1);
-         const uint32_t stride_add2 = 7 * edged_width2;
- #endif
-         uint8_t *n_ptr, *h_ptr, *v_ptr, *hv_ptr;
-         uint32_t x, y;
+         uint8_t *n_ptr;
+         uint8_t *h_ptr, *v_ptr, *hv_ptr;
+         uint32_t x, y;
-         n_ptr = refn->y;
+         n_ptr = (uint8_t*)refn;
-         h_ptr = refh->y;
+         h_ptr = refh;
-         v_ptr = refv->y;
+         v_ptr = refv;
          n_ptr -= offset;
          h_ptr -= offset;
-Line 291
+Line 285
                          n_ptr += stride_add;
                  }
-                 h_ptr = refh->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
+                 h_ptr = refh + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
-                 hv_ptr = refhv->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
+                 hv_ptr = refhv + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
                          hv_ptr -= stride_add;
-Line 308
+Line 302
                  }
          } else {
-                 hv_ptr = refhv->y;
+                 hv_ptr = refhv;
                  hv_ptr -= offset;
                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
-Line 334
+Line 328
                          n_ptr += stride_add;
                  }
          }
- /*
- #ifdef BFRAMES
-         n_ptr = refn->u;
-         h_ptr = refh->u;
-         v_ptr = refv->u;
-         hv_ptr = refhv->u;
-         n_ptr -= offset2;
-         h_ptr -= offset2;
-         v_ptr -= offset2;
-         hv_ptr -= offset2;
-         for (y = 0; y < edged_height2; y += 8) {
-                 for (x = 0; x < edged_width2; x += 8) {
-                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);
-                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);
-                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);
-                         n_ptr += 8;
-                         h_ptr += 8;
-                         v_ptr += 8;
-                         hv_ptr += 8;
-                 }
-                 h_ptr += stride_add2;
-                 v_ptr += stride_add2;
-                 hv_ptr += stride_add2;
-                 n_ptr += stride_add2;
-         }
-         n_ptr = refn->v;
-         h_ptr = refh->v;
-         v_ptr = refv->v;
-         hv_ptr = refhv->v;
-         n_ptr -= offset2;
-         h_ptr -= offset2;
-         v_ptr -= offset2;
-         hv_ptr -= offset2;
-         for (y = 0; y < edged_height2; y = y + 8) {
-                 for (x = 0; x < edged_width2; x = x + 8) {
-                         interpolate8x8_halfpel_h(h_ptr, n_ptr, edged_width2, rounding);
-                         interpolate8x8_halfpel_v(v_ptr, n_ptr, edged_width2, rounding);
-                         interpolate8x8_halfpel_hv(hv_ptr, n_ptr, edged_width2, rounding);
-                         n_ptr += 8;
-                         h_ptr += 8;
-                         v_ptr += 8;
-                         hv_ptr += 8;
-                 }
-                 h_ptr += stride_add2;
-                 v_ptr += stride_add2;
-                 hv_ptr += stride_add2;
-                 n_ptr += stride_add2;
-         }
- #endif
- */
-         /*
-            interpolate_halfpel_h(
-            refh->y - offset,
-            refn->y - offset,
-            edged_width, edged_height,
-            rounding);
-            interpolate_halfpel_v(
-            refv->y - offset,
-            refn->y - offset,
-            edged_width, edged_height,
-            rounding);
-            interpolate_halfpel_hv(
-            refhv->y - offset,
-            refn->y - offset,
-            edged_width, edged_height,
-            rounding);
-          */
-         /* uv-image-based compensation
-            offset = EDGE_SIZE2 * (edged_width / 2 + 1);
-            interpolate_halfpel_h(
-            refh->u - offset,
-            refn->u - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-            interpolate_halfpel_v(
-            refv->u - offset,
-            refn->u - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-            interpolate_halfpel_hv(
-            refhv->u - offset,
-            refn->u - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-            interpolate_halfpel_h(
-            refh->v - offset,
-            refn->v - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-            interpolate_halfpel_v(
-            refv->v - offset,
-            refn->v - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-            interpolate_halfpel_hv(
-            refhv->v - offset,
-            refn->v - offset,
-            edged_width / 2, edged_height / 2,
-            rounding);
-          */
  }
-Line 718
+Line 595
                           int height,
                           uint32_t edged_width,
                           uint8_t * dst[4],
-                          uint32_t dst_stride[4],
+                          int dst_stride[4],
                           int csp,
                           int interlacing)
  {
-Line 899
+Line 776
                     uint16_t width,
                     uint16_t height)
  {
-         int diff, x, y;
+         int y, bwidth, bheight;
          long sse=0;
-         for (y = 0; y < height; y++) {
+         bwidth  = width  & (~0x07);
+         bheight = height & (~0x07);
+         /* Compute the 8x8 integer part */
+         for (y = 0; y<bheight; y += 8) {
+                 int x;
+                 /* Compute sse for the band */
+                 for (x = 0; x<bwidth; x += 8)
+                         sse += sse8_8bit(orig  + x, recon + x, stride);
+                 /* remaining pixels of the 8 pixels high band */
+                 for (x = bwidth; x < width; x++) {
+                         int diff;
+                         diff = *(orig + 0*stride + x) - *(recon + 0*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 1*stride + x) - *(recon + 1*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 2*stride + x) - *(recon + 2*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 3*stride + x) - *(recon + 3*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 4*stride + x) - *(recon + 4*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 5*stride + x) - *(recon + 5*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 6*stride + x) - *(recon + 6*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 7*stride + x) - *(recon + 7*stride + x);
+                         sse += diff * diff;
+                 }
+                 orig  += 8*stride;
+                 recon += 8*stride;
+         }
+         /* Compute the down rectangle sse */
+         for (y = bheight; y < height; y++) {
+                 int x;
                  for (x = 0; x < width; x++) {
+                         int diff;
                          diff = *(orig + x) - *(recon + x);
                          sse += diff * diff;
                  }
                  orig += stride;
                  recon += stride;
          }
-         return sse;
+         return (sse);
  }
  #if 0
-Line 1039
+Line 956
  }
  void
- output_slice(IMAGE * cur, int std, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {
+ output_slice(IMAGE * cur, int stride, int width, xvid_image_t* out_frm, int mbx, int mby,int mbl) {
    uint8_t *dY,*dU,*dV,*sY,*sU,*sV;
-   int std2 = std >> 1;
+   int stride2 = stride >> 1;
    int w = mbl << 4, w2,i;
    if(w > width)
-Line 1051
+Line 968
    dY = (uint8_t*)out_frm->plane[0] + (mby << 4) * out_frm->stride[0] + (mbx << 4);
    dU = (uint8_t*)out_frm->plane[1] + (mby << 3) * out_frm->stride[1] + (mbx << 3);
    dV = (uint8_t*)out_frm->plane[2] + (mby << 3) * out_frm->stride[2] + (mbx << 3);
-   sY = cur->y + (mby << 4) * std + (mbx << 4);
+   sY = cur->y + (mby << 4) * stride + (mbx << 4);
-   sU = cur->u + (mby << 3) * std2 + (mbx << 3);
+   sU = cur->u + (mby << 3) * stride2 + (mbx << 3);
-   sV = cur->v + (mby << 3) * std2 + (mbx << 3);
+   sV = cur->v + (mby << 3) * stride2 + (mbx << 3);
    for(i = 0 ; i < 16 ; i++) {
      memcpy(dY,sY,w);
      dY += out_frm->stride[0];
-     sY += std;
+     sY += stride;
    }
    for(i = 0 ; i < 8 ; i++) {
      memcpy(dU,sU,w2);
      dU += out_frm->stride[1];
-     sU += std2;
+     sU += stride2;
    }
    for(i = 0 ; i < 8 ; i++) {
      memcpy(dV,sV,w2);
      dV += out_frm->stride[2];
-     sV += std2;
+     sV += stride2;
    }
  }
-Line 1099
+Line 1016
          }
  }
+ /****************************************************************************/
- /* reduced resolution deblocking filter
+ static void (*deintl_core)(uint8_t *, int width, int height, const int stride) = 0;
-         block = block size (16=rrv, 8=full resolution)
+ extern void xvid_deinterlace_sse(uint8_t *, int width, int height, const int stride);
-         flags = XVID_DEC_YDEBLOCK|XVID_DEC_UVDEBLOCK
- */
- void
- image_deblock_rrv(IMAGE * img, int edged_width,
-                                 const MACROBLOCK * mbs, int mb_width, int mb_height, int mb_stride,
-                                 int block, int flags)
- {
-         const int edged_width2 = edged_width /2;
-         const int nblocks = block / 8;  /* skals code uses 8pixel block uints */
-         int i,j;
-         /* luma: j,i in block units */
+ #define CLIP_255(x)   ( ((x)&~255) ? ((-(x)) >> (8*sizeof((x))-1))&0xff : (x) )
-                 for (j = 1; j < mb_height*2; j++)               /* horizontal deblocking */
+ static void deinterlace_c(uint8_t *pix, int width, int height, const int bps)
-                 for (i = 0; i < mb_width*2; i++)
                  {
-                         if (mbs[(j-1)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED ||
+   pix += bps;
-                                 mbs[(j+0)/2*mb_stride + (i/2)].mode != MODE_NOT_CODED)
+   while(width-->0)
                          {
-                                 hfilter_31(img->y + (j*block - 1)*edged_width + i*block,
+     int p1 = pix[-bps];
-                                                                   img->y + (j*block + 0)*edged_width + i*block, nblocks);
+     int p2 = pix[0];
-                         }
+     int p0 = p2;
-                 }
+     int j = (height>>1) - 1;
+     int V;
-                 for (j = 0; j < mb_height*2; j++)               /* vertical deblocking */
+     unsigned char *P = pix++;
-                 for (i = 1; i < mb_width*2; i++)
+     while(j-->0)
-                 {
-                         if (mbs[(j/2)*mb_stride + (i-1)/2].mode != MODE_NOT_CODED ||
-                                 mbs[(j/2)*mb_stride + (i+0)/2].mode != MODE_NOT_CODED)
                          {
-                                 vfilter_31(img->y + (j*block)*edged_width + i*block - 1,
+       const int  p3 = P[  bps];
-                                                    img->y + (j*block)*edged_width + i*block + 0,
+       const int  p4 = P[2*bps];
-                                                    edged_width, nblocks);
+       V =  ((p1+p3+1)>>1) + ((p2 - ((p0+p4+1)>>1)) >> 2);
+       P[0] = CLIP_255( V );
+       p0 = p2;
+       p1 = p3;
+       p2 = p4;
+       P += 2*bps;
                          }
-                 }
+     V =  ((p1+p1+1)>>1) + ((p2 - ((p0+p2+1)>>1)) >> 2);
+     P[0] = CLIP_255( V );
-         /* chroma */
-                 for (j = 1; j < mb_height; j++)         /* horizontal deblocking */
-                 for (i = 0; i < mb_width; i++)
-                 {
-                         if (mbs[(j-1)*mb_stride + i].mode != MODE_NOT_CODED ||
-                                 mbs[(j+0)*mb_stride + i].mode != MODE_NOT_CODED)
-                         {
-                                 hfilter_31(img->u + (j*block - 1)*edged_width2 + i*block,
-                                                    img->u + (j*block + 0)*edged_width2 + i*block, nblocks);
-                                 hfilter_31(img->v + (j*block - 1)*edged_width2 + i*block,
-                                                    img->v + (j*block + 0)*edged_width2 + i*block, nblocks);
                          }
                  }
+ #undef CLIP_255
-                 for (j = 0; j < mb_height; j++)         /* vertical deblocking */
+ int xvid_image_deinterlace(xvid_image_t* img, int width, int height, int bottom_first)
-                 for (i = 1; i < mb_width; i++)
-                 {
-                         if (mbs[j*mb_stride + i - 1].mode != MODE_NOT_CODED ||
-                                 mbs[j*mb_stride + i + 0].mode != MODE_NOT_CODED)
                          {
-                                 vfilter_31(img->u + (j*block)*edged_width2 + i*block - 1,
+         if (height&1)
-                                                    img->u + (j*block)*edged_width2 + i*block + 0,
+                 return 0;
-                                                    edged_width2, nblocks);
+         if (img->csp!=XVID_CSP_PLANAR && img->csp!=XVID_CSP_I420 && img->csp!=XVID_CSP_YV12)
-                                 vfilter_31(img->v + (j*block)*edged_width2 + i*block - 1,
+                 return 0;       /* not yet supported */
-                                                    img->v + (j*block)*edged_width2 + i*block + 0,
+         if (deintl_core==0) {
-                                                    edged_width2, nblocks);
+                 const int cpu_flags = check_cpu_features();
+                 deintl_core = deinterlace_c;
+ #ifdef ARCH_IS_IA32
+                 if (cpu_flags & XVID_CPU_MMX)
+                         deintl_core = xvid_deinterlace_sse;
+ #endif
                          }
+         if (!bottom_first) {
+                 deintl_core(img->plane[0], width,    height,    img->stride[0]);
+                 deintl_core(img->plane[1], width>>1, height>>1, img->stride[1]);
+                 deintl_core(img->plane[2], width>>1, height>>1, img->stride[2]);
+         }
+         else {
+                 deintl_core((uint8_t *)img->plane[0] + ( height    -1)*img->stride[0], width,    height,    -img->stride[0]);
+                 deintl_core((uint8_t *)img->plane[1] + ((height>>1)-1)*img->stride[1], width>>1, height>>1, -img->stride[1]);
+                 deintl_core((uint8_t *)img->plane[2] + ((height>>1)-1)*img->stride[2], width>>1, height>>1, -img->stride[2]);
                  }
+         emms();
+         return 1;
  }

 Legend:



Removed from v.1.27
 


changed lines


 
Added in v.1.37
 Legend:



Removed from v.1.27
 


changed lines


 
Added in v.1.37
-Removed from v.1.27
+Added in v.1.37

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4