Diff of /xvidcore/src/image/image.c

-revision 1.26.2.7, Mon Jun  9 13:53:50 2003 UTC
+revision 1.29, Mon Apr 12 15:49:56 2004 UTC
 Line 3
   *  XVID MPEG-4 VIDEO CODEC
   *  - Image management functions -
   *
-  *  Copyright(C) 2001-2003 Peter Ross <pross@xvid.org>
+  *  Copyright(C) 2001-2004 Peter Ross <pross@xvid.org>
   *
   *  This program is free software ; you can redistribute it and/or modify
   *  it under the terms of the GNU General Public License as published by
 Line 35
  #include "interpolate8x8.h"
  #include "reduced.h"
  #include "../utils/mem_align.h"
+ #include "../motion/sad.h"
  #include "font.h"               /* XXX: remove later */
-Line 49
+Line 50
  {
          const uint32_t edged_width2 = edged_width / 2;
          const uint32_t edged_height2 = edged_height / 2;
-         uint32_t i;
          image->y =
                  xvid_malloc(edged_width * (edged_height + 1) + SAFETY, CACHE_LINE);
          if (image->y == NULL) {
                  return -1;
          }
+         memset(image->y, 0, edged_width * (edged_height + 1) + SAFETY);
-         for (i = 0; i < edged_width * edged_height + SAFETY; i++) {
-                 image->y[i] = 0;
-         }
          image->u = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
          if (image->u == NULL) {
                  xvid_free(image->y);
+                 image->y = NULL;
                  return -1;
          }
+         memset(image->u, 0, edged_width2 * edged_height2 + SAFETY);
          image->v = xvid_malloc(edged_width2 * edged_height2 + SAFETY, CACHE_LINE);
          if (image->v == NULL) {
                  xvid_free(image->u);
+                 image->u = NULL;
                  xvid_free(image->y);
+                 image->y = NULL;
                  return -1;
          }
+         memset(image->v, 0, edged_width2 * edged_height2 + SAFETY);
          image->y += EDGE_SIZE * edged_width + EDGE_SIZE;
          image->u += EDGE_SIZE2 * edged_width2 + EDGE_SIZE2;
-Line 91
+Line 94
          if (image->y) {
                  xvid_free(image->y - (EDGE_SIZE * edged_width + EDGE_SIZE));
+                 image->y = NULL;
          }
          if (image->u) {
                  xvid_free(image->u - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
+                 image->u = NULL;
          }
          if (image->v) {
                  xvid_free(image->v - (EDGE_SIZE2 * edged_width2 + EDGE_SIZE2));
+                 image->v = NULL;
          }
  }
-Line 122
+Line 128
          memcpy(image1->v, image2->v, edged_width * height / 4);
  }
+ /* setedges bug was fixed in this BS version */
+ #define SETEDGES_BUG_BEFORE             18
  void
  image_setedges(IMAGE * image,
                             uint32_t edged_width,
                             uint32_t edged_height,
                             uint32_t width,
-                            uint32_t height)
+                            uint32_t height,
+                            int bs_version)
  {
          const uint32_t edged_width2 = edged_width / 2;
-         const uint32_t width2 = width / 2;
+         uint32_t width2;
          uint32_t i;
          uint8_t *dst;
          uint8_t *src;
          dst = image->y - (EDGE_SIZE + EDGE_SIZE * edged_width);
          src = image->y;
+         /* According to the Standard Clause 7.6.4, padding is done starting at 16
+          * pixel width and height multiples. This was not respected in old xvids */
+         if (bs_version == 0 || bs_version >= SETEDGES_BUG_BEFORE) {
+                 width  = (width+15)&~15;
+                 height = (height+15)&~15;
+         }
+         width2 = width/2;
          for (i = 0; i < EDGE_SIZE; i++) {
                  memset(dst, *src, EDGE_SIZE);
                  memcpy(dst + EDGE_SIZE, src, width);
-Line 247
+Line 264
          n_ptr = refn->y;
          h_ptr = refh->y;
          v_ptr = refv->y;
-         hv_ptr = refhv->y;
          n_ptr -= offset;
          h_ptr -= offset;
          v_ptr -= offset;
-         hv_ptr -= offset;
+         /* Note we initialize the hv pointer later, as we can optimize code a bit
+          * doing it down to up in quarterpel and up to down in halfpel */
          if(quarterpel) {
                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
-Line 275
+Line 292
                          n_ptr += stride_add;
                  }
-                 h_ptr = refh->y;
+                 h_ptr = refh->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
-                 h_ptr -= offset;
+                 hv_ptr = refhv->y + (edged_height - EDGE_SIZE - EDGE_SIZE2)*edged_width - EDGE_SIZE2;
                  for (y = 0; y < (edged_height - EDGE_SIZE); y = y + 8) {
+                         hv_ptr -= stride_add;
+                         h_ptr -= stride_add;
+                         hv_ptr -= EDGE_SIZE;
+                         h_ptr -= EDGE_SIZE;
                          for (x = 0; x < (edged_width - EDGE_SIZE); x = x + 8) {
+                                 hv_ptr -= 8;
+                                 h_ptr -= 8;
                                  interpolate8x8_6tap_lowpass_v(hv_ptr, h_ptr, edged_width, rounding);
-                                 hv_ptr += 8;
-                                 h_ptr += 8;
-                         }
-                         hv_ptr += EDGE_SIZE;
-                         h_ptr += EDGE_SIZE;
-                         hv_ptr += stride_add;
-                         h_ptr += stride_add;
                  }
          }
-         else {
+         } else {
+                 hv_ptr = refhv->y;
+                 hv_ptr -= offset;
                  for (y = 0; y < (edged_height - EDGE_SIZE); y += 8) {
                          for (x = 0; x < (edged_width - EDGE_SIZE); x += 8) {
-Line 587
+Line 605
                          interlacing?rgbai_to_yv12_c:rgba_to_yv12_c, 4);
                  break;
+         case XVID_CSP_ARGB:
+                 safe_packed_conv(
+                         src[0], src_stride[0], image->y, image->u, image->v,
+                         edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
+                         interlacing?argbi_to_yv12  : argb_to_yv12,
+                         interlacing?argbi_to_yv12_c: argb_to_yv12_c, 4);
+                 break;
          case XVID_CSP_YUY2:
                  safe_packed_conv(
                          src[0], src_stride[0], image->y, image->u, image->v,
-Line 597
+Line 623
          case XVID_CSP_YVYU:             /* u/v swapped */
                  safe_packed_conv(
-                         src[0], src_stride[0], image->y, image->v, image->y,
+                         src[0], src_stride[0], image->y, image->v, image->u,
                          edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
                          interlacing?yuyvi_to_yv12  :yuyv_to_yv12,
                          interlacing?yuyvi_to_yv12_c:yuyv_to_yv12_c, 2);
-Line 611
+Line 637
                          interlacing?uyvyi_to_yv12_c:uyvy_to_yv12_c, 2);
                  break;
-         case XVID_CSP_I420:
+         case XVID_CSP_I420:     /* YCbCr == YUV == internal colorspace for MPEG */
                  yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
                          src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
                          src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
-                 break
+                 break;
-                         ;
-         case XVID_CSP_YV12:             /* u/v swapped */
+         case XVID_CSP_YV12: /* YCrCb == YVA == U and V plane swapped */
                  yv12_to_yv12(image->y, image->v, image->u, edged_width, edged_width2,
                          src[0], src[0] + src_stride[0]*height, src[0] + src_stride[0]*height + (src_stride[0]/2)*height2,
                          src_stride[0], src_stride[0]/2, width, height, (csp & XVID_CSP_VFLIP));
                  break;
-         case XVID_CSP_USER:
+         case XVID_CSP_PLANAR:  /* YCbCr with arbitrary pointers and different strides for Y and UV */
-         /*XXX: support for different u & v strides */
                  yv12_to_yv12(image->y, image->u, image->v, edged_width, edged_width2,
-                         src[0], src[1], src[2], src_stride[0], src_stride[1],
+                         src[0], src[1], src[2], src_stride[0], src_stride[1],  /* v: dst_stride[2] not yet supported */
                          width, height, (csp & XVID_CSP_VFLIP));
                  break;
-Line 756
+Line 781
                          interlacing?yv12_to_rgbai_c:yv12_to_rgba_c, 4);
                  return 0;
+         case XVID_CSP_ARGB:
+                 safe_packed_conv(
+                         dst[0], dst_stride[0], image->y, image->u, image->v,
+                         edged_width, edged_width2, width, height, (csp & XVID_CSP_VFLIP),
+                         interlacing?yv12_to_argbi  :yv12_to_argb,
+                         interlacing?yv12_to_argbi_c:yv12_to_argb_c, 4);
+                 return 0;
          case XVID_CSP_YUY2:
                  safe_packed_conv(
                          dst[0], dst_stride[0], image->y, image->u, image->v,
-Line 780
+Line 813
                          interlacing?yv12_to_uyvyi_c:yv12_to_uyvy_c, 2);
                  return 0;
-         case XVID_CSP_I420:
+         case XVID_CSP_I420: /* YCbCr == YUV == internal colorspace for MPEG */
                  yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
                          dst_stride[0], dst_stride[0]/2,
                          image->y, image->u, image->v, edged_width, edged_width2,
                          width, height, (csp & XVID_CSP_VFLIP));
                  return 0;
-         case XVID_CSP_YV12:             /* u,v swapped */
+         case XVID_CSP_YV12:     /* YCrCb == YVU == U and V plane swapped */
                  yv12_to_yv12(dst[0], dst[0] + dst_stride[0]*height, dst[0] + dst_stride[0]*height + (dst_stride[0]/2)*height2,
                          dst_stride[0], dst_stride[0]/2,
                          image->y, image->v, image->u, edged_width, edged_width2,
                          width, height, (csp & XVID_CSP_VFLIP));
                  return 0;
-         case XVID_CSP_USER :            /* u,v swapped */
+         case XVID_CSP_PLANAR:  /* YCbCr with arbitrary pointers and different strides for Y and UV */
                  yv12_to_yv12(dst[0], dst[1], dst[2],
-                         dst_stride[0], dst_stride[1],   /* v: dst_stride[2] */
+                         dst_stride[0], dst_stride[1],   /* v: dst_stride[2] not yet supported */
-                         image->y, image->v, image->u, edged_width, edged_width2,
+                         image->y, image->u, image->v, edged_width, edged_width2,
                          width, height, (csp & XVID_CSP_VFLIP));
                  return 0;
-Line 867
+Line 900
                     uint16_t width,
                     uint16_t height)
  {
-         int diff, x, y;
+         int y, bwidth, bheight;
          long sse=0;
-         for (y = 0; y < height; y++) {
+         bwidth  = width  & (~0x07);
+         bheight = height & (~0x07);
+         /* Compute the 8x8 integer part */
+         for (y = 0; y<bheight; y += 8) {
+                 int x;
+                 /* Compute sse for the band */
+                 for (x = 0; x<bwidth; x += 8)
+                         sse += sse8_8bit(orig  + x, recon + x, stride);
+                 /* remaining pixels of the 8 pixels high band */
+                 for (x = bwidth; x < width; x++) {
+                         int diff;
+                         diff = *(orig + 0*stride + x) - *(recon + 0*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 1*stride + x) - *(recon + 1*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 2*stride + x) - *(recon + 2*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 3*stride + x) - *(recon + 3*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 4*stride + x) - *(recon + 4*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 5*stride + x) - *(recon + 5*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 6*stride + x) - *(recon + 6*stride + x);
+                         sse += diff * diff;
+                         diff = *(orig + 7*stride + x) - *(recon + 7*stride + x);
+                         sse += diff * diff;
+                 }
+                 orig  += 8*stride;
+                 recon += 8*stride;
+         }
+         /* Compute the down rectangle sse */
+         for (y = bheight; y < height; y++) {
+                 int x;
                  for (x = 0; x < width; x++) {
+                         int diff;
                          diff = *(orig + x) - *(recon + x);
                          sse += diff * diff;
                  }
                  orig += stride;
                  recon += stride;
          }
-         return sse;
+         return (sse);
  }
  #if 0

 Legend:



Removed from v.1.26.2.7
 


changed lines


 
Added in v.1.29
 Legend:



Removed from v.1.26.2.7
 


changed lines


 
Added in v.1.29
-Removed from v.1.26.2.7
+Added in v.1.29

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4