Diff of /xvidcore/src/image/interpolate8x8.c

-revision 1.10, Sat Feb 15 15:22:18 2003 UTC
+revision 1.10.2.5, Wed Oct  1 23:23:01 2003 UTC
 Line 1
- /**************************************************************************
+ /*****************************************************************************
   *
   *      XVID MPEG-4 VIDEO CODEC
-  *      8x8 block-based halfpel interpolation
+  *      - 8x8 block-based halfpel interpolation -
+  *
+  *  Copyright(C) 2001-2003 Peter Ross <pross@xvid.org>
   *
   *      This program is free software; you can redistribute it and/or modify
   *      it under the terms of the GNU General Public License as published by
-Line 15
+Line 17
   *
   *      You should have received a copy of the GNU General Public License
   *      along with this program; if not, write to the Free Software
-  *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+  *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
-  *
-  *************************************************************************/
- /**************************************************************************
-  *
-  *      History:
   *
-  *  05.10.2002  new bilinear and qpel interpolation code - Isibaar
+  * $Id$
-  *      27.12.2001      modified "compensate_halfpel"
-  *      05.11.2001      initial version; (c)2001 peter ross <pross@cs.rmit.edu.au>
   *
-  *************************************************************************/
+  ****************************************************************************/
  #include "../portab.h"
  #include "../global.h"
  #include "interpolate8x8.h"
- // function pointers
+ /* function pointers */
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_h;
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_v;
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_hv;
-Line 100
+Line 93
      }
  }
- // dst = interpolate(src)
+ /* dst = interpolate(src) */
  void
  interpolate8x8_halfpel_h_c(uint8_t * const dst,
-Line 108
+Line 101
                                                     const uint32_t stride,
                                                     const uint32_t rounding)
  {
-         uint32_t i, j;
+         uintptr_t j;
-         for (j = 0; j < 8; j++) {
-                 for (i = 0; i < 8; i++) {
-                         int16_t tot =
-                                 (int32_t) src[j * stride + i] + (int32_t) src[j * stride + i +
-];
-                         tot = (int32_t) ((tot + 1 - rounding) >> 1);
+         if (rounding)
-                         dst[j * stride + i] = (uint8_t) tot;
+                 for (j = 0; j < 8*stride; j+=stride)
-                 }
+                 {
+                                 dst[j + 0] = (uint8_t)((src[j + 0] + src[j + 1] )>>1);
+                                 dst[j + 1] = (uint8_t)((src[j + 1] + src[j + 2] )>>1);
+                                 dst[j + 2] = (uint8_t)((src[j + 2] + src[j + 3] )>>1);
+                                 dst[j + 3] = (uint8_t)((src[j + 3] + src[j + 4] )>>1);
+                                 dst[j + 4] = (uint8_t)((src[j + 4] + src[j + 5] )>>1);
+                                 dst[j + 5] = (uint8_t)((src[j + 5] + src[j + 6] )>>1);
+                                 dst[j + 6] = (uint8_t)((src[j + 6] + src[j + 7] )>>1);
+                                 dst[j + 7] = (uint8_t)((src[j + 7] + src[j + 8] )>>1);
+                 }
+         else
+                 for (j = 0; j < 8*stride; j+=stride)            /* forward or backwards? Who knows ... */
+                 {
+                                 dst[j + 0] = (uint8_t)((src[j + 0] + src[j + 1] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((src[j + 1] + src[j + 2] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((src[j + 2] + src[j + 3] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((src[j + 3] + src[j + 4] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((src[j + 4] + src[j + 5] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((src[j + 5] + src[j + 6] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((src[j + 6] + src[j + 7] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((src[j + 7] + src[j + 8] + 1)>>1);
          }
  }
-Line 131
+Line 137
                                                     const uint32_t stride,
                                                     const uint32_t rounding)
  {
-         uint32_t i, j;
+         uintptr_t j;
-         for (j = 0; j < 8; j++) {
-                 for (i = 0; i < 8; i++) {
-                         int16_t tot = src[j * stride + i] + src[j * stride + i + stride];
-                         tot = ((tot + 1 - rounding) >> 1);
+         if (rounding)
-                         dst[j * stride + i] = (uint8_t) tot;
+                 for (j = 0; j < 8*stride; j+=stride)            /* forward is better. Some automatic prefetch perhaps. */
-                 }
+                 {
+                                 dst[j + 0] = (uint8_t)((src[j + 0] + src[j + stride + 0] )>>1);
+                                 dst[j + 1] = (uint8_t)((src[j + 1] + src[j + stride + 1] )>>1);
+                                 dst[j + 2] = (uint8_t)((src[j + 2] + src[j + stride + 2] )>>1);
+                                 dst[j + 3] = (uint8_t)((src[j + 3] + src[j + stride + 3] )>>1);
+                                 dst[j + 4] = (uint8_t)((src[j + 4] + src[j + stride + 4] )>>1);
+                                 dst[j + 5] = (uint8_t)((src[j + 5] + src[j + stride + 5] )>>1);
+                                 dst[j + 6] = (uint8_t)((src[j + 6] + src[j + stride + 6] )>>1);
+                                 dst[j + 7] = (uint8_t)((src[j + 7] + src[j + stride + 7] )>>1);
+                 }
+         else
+                 for (j = 0; j < 8*stride; j+=stride)
+                 {
+                                 dst[j + 0] = (uint8_t)((src[j + 0] + src[j + stride + 0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((src[j + 1] + src[j + stride + 1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((src[j + 2] + src[j + stride + 2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((src[j + 3] + src[j + stride + 3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((src[j + 4] + src[j + stride + 4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((src[j + 5] + src[j + stride + 5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((src[j + 6] + src[j + stride + 6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((src[j + 7] + src[j + stride + 7] + 1)>>1);
          }
  }
-Line 150
+Line 173
                                                          const uint32_t stride,
                                                          const uint32_t rounding)
  {
-         uint32_t i, j;
+         uintptr_t j;
-         for (j = 0; j < 8; j++) {
+         if (rounding)
-                 for (i = 0; i < 8; i++) {
+                 for (j = 0; j < 8*stride; j+=stride)
-                         int16_t tot =
+                 {
-                                 src[j * stride + i] + src[j * stride + i + 1] +
+                                 dst[j + 0] = (uint8_t)((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +1)>>2);
-                                 src[j * stride + i + stride] + src[j * stride + i + stride +
+                                 dst[j + 1] = (uint8_t)((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +1)>>2);
-];
+                                 dst[j + 2] = (uint8_t)((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +1)>>2);
-                         tot = ((tot + 2 - rounding) >> 2);
+                                 dst[j + 3] = (uint8_t)((src[j+3] + src[j+4] + src[j+stride+3] + src[j+stride+4] +1)>>2);
-                         dst[j * stride + i] = (uint8_t) tot;
+                                 dst[j + 4] = (uint8_t)((src[j+4] + src[j+5] + src[j+stride+4] + src[j+stride+5] +1)>>2);
-                 }
+                                 dst[j + 5] = (uint8_t)((src[j+5] + src[j+6] + src[j+stride+5] + src[j+stride+6] +1)>>2);
+                                 dst[j + 6] = (uint8_t)((src[j+6] + src[j+7] + src[j+stride+6] + src[j+stride+7] +1)>>2);
+                                 dst[j + 7] = (uint8_t)((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +1)>>2);
+                 }
+         else
+                 for (j = 0; j < 8*stride; j+=stride)
+                 {
+                                 dst[j + 0] = (uint8_t)((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +2)>>2);
+                                 dst[j + 1] = (uint8_t)((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +2)>>2);
+                                 dst[j + 2] = (uint8_t)((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +2)>>2);
+                                 dst[j + 3] = (uint8_t)((src[j+3] + src[j+4] + src[j+stride+3] + src[j+stride+4] +2)>>2);
+                                 dst[j + 4] = (uint8_t)((src[j+4] + src[j+5] + src[j+stride+4] + src[j+stride+5] +2)>>2);
+                                 dst[j + 5] = (uint8_t)((src[j+5] + src[j+6] + src[j+stride+5] + src[j+stride+6] +2)>>2);
+                                 dst[j + 6] = (uint8_t)((src[j+6] + src[j+7] + src[j+stride+6] + src[j+stride+7] +2)>>2);
+                                 dst[j + 7] = (uint8_t)((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +2)>>2);
          }
  }

 Legend:



Removed from v.1.10
 


changed lines


 
Added in v.1.10.2.5
 Legend:



Removed from v.1.10
 


changed lines


 
Added in v.1.10.2.5
-Removed from v.1.10
+Added in v.1.10.2.5

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4