Diff of /xvidcore/src/image/interpolate8x8.c

-revision 1.11, Tue Mar  4 16:33:41 2003 UTC
+revision 1.13, Tue Aug 10 21:58:55 2004 UTC
 Line 1
- /**************************************************************************
+ /*****************************************************************************
   *
   *      XVID MPEG-4 VIDEO CODEC
-  *      8x8 block-based halfpel interpolation
+  *      - 8x8 block-based halfpel interpolation -
+  *
+  *  Copyright(C) 2001-2003 Peter Ross <pross@xvid.org>
   *
   *      This program is free software; you can redistribute it and/or modify
   *      it under the terms of the GNU General Public License as published by
-Line 15
+Line 17
   *
   *      You should have received a copy of the GNU General Public License
   *      along with this program; if not, write to the Free Software
-  *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+  *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
-  *
-  *************************************************************************/
- /**************************************************************************
-  *
-  *      History:
   *
-  *  05.10.2002  new bilinear and qpel interpolation code - Isibaar
+  * $Id$
-  *      27.12.2001      modified "compensate_halfpel"
-  *      05.11.2001      initial version; (c)2001 peter ross <pross@cs.rmit.edu.au>
   *
-  *************************************************************************/
+  ****************************************************************************/
  #include "../portab.h"
  #include "../global.h"
  #include "interpolate8x8.h"
- // function pointers
+ /* function pointers */
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_h;
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_v;
  INTERPOLATE8X8_PTR interpolate8x8_halfpel_hv;
+ INTERPOLATE8X8_PTR interpolate8x8_halfpel_add;
+ INTERPOLATE8X8_PTR interpolate8x8_halfpel_h_add;
+ INTERPOLATE8X8_PTR interpolate8x8_halfpel_v_add;
+ INTERPOLATE8X8_PTR interpolate8x8_halfpel_hv_add;
  INTERPOLATE8X8_AVG2_PTR interpolate8x8_avg2;
  INTERPOLATE8X8_AVG4_PTR interpolate8x8_avg4;
-Line 54
+Line 53
  INTERPOLATE8X8_6TAP_LOWPASS_PTR interpolate8x8_6tap_lowpass_h;
  INTERPOLATE8X8_6TAP_LOWPASS_PTR interpolate8x8_6tap_lowpass_v;
- void interpolate8x8_avg2_c(uint8_t *dst, const uint8_t *src1, const uint8_t *src2, const uint32_t stride, const uint32_t rounding, const uint32_t height)
+ void __inline
+ interpolate8x8_avg2_c(uint8_t *dst, const uint8_t *src1, const uint8_t *src2, const uint32_t stride, const uint32_t rounding, const uint32_t height)
  {
      uint32_t i;
          const int32_t round = 1 - rounding;
-     for(i = 0; i < height; i++)
+     for(i = 0; i < height; i++) {
-     {
          dst[0] = (src1[0] + src2[0] + round) >> 1;
          dst[1] = (src1[1] + src2[1] + round) >> 1;
          dst[2] = (src1[2] + src2[2] + round) >> 1;
-Line 76
+Line 75
      }
  }
+ void
+ interpolate8x8_halfpel_add_c(uint8_t *dst, const uint8_t *src, const uint32_t stride, const uint32_t rounding)
+ {
+         interpolate8x8_avg2_c(dst, dst, src, stride, 0, 8);
+ }
  void interpolate8x8_avg4_c(uint8_t *dst, const uint8_t *src1, const uint8_t *src2, const uint8_t *src3, const uint8_t *src4, const uint32_t stride, const uint32_t rounding)
  {
      int32_t i;
          const int32_t round = 2 - rounding;
-     for(i = 0; i < 8; i++)
+     for(i = 0; i < 8; i++) {
-     {
          dst[0] = (src1[0] + src2[0] + src3[0] + src4[0] + round) >> 2;
          dst[1] = (src1[1] + src2[1] + src3[1] + src4[1] + round) >> 2;
          dst[2] = (src1[2] + src2[2] + src3[2] + src4[2] + round) >> 2;
-Line 100
+Line 104
      }
  }
- // dst = interpolate(src)
+ /* dst = interpolate(src) */
  void
  interpolate8x8_halfpel_h_c(uint8_t * const dst,
-Line 108
+Line 112
                                                     const uint32_t stride,
                                                     const uint32_t rounding)
  {
-         intptr_t j;
+         uintptr_t j;
-         if (rounding)
+         if (rounding) {
-                 for (j = 7*stride; j >= 0; j-=stride)
+                 for (j = 0; j < 8*stride; j+=stride) {
-                 {
                                  dst[j + 0] = (uint8_t)((src[j + 0] + src[j + 1] )>>1);
                                  dst[j + 1] = (uint8_t)((src[j + 1] + src[j + 2] )>>1);
                                  dst[j + 2] = (uint8_t)((src[j + 2] + src[j + 3] )>>1);
-Line 122
+Line 125
                                  dst[j + 6] = (uint8_t)((src[j + 6] + src[j + 7] )>>1);
                                  dst[j + 7] = (uint8_t)((src[j + 7] + src[j + 8] )>>1);
                  }
-         else
+         } else {
-                 for (j = 0; j < 8*stride; j+=stride)            /* forward or backwards? Who knows ... */
+                 for (j = 0; j < 8*stride; j+=stride) {
-                 {
                                  dst[j + 0] = (uint8_t)((src[j + 0] + src[j + 1] + 1)>>1);
                                  dst[j + 1] = (uint8_t)((src[j + 1] + src[j + 2] + 1)>>1);
                                  dst[j + 2] = (uint8_t)((src[j + 2] + src[j + 3] + 1)>>1);
-Line 135
+Line 137
                                  dst[j + 7] = (uint8_t)((src[j + 7] + src[j + 8] + 1)>>1);
                  }
  }
+ }
+ /* dst = (dst + interpolate(src)/2 */
+ void
+ interpolate8x8_halfpel_h_add_c(uint8_t * const dst,
+                                                    const uint8_t * const src,
+                                                    const uint32_t stride,
+                                                    const uint32_t rounding)
+ {
+         uintptr_t j;
+         if (rounding) {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j + 0] + src[j + 1] )>>1) + dst[j+0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j + 1] + src[j + 2] )>>1) + dst[j+1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j + 2] + src[j + 3] )>>1) + dst[j+2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j + 3] + src[j + 4] )>>1) + dst[j+3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j + 4] + src[j + 5] )>>1) + dst[j+4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j + 5] + src[j + 6] )>>1) + dst[j+5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j + 6] + src[j + 7] )>>1) + dst[j+6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j + 7] + src[j + 8] )>>1) + dst[j+7] + 1)>>1);
+                 }
+         } else {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j + 0] + src[j + 1] + 1)>>1) + dst[j+0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j + 1] + src[j + 2] + 1)>>1) + dst[j+1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j + 2] + src[j + 3] + 1)>>1) + dst[j+2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j + 3] + src[j + 4] + 1)>>1) + dst[j+3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j + 4] + src[j + 5] + 1)>>1) + dst[j+4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j + 5] + src[j + 6] + 1)>>1) + dst[j+5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j + 6] + src[j + 7] + 1)>>1) + dst[j+6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j + 7] + src[j + 8] + 1)>>1) + dst[j+7] + 1)>>1);
+                 }
+         }
+ }
+ /* dst = interpolate(src) */
  void
  interpolate8x8_halfpel_v_c(uint8_t * const dst,
-Line 144
+Line 182
                                                     const uint32_t stride,
                                                     const uint32_t rounding)
  {
-         intptr_t j;
+         uintptr_t j;
- //      const uint8_t * const src2 = src+stride;                /* using a second pointer is _not_ faster here */
-         if (rounding)
-                 for (j = 0; j < 8*stride; j+=stride)            /* forward is better. Some automatic prefetch perhaps. */
+         if (rounding) {
-                 {
+                 for (j = 0; j < 8*stride; j+=stride) {
                                  dst[j + 0] = (uint8_t)((src[j + 0] + src[j + stride + 0] )>>1);
                                  dst[j + 1] = (uint8_t)((src[j + 1] + src[j + stride + 1] )>>1);
                                  dst[j + 2] = (uint8_t)((src[j + 2] + src[j + stride + 2] )>>1);
-Line 159
+Line 196
                                  dst[j + 6] = (uint8_t)((src[j + 6] + src[j + stride + 6] )>>1);
                                  dst[j + 7] = (uint8_t)((src[j + 7] + src[j + stride + 7] )>>1);
                  }
-         else
+         } else {
-                 for (j = 0; j < 8*stride; j+=stride)
+                 for (j = 0; j < 8*stride; j+=stride) {
-                 {
                                  dst[j + 0] = (uint8_t)((src[j + 0] + src[j + stride + 0] + 1)>>1);
                                  dst[j + 1] = (uint8_t)((src[j + 1] + src[j + stride + 1] + 1)>>1);
                                  dst[j + 2] = (uint8_t)((src[j + 2] + src[j + stride + 2] + 1)>>1);
-Line 172
+Line 208
                                  dst[j + 7] = (uint8_t)((src[j + 7] + src[j + stride + 7] + 1)>>1);
                  }
  }
+ }
+ /* dst = (dst + interpolate(src))/2 */
  void
- interpolate8x8_halfpel_hv_c(uint8_t * const dst,
+ interpolate8x8_halfpel_v_add_c(uint8_t * const dst,
                                                          const uint8_t * const src,
                                                          const uint32_t stride,
                                                          const uint32_t rounding)
  {
-         intptr_t j;
+         uintptr_t j;
+         if (rounding) {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j + 0] + src[j + stride + 0] )>>1) + dst[j+0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j + 1] + src[j + stride + 1] )>>1) + dst[j+1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j + 2] + src[j + stride + 2] )>>1) + dst[j+2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j + 3] + src[j + stride + 3] )>>1) + dst[j+3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j + 4] + src[j + stride + 4] )>>1) + dst[j+4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j + 5] + src[j + stride + 5] )>>1) + dst[j+5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j + 6] + src[j + stride + 6] )>>1) + dst[j+6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j + 7] + src[j + stride + 7] )>>1) + dst[j+7] + 1)>>1);
+                 }
+         } else {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j + 0] + src[j + stride + 0] + 1)>>1) + dst[j+0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j + 1] + src[j + stride + 1] + 1)>>1) + dst[j+1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j + 2] + src[j + stride + 2] + 1)>>1) + dst[j+2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j + 3] + src[j + stride + 3] + 1)>>1) + dst[j+3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j + 4] + src[j + stride + 4] + 1)>>1) + dst[j+4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j + 5] + src[j + stride + 5] + 1)>>1) + dst[j+5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j + 6] + src[j + stride + 6] + 1)>>1) + dst[j+6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j + 7] + src[j + stride + 7] + 1)>>1) + dst[j+7] + 1)>>1);
+                 }
+         }
+ }
+ /* dst = interpolate(src) */
-         if (rounding)
+ void
-                 for (j = 7*stride; j >= 0; j-=stride)
+ interpolate8x8_halfpel_hv_c(uint8_t * const dst,
+                                                         const uint8_t * const src,
+                                                         const uint32_t stride,
+                                                         const uint32_t rounding)
                  {
+         uintptr_t j;
+         if (rounding) {
+                 for (j = 0; j < 8*stride; j+=stride) {
                                  dst[j + 0] = (uint8_t)((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +1)>>2);
                                  dst[j + 1] = (uint8_t)((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +1)>>2);
                                  dst[j + 2] = (uint8_t)((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +1)>>2);
-Line 194
+Line 267
                                  dst[j + 6] = (uint8_t)((src[j+6] + src[j+7] + src[j+stride+6] + src[j+stride+7] +1)>>2);
                                  dst[j + 7] = (uint8_t)((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +1)>>2);
                  }
-         else
+         } else {
-                 for (j = 7*stride; j >= 0; j-=stride)
+                 for (j = 0; j < 8*stride; j+=stride) {
-                 {
                                  dst[j + 0] = (uint8_t)((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +2)>>2);
                                  dst[j + 1] = (uint8_t)((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +2)>>2);
                                  dst[j + 2] = (uint8_t)((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +2)>>2);
-Line 207
+Line 279
                                  dst[j + 7] = (uint8_t)((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +2)>>2);
                  }
  }
+ }
+ /* dst = (interpolate(src) + dst)/2 */
+ void
+ interpolate8x8_halfpel_hv_add_c(uint8_t * const dst,
+                                                         const uint8_t * const src,
+                                                         const uint32_t stride,
+                                                         const uint32_t rounding)
+ {
+         uintptr_t j;
+         if (rounding) {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +1)>>2) + dst[j+0])>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +1)>>2) + dst[j+1])>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +1)>>2) + dst[j+2])>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j+3] + src[j+4] + src[j+stride+3] + src[j+stride+4] +1)>>2) + dst[j+3])>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j+4] + src[j+5] + src[j+stride+4] + src[j+stride+5] +1)>>2) + dst[j+4])>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j+5] + src[j+6] + src[j+stride+5] + src[j+stride+6] +1)>>2) + dst[j+5])>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j+6] + src[j+7] + src[j+stride+6] + src[j+stride+7] +1)>>2) + dst[j+6])>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +1)>>2) + dst[j+7])>>1);
+                 }
+         } else {
+                 for (j = 0; j < 8*stride; j+=stride) {
+                                 dst[j + 0] = (uint8_t)((((src[j+0] + src[j+1] + src[j+stride+0] + src[j+stride+1] +2)>>2) + dst[j+0] + 1)>>1);
+                                 dst[j + 1] = (uint8_t)((((src[j+1] + src[j+2] + src[j+stride+1] + src[j+stride+2] +2)>>2) + dst[j+1] + 1)>>1);
+                                 dst[j + 2] = (uint8_t)((((src[j+2] + src[j+3] + src[j+stride+2] + src[j+stride+3] +2)>>2) + dst[j+2] + 1)>>1);
+                                 dst[j + 3] = (uint8_t)((((src[j+3] + src[j+4] + src[j+stride+3] + src[j+stride+4] +2)>>2) + dst[j+3] + 1)>>1);
+                                 dst[j + 4] = (uint8_t)((((src[j+4] + src[j+5] + src[j+stride+4] + src[j+stride+5] +2)>>2) + dst[j+4] + 1)>>1);
+                                 dst[j + 5] = (uint8_t)((((src[j+5] + src[j+6] + src[j+stride+5] + src[j+stride+6] +2)>>2) + dst[j+5] + 1)>>1);
+                                 dst[j + 6] = (uint8_t)((((src[j+6] + src[j+7] + src[j+stride+6] + src[j+stride+7] +2)>>2) + dst[j+6] + 1)>>1);
+                                 dst[j + 7] = (uint8_t)((((src[j+7] + src[j+8] + src[j+stride+7] + src[j+stride+8] +2)>>2) + dst[j+7] + 1)>>1);
+                 }
+         }
+ }
  /*************************************************************
   * QPEL STUFF STARTS HERE                                    *

 Legend:



Removed from v.1.11
 


changed lines


 
Added in v.1.13
 Legend:



Removed from v.1.11
 


changed lines


 
Added in v.1.13
-Removed from v.1.11
+Added in v.1.13

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4