Diff of /xvidcore/src/decoder.c

-revision 1.57, Fri May 21 14:40:15 2004 UTC
+revision 1.65, Tue Aug 10 21:58:55 2004 UTC
 Line 48
  #include "image/interpolate8x8.h"
  #include "image/reduced.h"
  #include "image/font.h"
+ #include "image/qpel.h"
  #include "bitstream/mbcoding.h"
  #include "prediction/mbprediction.h"
-Line 303
+Line 304
                  start_timer();
                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i * 64],
-                                          iQuant, iDcScaler, predictors, bound, dec->bs_version);
+                                          iQuant, iDcScaler, predictors, bound);
                  if (!acpred_flag) {
                          pMB->acpred_directions[i] = 0;
                  }
-Line 339
+Line 340
                  stop_coding_timer();
                  start_timer();
-                 add_acdc(pMB, i, &block[i * 64], iDcScaler, predictors);
+                 add_acdc(pMB, i, &block[i * 64], iDcScaler, predictors, dec->bs_version);
                  stop_prediction_timer();
                  start_timer();
-Line 390
+Line 391
                                  uint8_t * pY_Cur,
                                  uint8_t * pU_Cur,
                                  uint8_t * pV_Cur,
-                                 const int reduced_resolution,
+                                 int reduced_resolution,
                                  const MACROBLOCK * pMB)
  {
-         DECLARE_ALIGNED_MATRIX(block, 1, 64, int16_t, CACHE_LINE);
+         DECLARE_ALIGNED_MATRIX(data, 1, 64, int16_t, CACHE_LINE);
-         DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
          int stride = dec->edged_width;
          int next_block = stride * (reduced_resolution ? 16 : 8);
-         const int stride2 = stride/2;
          int i;
          const uint32_t iQuant = pMB->quant;
          const int direction = dec->alternate_vertical_scan ? 2 : 0;
-         const quant_interFuncPtr dequant = dec->quant_type == 0 ? dequant_h263_inter : dequant_mpeg_inter;
+         typedef void (*get_inter_block_function_t)(
+                         Bitstream * bs,
+                         int16_t * block,
+                         int direction,
+                         const int quant,
+                         const uint16_t *matrix);
+         typedef void (*add_residual_function_t)(
+                         uint8_t *predicted_block,
+                         const int16_t *residual,
+                         int stride);
+         const get_inter_block_function_t get_inter_block = (dec->quant_type == 0)
+                 ? (get_inter_block_function_t)get_inter_block_h263
+                 : (get_inter_block_function_t)get_inter_block_mpeg;
+         const add_residual_function_t add_residual = (reduced_resolution)
+                 ? (add_residual_function_t)add_upsampled_8x8_16to8
+                 : (add_residual_function_t)transfer_16to8add;
-         for (i = 0; i < 6; i++) {
+         uint8_t *dst[6];
+         int strides[6];
-                 if (cbp & (1 << (5 - i))) {     /* coded */
-                         memset(block, 0, 64 * sizeof(int16_t)); /* clear */
+         if (dec->interlacing && pMB->field_dct) {
+                 next_block = stride;
+                 stride *= 2;
+         }
-                         start_timer();
+         reduced_resolution = !!reduced_resolution;
-                         get_inter_block(bs, block, direction);
+         dst[0] = pY_Cur;
-                         stop_coding_timer();
+         dst[2] = pY_Cur + next_block;
+         dst[1] = dst[0] + (8<<reduced_resolution);
+         dst[3] = dst[2] + (8<<reduced_resolution);
+         dst[4] = pU_Cur;
+         dst[5] = pV_Cur;
+         strides[0] = strides[1] = strides[2] = strides[3] = stride;
+         strides[4] = stride/2;
+         strides[5] = stride/2;
+         for (i = 0; i < 6; i++) {
+                 /* Process only coded blocks */
+                 if (cbp & (1 << (5 - i))) {
+                         /* Clear the block */
+                         memset(&data[0], 0, 64*sizeof(int16_t));
+                         /* Decode coeffs and dequantize on the fly */
                          start_timer();
-                         dequant(&data[i * 64], block, iQuant, dec->mpeg_quant_matrices);
+                         get_inter_block(bs, &data[0], direction, iQuant, get_inter_matrix(dec->mpeg_quant_matrices));
-                         stop_iquant_timer();
+                         stop_coding_timer();
+                         /* iDCT */
                          start_timer();
-                         idct(&data[i * 64]);
+                         idct(&data[0]);
                          stop_idct_timer();
-                 }
-         }
-         if (dec->interlacing && pMB->field_dct) {
-                 next_block = stride;
-                 stride *= 2;
-         }
+                         /* Add this residual to the predicted block */
          start_timer();
-         if (reduced_resolution) {
+                         add_residual(dst[i], &data[0], strides[i]);
-                 if (cbp & 32)
-                         add_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
-                 if (cbp & 16)
-                         add_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
-                 if (cbp & 8)
-                         add_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
-                 if (cbp & 4)
-                         add_upsampled_8x8_16to8(pY_Cur + 16 + next_block, &data[3 * 64], stride);
-                 if (cbp & 2)
-                         add_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
-                 if (cbp & 1)
-                         add_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
-         } else {
-                 if (cbp & 32)
-                         transfer_16to8add(pY_Cur, &data[0 * 64], stride);
-                 if (cbp & 16)
-                         transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
-                 if (cbp & 8)
-                         transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
-                 if (cbp & 4)
-                         transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
-                 if (cbp & 2)
-                         transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
-                 if (cbp & 1)
-                         transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
-         }
          stop_transfer_timer();
  }
+         }
+ }
  /* decode an inter macroblock */
  static void
-Line 1032
+Line 1037
          if (!direct) {
                  uv_dx = pMB->mvs[0].x;
                  uv_dy = pMB->mvs[0].y;
                  b_uv_dx = pMB->b_mvs[0].x;
                  b_uv_dy = pMB->b_mvs[0].y;
-Line 1045
+Line 1049
                  uv_dx = (uv_dx >> 1) + roundtab_79[uv_dx & 0x3];
                  uv_dy = (uv_dy >> 1) + roundtab_79[uv_dy & 0x3];
                  b_uv_dx = (b_uv_dx >> 1) + roundtab_79[b_uv_dx & 0x3];
                  b_uv_dy = (b_uv_dy >> 1) + roundtab_79[b_uv_dy & 0x3];
          } else {
-                 if(dec->quarterpel) {
-                         uv_dx = (pMB->mvs[0].x / 2) + (pMB->mvs[1].x / 2) + (pMB->mvs[2].x / 2) + (pMB->mvs[3].x / 2);
-                         uv_dy = (pMB->mvs[0].y / 2) + (pMB->mvs[1].y / 2) + (pMB->mvs[2].y / 2) + (pMB->mvs[3].y / 2);
-                         b_uv_dx = (pMB->b_mvs[0].x / 2) + (pMB->b_mvs[1].x / 2) + (pMB->b_mvs[2].x / 2) + (pMB->b_mvs[3].x / 2);
-                         b_uv_dy = (pMB->b_mvs[0].y / 2) + (pMB->b_mvs[1].y / 2) + (pMB->b_mvs[2].y / 2) + (pMB->b_mvs[3].y / 2);
-                 } else {
                          uv_dx = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
                          uv_dy = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
                          b_uv_dx = pMB->b_mvs[0].x + pMB->b_mvs[1].x + pMB->b_mvs[2].x + pMB->b_mvs[3].x;
                          b_uv_dy = pMB->b_mvs[0].y + pMB->b_mvs[1].y + pMB->b_mvs[2].y + pMB->b_mvs[3].y;
+                 if (dec->quarterpel) {
+                         uv_dx /= 2;
+                         uv_dy /= 2;
+                         b_uv_dx /= 2;
+                         b_uv_dy /= 2;
                  }
                  uv_dx = (uv_dx >> 3) + roundtab_76[uv_dx & 0xf];
-Line 1107
+Line 1110
          if(dec->quarterpel) {
                  if(!direct) {
-                         interpolate16x16_quarterpel(dec->tmp.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
+                         interpolate16x16_add_quarterpel(dec->cur.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
                                                                                  dec->qtmp.y + 128, 16*x_pos, 16*y_pos,
                                                                                  pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
                  } else {
-                         interpolate8x8_quarterpel(dec->tmp.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
+                         interpolate8x8_add_quarterpel(dec->cur.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
                                                                                  dec->qtmp.y + 128, 16*x_pos, 16*y_pos,
                                                                                  pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
-                         interpolate8x8_quarterpel(dec->tmp.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
+                         interpolate8x8_add_quarterpel(dec->cur.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
                                                                                  dec->qtmp.y + 128, 16*x_pos + 8, 16*y_pos,
                                                                                  pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride, 0);
-                         interpolate8x8_quarterpel(dec->tmp.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
+                         interpolate8x8_add_quarterpel(dec->cur.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
                                                                                  dec->qtmp.y + 128, 16*x_pos, 16*y_pos + 8,
                                                                                  pMB->b_mvs[2].x, pMB->b_mvs[2].y, stride, 0);
-                         interpolate8x8_quarterpel(dec->tmp.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
+                         interpolate8x8_add_quarterpel(dec->cur.y, backward.y, dec->qtmp.y, dec->qtmp.y + 64,
                                                                                  dec->qtmp.y + 128, 16*x_pos + 8, 16*y_pos + 8,
                                                                                  pMB->b_mvs[3].x, pMB->b_mvs[3].y, stride, 0);
                  }
          } else {
-                 interpolate8x8_switch(dec->tmp.y, backward.y, 16 * x_pos, 16 * y_pos,
+                 interpolate8x8_add_switch(dec->cur.y, backward.y, 16 * x_pos, 16 * y_pos,
                                                          pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
-                 interpolate8x8_switch(dec->tmp.y, backward.y, 16 * x_pos + 8,
+                 interpolate8x8_add_switch(dec->cur.y, backward.y, 16 * x_pos + 8,
 * y_pos, pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride, 0);
-                 interpolate8x8_switch(dec->tmp.y, backward.y, 16 * x_pos,
+                 interpolate8x8_add_switch(dec->cur.y, backward.y, 16 * x_pos,
 * y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y, stride, 0);
-                 interpolate8x8_switch(dec->tmp.y, backward.y, 16 * x_pos + 8,
+                 interpolate8x8_add_switch(dec->cur.y, backward.y, 16 * x_pos + 8,
 * y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y, stride, 0);
          }
-         interpolate8x8_switch(dec->tmp.u, backward.u, 8 * x_pos, 8 * y_pos,
+         interpolate8x8_add_switch(dec->cur.u, backward.u, 8 * x_pos, 8 * y_pos,
                                                  b_uv_dx, b_uv_dy, stride2, 0);
-         interpolate8x8_switch(dec->tmp.v, backward.v, 8 * x_pos, 8 * y_pos,
+         interpolate8x8_add_switch(dec->cur.v, backward.v, 8 * x_pos, 8 * y_pos,
                                                  b_uv_dx, b_uv_dy, stride2, 0);
-         interpolate8x8_avg2(dec->cur.y + (16 * y_pos * stride) + 16 * x_pos,
-                                                 dec->cur.y + (16 * y_pos * stride) + 16 * x_pos,
-                                                 dec->tmp.y + (16 * y_pos * stride) + 16 * x_pos,
-                                                 stride, 1, 8);
-         interpolate8x8_avg2(dec->cur.y + (16 * y_pos * stride) + 16 * x_pos + 8,
-                                                 dec->cur.y + (16 * y_pos * stride) + 16 * x_pos + 8,
-                                                 dec->tmp.y + (16 * y_pos * stride) + 16 * x_pos + 8,
-                                                 stride, 1, 8);
-         interpolate8x8_avg2(dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
-                                                 dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
-                                                 dec->tmp.y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
-                                                 stride, 1, 8);
-         interpolate8x8_avg2(dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
-                                                 dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
-                                                 dec->tmp.y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
-                                                 stride, 1, 8);
-         interpolate8x8_avg2(dec->cur.u + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 dec->cur.u + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 dec->tmp.u + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 stride2, 1, 8);
-         interpolate8x8_avg2(dec->cur.v + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 dec->cur.v + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 dec->tmp.v + (8 * y_pos * stride2) + 8 * x_pos,
-                                                 stride2, 1, 8);
          stop_comp_timer();
          if (cbp)
-Line 1218
+Line 1191
          uint32_t x, y;
          VECTOR mv;
          const VECTOR zeromv = {0,0};
-         const int32_t TRB = dec->time_pp - dec->time_bp, TRD = dec->time_pp;
          int i;
          if (!dec->is_edged[0]) {
-Line 1322
+Line 1294
                          case MODE_DIRECT_NONE_MV:
                                  for (i = 0; i < 4; i++) {
-                                         mb->mvs[i].x = (int32_t) ((TRB * last_mb->mvs[i].x) / TRD + mv.x);
+                                         mb->mvs[i].x = last_mb->mvs[i].x*dec->time_bp/dec->time_pp + mv.x;
-                                         mb->b_mvs[i].x = (int32_t) ((mv.x == 0)
+                                         mb->mvs[i].y = last_mb->mvs[i].y*dec->time_bp/dec->time_pp + mv.y;
-                                                                         ? ((TRB - TRD) * last_mb->mvs[i].x) / TRD
-                                                                         : mb->mvs[i].x - last_mb->mvs[i].x);
+                                         mb->b_mvs[i].x = (mv.x)
-                                         mb->mvs[i].y = (int32_t) ((TRB * last_mb->mvs[i].y) / TRD + mv.y);
+                                                 ?  mb->mvs[i].x - last_mb->mvs[i].x
-                                         mb->b_mvs[i].y = (int32_t) ((mv.y == 0)
+                                                 : last_mb->mvs[i].x*(dec->time_bp - dec->time_pp)/dec->time_pp;
-                                                                         ? ((TRB - TRD) * last_mb->mvs[i].y) / TRD
+                                         mb->b_mvs[i].y = (mv.y)
-                                                                         : mb->mvs[i].y - last_mb->mvs[i].y);
+                                                 ? mb->mvs[i].y - last_mb->mvs[i].y
+                                                 : last_mb->mvs[i].y*(dec->time_bp - dec->time_pp)/dec->time_pp;
                                  }
                                  decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
-Line 1573
+Line 1546
                  if (dec->low_delay) {
                          DPRINTF(XVID_DEBUG_ERROR, "warning: bvop found in low_delay==1 stream\n");
-                         dec->low_delay = 1;
+                         dec->low_delay = 0;
                  }
                  if (dec->frames < 2) {

 Legend:



Removed from v.1.57
 


changed lines


 
Added in v.1.65
 Legend:



Removed from v.1.57
 


changed lines


 
Added in v.1.65
-Removed from v.1.57
+Added in v.1.65

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4