Diff of /xvidcore/src/decoder.c

-revision 1.6, Thu Mar 28 12:24:41 2002 UTC
+revision 1.10, Mon Apr  8 23:50:15 2002 UTC
 Line 32
   *
   *      History:
   *
+  *  29.03.2002  interlacing fix - compensated block wasn't being used when
+  *              reconstructing blocks, thus artifacts
+  *              interlacing speedup - used transfers to re-interlace
+  *              interlaced decoding should be as fast as progressive now
   *  26.03.2002  interlacing support - moved transfers outside decode loop
   *      26.12.2001      decoder_mbinter: dequant/idct moved within if(coded) block
   *      22.12.2001      block based interpolation
-Line 55
+Line 59
  #include "dct/fdct.h"
  #include "utils/mem_transfer.h"
  #include "image/interpolate8x8.h"
- #include "utils/mbfunctions.h"
  #include "bitstream/mbcoding.h"
  #include "prediction/mbprediction.h"
-Line 108
+Line 111
          }
          init_timer();
-         create_vlc_tables();
          return XVID_ERR_OK;
  }
-Line 121
+Line 123
          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
          xvid_free(dec);
-         destroy_vlc_tables();
          write_timer();
          return XVID_ERR_OK;
  }
 Line 147
                                           const uint32_t quant,
                                           const uint32_t intra_dc_threshold)
  {
- #ifdef LINUX
-         DECLARE_ALIGNED_MATRIX(block,6,64,int16_t,16);
+         DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
-         DECLARE_ALIGNED_MATRIX(data,6,64,int16_t,16);
+         DECLARE_ALIGNED_MATRIX(data,  6, 64, int16_t, CACHE_LINE);
- #else
-         CACHE_ALIGN int16_t block[6][64];
+         uint32_t stride = dec->edged_width;
-         CACHE_ALIGN int16_t data[6][64];
+         uint32_t stride2 = stride / 2;
- #endif
+         uint32_t next_block = stride * 8;
-         const uint32_t stride = dec->edged_width;
          uint32_t i;
          uint32_t iQuant = pMB->quant;
          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
      pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
-     pU_Cur = dec->cur.u + (y_pos << 3) * (stride >> 1) + (x_pos << 3);
+         pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
-     pV_Cur = dec->cur.v + (y_pos << 3) * (stride >> 1) + (x_pos << 3);
+         pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
- #ifdef LINUX
+         memset(block, 0, 6*64*sizeof(int16_t));         // clear
-         memset(block,0,sizeof(int16_t)*6*64);
- #else
-         memset(block, 0, sizeof(block));                // clear
- #endif
          for (i = 0; i < 6; i++)
          {
-Line 176
+Line 171
                  int start_coeff;
                  start_timer();
-                 predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, block[i], iQuant, iDcScaler, predictors);
+                 predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i*64], iQuant, iDcScaler, predictors);
                  if (!acpred_flag)
                  {
                          pMB->acpred_directions[i] = 0;
-Line 196
+Line 191
                                  BitstreamSkip(bs, 1);           // marker
                          }
-                         block[i][0] = dc_dif;
+                         block[i*64 + 0] = dc_dif;
                          start_coeff = 1;
                  }
                  else
-Line 207
+Line 202
                  start_timer();
                  if (cbp & (1 << (5-i)))                 // coded
                  {
-                         get_intra_block(bs, block[i], pMB->acpred_directions[i], start_coeff);
+                         get_intra_block(bs, &block[i*64], pMB->acpred_directions[i], start_coeff);
                  }
                  stop_coding_timer();
                  start_timer();
-                 add_acdc(pMB, i, block[i], iDcScaler, predictors);
+                 add_acdc(pMB, i, &block[i*64], iDcScaler, predictors);
                  stop_prediction_timer();
                  start_timer();
                  if (dec->quant_type == 0)
                  {
-                         dequant_intra(data[i], block[i], iQuant, iDcScaler);
+                         dequant_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
                  }
                  else
                  {
-                         dequant4_intra(data[i], block[i], iQuant, iDcScaler);
+                         dequant4_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
                  }
                  stop_iquant_timer();
                  start_timer();
-                 idct(data[i]);
+                 idct(&data[i*64]);
                  stop_idct_timer();
          }
-         start_timer();
          if (dec->interlacing && pMB->field_dct)
          {
-                 MBFieldToFrame(data);
+                 next_block = stride;
+                 stride *= 2;
          }
-         stop_interlacing_timer();
          start_timer();
-         transfer_16to8copy(pY_Cur, data[0], stride);
+         transfer_16to8copy(pY_Cur,                  &data[0*64], stride);
-         transfer_16to8copy(pY_Cur + 8, data[1], stride);
+         transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);
-         transfer_16to8copy(pY_Cur + 8 * stride, data[2], stride);
+         transfer_16to8copy(pY_Cur + next_block,     &data[2*64], stride);
-         transfer_16to8copy(pY_Cur + 8 + 8 * stride, data[3], stride);
+         transfer_16to8copy(pY_Cur + 8 + next_block, &data[3*64], stride);
-         transfer_16to8copy(pU_Cur, data[4], stride / 2);
+         transfer_16to8copy(pU_Cur,                  &data[4*64], stride2);
-         transfer_16to8copy(pV_Cur, data[5], stride / 2);
+         transfer_16to8copy(pV_Cur,                  &data[5*64], stride2);
          stop_transfer_timer();
  }
-Line 270
+Line 264
                                           const uint32_t quant,
                                           const uint32_t rounding)
  {
- #ifdef LINUX
-         DECLARE_ALIGNED_MATRIX(block,6,64,int16_t,16);
-         DECLARE_ALIGNED_MATRIX(data,6,64,int16_t,16);
- #else
-         CACHE_ALIGN int16_t block[6][64];
-         CACHE_ALIGN int16_t data[6][64];
- #endif
-         const uint32_t stride = dec->edged_width;
+         DECLARE_ALIGNED_MATRIX(block,6, 64, int16_t, CACHE_LINE);
-         const uint32_t stride2 = dec->edged_width / 2;
+         DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
+         uint32_t stride = dec->edged_width;
+         uint32_t stride2 = stride / 2;
+         uint32_t next_block = stride * 8;
      uint32_t i;
      uint32_t iQuant = pMB->quant;
          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
          int uv_dx, uv_dy;
      pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
-     pU_Cur = dec->cur.u + (y_pos << 3) * (stride >> 1) + (x_pos << 3);
+         pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
-     pV_Cur = dec->cur.v + (y_pos << 3) * (stride >> 1) + (x_pos << 3);
+         pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)
          {
-Line 320
+Line 311
          {
                  if (cbp & (1 << (5-i)))                 // coded
                  {
-                         memset(block[i], 0, 64 * sizeof(int16_t));              // clear
+                         memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear
                          start_timer();
-                         get_inter_block(bs, block[i]);
+                         get_inter_block(bs, &block[i*64]);
                          stop_coding_timer();
                          start_timer();
                          if (dec->quant_type == 0)
                          {
-                                 dequant_inter(data[i], block[i], iQuant);
+                                 dequant_inter(&data[i*64], &block[i*64], iQuant);
                          }
                          else
                          {
-                                 dequant4_inter(data[i], block[i], iQuant);
+                                 dequant4_inter(&data[i*64], &block[i*64], iQuant);
                          }
                          stop_iquant_timer();
                          start_timer();
-                         idct(data[i]);
+                         idct(&data[i*64]);
                          stop_idct_timer();
                  }
          }
-         start_timer();
+         if (dec->interlacing && pMB->field_dct)
-         if (pMB->field_dct)
          {
-                 MBFieldToFrame(data);
+                 next_block = stride;
+                 stride *= 2;
          }
-         stop_interlacing_timer();
          start_timer();
          if (cbp & 32)
-                 transfer_16to8add(pY_Cur, data[0], stride);
+                 transfer_16to8add(pY_Cur,                  &data[0*64], stride);
          if (cbp & 16)
-                 transfer_16to8add(pY_Cur + 8, data[1], stride);
+                 transfer_16to8add(pY_Cur + 8,              &data[1*64], stride);
          if (cbp & 8)
-                 transfer_16to8add(pY_Cur + 8 * stride, data[2], stride);
+                 transfer_16to8add(pY_Cur + next_block,     &data[2*64], stride);
          if (cbp & 4)
-                 transfer_16to8add(pY_Cur + 8 + 8 * stride, data[3], stride);
+                 transfer_16to8add(pY_Cur + 8 + next_block, &data[3*64], stride);
          if (cbp & 2)
-                 transfer_16to8add(pU_Cur, data[4], stride / 2);
+                 transfer_16to8add(pU_Cur,                  &data[4*64], stride2);
          if (cbp & 1)
-                 transfer_16to8add(pV_Cur, data[5], stride / 2);
+                 transfer_16to8add(pV_Cur,                  &data[5*64], stride2);
          stop_transfer_timer();
  }
  void decoder_iframe(DECODER * dec, Bitstream * bs, int quant, int intra_dc_threshold)
  {
          uint32_t x, y;
          for (y = 0; y < dec->mb_height; y++)
-Line 421
+Line 412
                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);
                  }
          }
  }
  void get_motion_vector(DECODER *dec, Bitstream *bs, int x, int y, int k, VECTOR * mv, int fcode)
  {
          int scale_fac = 1 << (fcode - 1);
          int high = (32 * scale_fac) - 1;
          int low = ((-32) * scale_fac);
-Line 475
+Line 468
  void decoder_pframe(DECODER * dec, Bitstream * bs, int rounding, int quant, int fcode, int intra_dc_threshold)
  {
          uint32_t x, y;
          image_swap(&dec->cur, &dec->refn);
-Line 627
+Line 621
  int decoder_decode(DECODER * dec, XVID_DEC_FRAME * frame)
  {
          Bitstream bs;
          uint32_t rounding;
          uint32_t quant;
-Line 670
+Line 665
          stop_global_timer();
          return XVID_ERR_OK;
  }

 Legend:



Removed from v.1.6
 


changed lines


 
Added in v.1.10
 Legend:



Removed from v.1.6
 


changed lines


 
Added in v.1.10
-Removed from v.1.6
+Added in v.1.10

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4