[cvs] / xvidcore / src / decoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/decoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.14, Fri May 3 00:41:22 2002 UTC revision 1.37.2.18, Tue Dec 10 11:13:50 2002 UTC
# Line 32  Line 32 
32   *   *
33   *  History:   *  History:
34   *   *
35     *  15.07.2002  fix a bug in B-frame decode at DIRECT mode
36     *              MinChen <chenm001@163.com>
37     *  10.07.2002  added BFRAMES_DEC_DEBUG support
38     *              Fix a little bug for low_delay flage
39     *              MinChen <chenm001@163.com>
40     *  28.06.2002  added basic resync support to iframe/pframe_decode()
41     *  22.06.2002  added primative N_VOP support
42     *                              #define BFRAMES_DEC now enables Minchen's bframe decoder
43     *  08.05.2002  add low_delay support for B_VOP decode
44     *              MinChen <chenm001@163.com>
45     *  05.05.2002  fix some B-frame decode problem
46   *  02.05.2002  add B-frame decode support(have some problem);   *  02.05.2002  add B-frame decode support(have some problem);
47   *              MinChen <chenm001@163.com>   *              MinChen <chenm001@163.com>
48   *  22.04.2002  add some B-frame decode support;  chenm001 <chenm001@163.com>   *  22.04.2002  add some B-frame decode support;  chenm001 <chenm001@163.com>
# Line 51  Line 62 
62  #include <stdlib.h>  #include <stdlib.h>
63  #include <string.h>  #include <string.h>
64    
65    #ifdef BFRAMES_DEC_DEBUG
66            #define BFRAMES_DEC
67    #endif
68    
69  #include "xvid.h"  #include "xvid.h"
70  #include "portab.h"  #include "portab.h"
71    
# Line 64  Line 79 
79  #include "dct/fdct.h"  #include "dct/fdct.h"
80  #include "utils/mem_transfer.h"  #include "utils/mem_transfer.h"
81  #include "image/interpolate8x8.h"  #include "image/interpolate8x8.h"
82    #include "image/reduced.h"
83    
84  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
85  #include "prediction/mbprediction.h"  #include "prediction/mbprediction.h"
86  #include "utils/timer.h"  #include "utils/timer.h"
87  #include "utils/emms.h"  #include "utils/emms.h"
88    #include "motion/motion.h"
89    
90  #include "image/image.h"  #include "image/image.h"
91  #include "image/colorspace.h"  #include "image/colorspace.h"
92  #include "utils/mem_align.h"  #include "utils/mem_align.h"
93    
94  int decoder_create(XVID_DEC_PARAM * param)  int
95    decoder_resize(DECODER * dec)
96  {  {
97          DECODER * dec;          /* free existing */
98    
99          dec = xvid_malloc(sizeof(DECODER), CACHE_LINE);          image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
100          if (dec == NULL)          image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
101          {          image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
102                  return XVID_ERR_MEMORY;          image_destroy(&dec->refh, dec->edged_width, dec->edged_height);
103          }          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
         param->handle = dec;  
104    
105          dec->width = param->width;          if (dec->last_mbs)
106          dec->height = param->height;                  xvid_free(dec->last_mbs);
107            if (dec->mbs)
108                    xvid_free(dec->mbs);
109    
110            /* realloc */
111    
112          dec->mb_width = (dec->width + 15) / 16;          dec->mb_width = (dec->width + 15) / 16;
113          dec->mb_height = (dec->height + 15) / 16;          dec->mb_height = (dec->height + 15) / 16;
# Line 94  Line 115 
115          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;
116          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;
117    
118          if (image_create(&dec->cur, dec->edged_width, dec->edged_height))          if (image_create(&dec->cur, dec->edged_width, dec->edged_height)) {
         {  
119                  xvid_free(dec);                  xvid_free(dec);
120                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
121          }          }
122    
123          if (image_create(&dec->refn[0], dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[0], dec->edged_width, dec->edged_height)) {
         {  
124                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
125                  xvid_free(dec);                  xvid_free(dec);
126                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
127          }          }
128    
129          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
130          // for support B-frame to reference last 2 frame          // for support B-frame to reference last 2 frame
131          if (image_create(&dec->refn[1], dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[1], dec->edged_width, dec->edged_height)) {
         {  
132                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
133                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
134                  xvid_free(dec);                  xvid_free(dec);
135                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
136          }          }
137          if (image_create(&dec->refn[2], dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[2], dec->edged_width, dec->edged_height)) {
         {  
138                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
139                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
140                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
# Line 124  Line 142 
142                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
143          }          }
144    
145          dec->mbs = xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height, CACHE_LINE);          if (image_create(&dec->refh, dec->edged_width, dec->edged_height)) {
146          if (dec->mbs == NULL)                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
147          {                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
148                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
149                    image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
150                    xvid_free(dec);
151                    return XVID_ERR_MEMORY;
152            }
153    
154            dec->mbs =
155                    xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
156                                            CACHE_LINE);
157            if (dec->mbs == NULL) {
158                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
159                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
160                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
161                  image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
162                    image_destroy(&dec->refh, dec->edged_width, dec->edged_height);
163                  xvid_free(dec);                  xvid_free(dec);
164                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
165          }          }
166            memset(dec->mbs, 0, sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height);
167    
168          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
169          // for skip MB flag          // for skip MB flag
170          dec->last_mbs = xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height, CACHE_LINE);          dec->last_mbs =
171          if (dec->last_mbs == NULL)                  xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
172          {                                          CACHE_LINE);
173            if (dec->last_mbs == NULL) {
174                  xvid_free(dec->mbs);                  xvid_free(dec->mbs);
175                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
176                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
177                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
178                  image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
179                    image_destroy(&dec->refh, dec->edged_width, dec->edged_height);
180                  xvid_free(dec);                  xvid_free(dec);
181                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
182          }          }
183    
184            memset(dec->last_mbs, 0, sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height);
185    
186            return XVID_ERR_OK;
187    }
188    
189    
190    int
191    decoder_create(XVID_DEC_PARAM * param)
192    {
193            DECODER *dec;
194    
195            dec = xvid_malloc(sizeof(DECODER), CACHE_LINE);
196            if (dec == NULL) {
197                    return XVID_ERR_MEMORY;
198            }
199            memset(dec, 0, sizeof(DECODER));
200    
201            param->handle = dec;
202    
203            dec->width = param->width;
204            dec->height = param->height;
205    
206            image_null(&dec->cur);
207            image_null(&dec->refn[0]);
208            image_null(&dec->refn[1]);
209            image_null(&dec->refn[2]);
210            image_null(&dec->refh);
211    
212            dec->mbs = NULL;
213            dec->last_mbs = NULL;
214    
215          init_timer();          init_timer();
216    
217          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
218          // for support B-frame to save reference frame's time          // for support B-frame to save reference frame's time
219          dec->frames = -1;          dec->frames = -1;
220          dec->time = dec->time_base = dec->last_time_base = 0;          dec->time = dec->time_base = dec->last_time_base = 0;
221            dec->low_delay = 0;
222            dec->packed_mode = 0;
223    
224            dec->fixed_dimensions = (dec->width > 0 && dec->height > 0);
225    
226            if (dec->fixed_dimensions)
227                    return decoder_resize(dec);
228            else
229          return XVID_ERR_OK;          return XVID_ERR_OK;
230  }  }
231    
232    
233  int decoder_destroy(DECODER * dec)  int
234    decoder_destroy(DECODER * dec)
235  {  {
236          xvid_free(dec->last_mbs);          xvid_free(dec->last_mbs);
237          xvid_free(dec->mbs);          xvid_free(dec->mbs);
238          image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);          image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
239          image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);          image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
240          image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);          image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
241            image_destroy(&dec->refh, dec->edged_width, dec->edged_height);
242          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
243          xvid_free(dec);          xvid_free(dec);
244    
# Line 175  Line 248 
248    
249    
250    
251  static const int32_t dquant_table[4] =  static const int32_t dquant_table[4] = {
 {  
252          -1, -2, 1, 2          -1, -2, 1, 2
253  };  };
254    
# Line 185  Line 257 
257    
258  // decode an intra macroblock  // decode an intra macroblock
259    
260  void decoder_mbintra(DECODER * dec,  void
261    decoder_mbintra(DECODER * dec,
262                       MACROBLOCK * pMB,                       MACROBLOCK * pMB,
263                       const uint32_t x_pos,                       const uint32_t x_pos,
264                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 193  Line 266 
266                       const uint32_t cbp,                       const uint32_t cbp,
267                       Bitstream * bs,                       Bitstream * bs,
268                       const uint32_t quant,                       const uint32_t quant,
269                       const uint32_t intra_dc_threshold)                                  const uint32_t intra_dc_threshold,
270                                    const unsigned int bound,
271                                    const int reduced_resolution)
272  {  {
273    
274          DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
# Line 206  Line 281 
281          uint32_t iQuant = pMB->quant;          uint32_t iQuant = pMB->quant;
282          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
283    
284            if (reduced_resolution) {
285                    pY_Cur = dec->cur.y + (y_pos << 5) * stride + (x_pos << 5);
286                    pU_Cur = dec->cur.u + (y_pos << 4) * stride2 + (x_pos << 4);
287                    pV_Cur = dec->cur.v + (y_pos << 4) * stride2 + (x_pos << 4);
288            }else{
289          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
290          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
291          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
292            }
293    
294          memset(block, 0, 6*64*sizeof(int16_t));         // clear          memset(block, 0, 6*64*sizeof(int16_t));         // clear
295    
296          for (i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
297                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
298                  int16_t predictors[8];                  int16_t predictors[8];
299                  int start_coeff;                  int start_coeff;
300    
301                  start_timer();                  start_timer();
302                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i*64], iQuant, iDcScaler, predictors);                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i * 64],
303                  if (!acpred_flag)                                           iQuant, iDcScaler, predictors, bound);
304                  {                  if (!acpred_flag) {
305                          pMB->acpred_directions[i] = 0;                          pMB->acpred_directions[i] = 0;
306                  }                  }
307                  stop_prediction_timer();                  stop_prediction_timer();
308    
309                  if (quant < intra_dc_threshold)                  if (quant < intra_dc_threshold) {
                 {  
310                          int dc_size;                          int dc_size;
311                          int dc_dif;                          int dc_dif;
312    
313                          dc_size = i < 4 ?  get_dc_size_lum(bs) : get_dc_size_chrom(bs);                          dc_size = i < 4 ?  get_dc_size_lum(bs) : get_dc_size_chrom(bs);
314                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;
315    
316                          if (dc_size > 8)                          if (dc_size > 8) {
                         {  
317                                  BitstreamSkip(bs, 1);           // marker                                  BitstreamSkip(bs, 1);           // marker
318                          }                          }
319    
320                          block[i*64 + 0] = dc_dif;                          block[i*64 + 0] = dc_dif;
321                          start_coeff = 1;                          start_coeff = 1;
322                  }  
323                  else                          DPRINTF(DPRINTF_COEFF,"block[0] %i", dc_dif);
324                  {                  } else {
325                          start_coeff = 0;                          start_coeff = 0;
326                  }                  }
327    
328                  start_timer();                  start_timer();
329                  if (cbp & (1 << (5-i)))                 // coded                  if (cbp & (1 << (5-i)))                 // coded
330                  {                  {
331                          get_intra_block(bs, &block[i*64], pMB->acpred_directions[i], start_coeff);                          int direction = dec->alternate_vertical_scan ?
332                                    2 : pMB->acpred_directions[i];
333    
334                            get_intra_block(bs, &block[i * 64], direction, start_coeff);
335                  }                  }
336                  stop_coding_timer();                  stop_coding_timer();
337    
# Line 259  Line 340 
340                  stop_prediction_timer();                  stop_prediction_timer();
341    
342                  start_timer();                  start_timer();
343                  if (dec->quant_type == 0)                  if (dec->quant_type == 0) {
                 {  
344                          dequant_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);                          dequant_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
345                  }                  } else {
                 else  
                 {  
346                          dequant4_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);                          dequant4_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
347                  }                  }
348                  stop_iquant_timer();                  stop_iquant_timer();
# Line 272  Line 350 
350                  start_timer();                  start_timer();
351                  idct(&data[i*64]);                  idct(&data[i*64]);
352                  stop_idct_timer();                  stop_idct_timer();
353    
354          }          }
355    
356          if (dec->interlacing && pMB->field_dct)          if (dec->interlacing && pMB->field_dct) {
         {  
357                  next_block = stride;                  next_block = stride;
358                  stride *= 2;                  stride *= 2;
359          }          }
360    
361          start_timer();          start_timer();
362    
363            if (reduced_resolution)
364            {
365                    next_block*=2;
366                    copy_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
367                    copy_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
368                    copy_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
369                    copy_upsampled_8x8_16to8(pY_Cur + 16 + next_block, &data[3 * 64], stride);
370                    copy_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
371                    copy_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
372            }else{
373          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);
374          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);
375          transfer_16to8copy(pY_Cur + next_block,     &data[2*64], stride);          transfer_16to8copy(pY_Cur + next_block,     &data[2*64], stride);
376          transfer_16to8copy(pY_Cur + 8 + next_block, &data[3*64], stride);          transfer_16to8copy(pY_Cur + 8 + next_block, &data[3*64], stride);
377          transfer_16to8copy(pU_Cur,                  &data[4*64], stride2);          transfer_16to8copy(pU_Cur,                  &data[4*64], stride2);
378          transfer_16to8copy(pV_Cur,                  &data[5*64], stride2);          transfer_16to8copy(pV_Cur,                  &data[5*64], stride2);
379            }
380          stop_transfer_timer();          stop_transfer_timer();
381  }  }
382    
# Line 296  Line 386 
386    
387  #define SIGN(X) (((X)>0)?1:-1)  #define SIGN(X) (((X)>0)?1:-1)
388  #define ABS(X) (((X)>0)?(X):-(X))  #define ABS(X) (((X)>0)?(X):-(X))
 static const uint32_t roundtab[16] =  
 { 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2 };  
   
389    
390  // decode an inter macroblock  // decode an inter macroblock
391    
392  void decoder_mbinter(DECODER * dec,  void
393    decoder_mbinter(DECODER * dec,
394                       const MACROBLOCK * pMB,                       const MACROBLOCK * pMB,
395                       const uint32_t x_pos,                       const uint32_t x_pos,
396                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 310  Line 398 
398                       const uint32_t cbp,                       const uint32_t cbp,
399                       Bitstream * bs,                       Bitstream * bs,
400                       const uint32_t quant,                       const uint32_t quant,
401                       const uint32_t rounding)                                  const uint32_t rounding,
402                                    const int reduced_resolution)
403  {  {
404    
405          DECLARE_ALIGNED_MATRIX(block,6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(block,6, 64, int16_t, CACHE_LINE);
# Line 318  Line 407 
407    
408          uint32_t stride = dec->edged_width;          uint32_t stride = dec->edged_width;
409          uint32_t stride2 = stride / 2;          uint32_t stride2 = stride / 2;
410          uint32_t next_block = stride * 8;          uint32_t next_block = stride * (reduced_resolution ? 16 : 8);
411          uint32_t i;          uint32_t i;
412          uint32_t iQuant = pMB->quant;          uint32_t iQuant = pMB->quant;
413          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
414    
415          int uv_dx, uv_dy;          int uv_dx, uv_dy;
416            VECTOR mv[4];   /* local copy of mvs */
417    
418            if (reduced_resolution) {
419                    pY_Cur = dec->cur.y + (y_pos << 5) * stride + (x_pos << 5);
420                    pU_Cur = dec->cur.u + (y_pos << 4) * stride2 + (x_pos << 4);
421                    pV_Cur = dec->cur.v + (y_pos << 4) * stride2 + (x_pos << 4);
422                    for (i = 0; i < 4; i++) {
423                            mv[i].x = RRV_MV_SCALEUP(pMB->mvs[i].x);
424                            mv[i].y = RRV_MV_SCALEUP(pMB->mvs[i].y);
425                    }
426            }else{
427          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
428          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
429          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
430                    for (i = 0; i < 4; i++)
431                            mv[i] = pMB->mvs[i];
432            }
433    
434            if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q) {
435                    uv_dx = mv[0].x;
436                    uv_dy = mv[0].y;
437    
438          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)                  if (dec->quarterpel)
439          {          {
440                  uv_dx = pMB->mvs[0].x;                          uv_dx /= 2;
441                  uv_dy = pMB->mvs[0].y;                          uv_dy /= 2;
442                    }
443    
444                    uv_dx = (uv_dx >> 1) + roundtab_79[uv_dx & 0x3];
445                    uv_dy = (uv_dy >> 1) + roundtab_79[uv_dy & 0x3];
446    
447                    start_timer();
448                    if (reduced_resolution)
449                    {
450                            interpolate32x32_switch(dec->cur.y, dec->refn[0].y, 32*x_pos, 32*y_pos,
451                                                                      mv[0].x, mv[0].y, stride,  rounding);
452                            interpolate16x16_switch(dec->cur.u, dec->refn[0].u, 16 * x_pos, 16 * y_pos,
453                                                                      uv_dx, uv_dy, stride2, rounding);
454                            interpolate16x16_switch(dec->cur.v, dec->refn[0].v, 16 * x_pos, 16 * y_pos,
455                                                                      uv_dx, uv_dy, stride2, rounding);
456    
                 uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;  
                 uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;  
457          }          }
458          else          else
459          {          {
460                  int sum;                          if(dec->quarterpel) {
461                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;                                  interpolate16x16_quarterpel(dec->cur.y, dec->refn[0].y, dec->refh.y, dec->refh.y + 64,
462                  uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );                                                                                          dec->refh.y + 128, 16*x_pos, 16*y_pos,
463                                                                                            mv[0].x, mv[0].y, stride,  rounding);
464                            }
465                            else {
466                                    interpolate16x16_switch(dec->cur.y, dec->refn[0].y, 16*x_pos, 16*y_pos,
467                                                                              mv[0].x, mv[0].y, stride,  rounding);
468                            }
469    
470                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;                          interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8 * x_pos, 8 * y_pos,
471                  uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );                                                                    uv_dx, uv_dy, stride2, rounding);
472                            interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8 * x_pos, 8 * y_pos,
473                                                                      uv_dx, uv_dy, stride2, rounding);
474          }          }
475                    stop_comp_timer();
476    
477            } else {        /* MODE_INTER4V */
478                    int sum;
479    
480                    if(dec->quarterpel)
481                            sum = (mv[0].x / 2) + (mv[1].x / 2) + (mv[2].x / 2) + (mv[3].x / 2);
482                    else
483                            sum = mv[0].x + mv[1].x + mv[2].x + mv[3].x;
484    
485                    uv_dx = (sum >> 3) + roundtab_76[sum & 0xf];
486    
487                    if(dec->quarterpel)
488                            sum = (mv[0].y / 2) + (mv[1].y / 2) + (mv[2].y / 2) + (mv[3].y / 2);
489                    else
490                            sum = mv[0].y + mv[1].y + mv[2].y + mv[3].y;
491    
492                    uv_dy = (sum >> 3) + roundtab_76[sum & 0xf];
493    
494          start_timer();          start_timer();
495          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos,     16*y_pos    , pMB->mvs[0].x, pMB->mvs[0].y, stride,  rounding);                  if (reduced_resolution)
496          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos    , pMB->mvs[1].x, pMB->mvs[1].y, stride,  rounding);                  {
497          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos,     16*y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,  rounding);                          interpolate16x16_switch(dec->cur.y, dec->refn[0].y, 32*x_pos, 32*y_pos,
498          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,  rounding);                                                                    mv[0].x, mv[0].y, stride,  rounding);
499          interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, rounding);                          interpolate16x16_switch(dec->cur.y, dec->refn[0].y, 32*x_pos + 16, 32*y_pos,
500          interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, rounding);                                                                    mv[1].x, mv[1].y, stride,  rounding);
501          stop_comp_timer();                          interpolate16x16_switch(dec->cur.y, dec->refn[0].y, 32*x_pos, 32*y_pos + 16,
502                                                                      mv[2].x, mv[2].y, stride,  rounding);
503                            interpolate16x16_switch(dec->cur.y, dec->refn[0].y, 32*x_pos + 16, 32*y_pos + 16,
504                                                                      mv[3].x, mv[3].y, stride,  rounding);
505                            interpolate16x16_switch(dec->cur.u, dec->refn[0].u, 16 * x_pos, 16 * y_pos,
506                                                                      uv_dx, uv_dy, stride2, rounding);
507                            interpolate16x16_switch(dec->cur.v, dec->refn[0].v, 16 * x_pos, 16 * y_pos,
508                                                                      uv_dx, uv_dy, stride2, rounding);
509    
510          for (i = 0; i < 6; i++)                          // set_block(pY_Cur, stride, 32, 32, 127);
511                    }
512                    else
513          {          {
514                            if(dec->quarterpel) {
515                                    interpolate8x8_quarterpel(dec->cur.y, dec->refn[0].y, dec->refh.y, dec->refh.y + 64,
516                                                                                      dec->refh.y + 128, 16*x_pos, 16*y_pos,
517                                                                                      mv[0].x, mv[0].y, stride,  rounding);
518                                    interpolate8x8_quarterpel(dec->cur.y, dec->refn[0].y, dec->refh.y, dec->refh.y + 64,
519                                                                                      dec->refh.y + 128, 16*x_pos + 8, 16*y_pos,
520                                                                                      mv[1].x, mv[1].y, stride,  rounding);
521                                    interpolate8x8_quarterpel(dec->cur.y, dec->refn[0].y, dec->refh.y, dec->refh.y + 64,
522                                                                                      dec->refh.y + 128, 16*x_pos, 16*y_pos + 8,
523                                                                                      mv[2].x, mv[2].y, stride,  rounding);
524                                    interpolate8x8_quarterpel(dec->cur.y, dec->refn[0].y, dec->refh.y, dec->refh.y + 64,
525                                                                                      dec->refh.y + 128, 16*x_pos + 8, 16*y_pos + 8,
526                                                                                      mv[3].x, mv[3].y, stride,  rounding);
527                            }
528                            else {
529                                    interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos, 16*y_pos,
530                                                                              mv[0].x, mv[0].y, stride,  rounding);
531                                    interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos,
532                                                                              mv[1].x, mv[1].y, stride,  rounding);
533                                    interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos, 16*y_pos + 8,
534                                                                              mv[2].x, mv[2].y, stride,  rounding);
535                                    interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos + 8,
536                                                                              mv[3].x, mv[3].y, stride,  rounding);
537                            }
538    
539                            interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8 * x_pos, 8 * y_pos,
540                                                                      uv_dx, uv_dy, stride2, rounding);
541                            interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8 * x_pos, 8 * y_pos,
542                                                                      uv_dx, uv_dy, stride2, rounding);
543                    }
544                    stop_comp_timer();
545            }
546    
547            for (i = 0; i < 6; i++) {
548                    int direction = dec->alternate_vertical_scan ? 2 : 0;
549    
550                  if (cbp & (1 << (5-i)))                 // coded                  if (cbp & (1 << (5-i)))                 // coded
551                  {                  {
552                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear
553    
554                          start_timer();                          start_timer();
555                          get_inter_block(bs, &block[i*64]);                          get_inter_block(bs, &block[i * 64], direction);
556                          stop_coding_timer();                          stop_coding_timer();
557    
558                          start_timer();                          start_timer();
559                          if (dec->quant_type == 0)                          if (dec->quant_type == 0) {
                         {  
560                                  dequant_inter(&data[i*64], &block[i*64], iQuant);                                  dequant_inter(&data[i*64], &block[i*64], iQuant);
561                          }                          } else {
                         else  
                         {  
562                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);
563                          }                          }
564                          stop_iquant_timer();                          stop_iquant_timer();
# Line 382  Line 569 
569                  }                  }
570          }          }
571    
572          if (dec->interlacing && pMB->field_dct)          if (dec->interlacing && pMB->field_dct) {
         {  
573                  next_block = stride;                  next_block = stride;
574                  stride *= 2;                  stride *= 2;
575          }          }
576    
577          start_timer();          start_timer();
578            if (reduced_resolution)
579            {
580                    if (cbp & 32)
581                            add_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
582                    if (cbp & 16)
583                            add_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
584                    if (cbp & 8)
585                            add_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
586                    if (cbp & 4)
587                            add_upsampled_8x8_16to8(pY_Cur + 16 + next_block, &data[3 * 64], stride);
588                    if (cbp & 2)
589                            add_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
590                    if (cbp & 1)
591                            add_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
592            }
593            else
594            {
595          if (cbp & 32)          if (cbp & 32)
596                  transfer_16to8add(pY_Cur,                  &data[0*64], stride);                  transfer_16to8add(pY_Cur,                  &data[0*64], stride);
597          if (cbp & 16)          if (cbp & 16)
# Line 401  Line 604 
604                  transfer_16to8add(pU_Cur,                  &data[4*64], stride2);                  transfer_16to8add(pU_Cur,                  &data[4*64], stride2);
605          if (cbp & 1)          if (cbp & 1)
606                  transfer_16to8add(pV_Cur,                  &data[5*64], stride2);                  transfer_16to8add(pV_Cur,                  &data[5*64], stride2);
607            }
608          stop_transfer_timer();          stop_transfer_timer();
609  }  }
610    
611    
612  void decoder_iframe(DECODER * dec, Bitstream * bs, int quant, int intra_dc_threshold)  void
613    decoder_iframe(DECODER * dec,
614                               Bitstream * bs,
615                               int reduced_resolution,
616                               int quant,
617                               int intra_dc_threshold)
618  {  {
619            uint32_t bound;
620          uint32_t x, y;          uint32_t x, y;
621            int mb_width = dec->mb_width;
622            int mb_height = dec->mb_height;
623    
624          for (y = 0; y < dec->mb_height; y++)          if (reduced_resolution)
         {  
                 for (x = 0; x < dec->mb_width; x++)  
625                  {                  {
626                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                  mb_width = (dec->width + 31) / 32;
627                    mb_height = (dec->height + 31) / 32;
628            }
629    
630            bound = 0;
631    
632            for (y = 0; y < mb_height; y++) {
633                    for (x = 0; x < mb_width; x++) {
634                            MACROBLOCK *mb;
635                          uint32_t mcbpc;                          uint32_t mcbpc;
636                          uint32_t cbpc;                          uint32_t cbpc;
637                          uint32_t acpred_flag;                          uint32_t acpred_flag;
638                          uint32_t cbpy;                          uint32_t cbpy;
639                          uint32_t cbp;                          uint32_t cbp;
640    
641                            while (BitstreamShowBits(bs, 9) == 1)
642                                    BitstreamSkip(bs, 9);
643    
644                            if (check_resync_marker(bs, 0))
645                            {
646                                    bound = read_video_packet_header(bs, dec, 0,
647                                                            &quant, NULL, NULL, &intra_dc_threshold);
648                                    x = bound % mb_width;
649                                    y = bound / mb_width;
650                            }
651                            mb = &dec->mbs[y * dec->mb_width + x];
652    
653                            DPRINTF(DPRINTF_MB, "macroblock (%i,%i) %08x", x, y, BitstreamShowBits(bs, 32));
654    
655                          mcbpc = get_mcbpc_intra(bs);                          mcbpc = get_mcbpc_intra(bs);
656                          mb->mode = mcbpc & 7;                          mb->mode = mcbpc & 7;
657                          cbpc = (mcbpc >> 4);                          cbpc = (mcbpc >> 4);
658    
659                          acpred_flag = BitstreamGetBit(bs);                          acpred_flag = BitstreamGetBit(bs);
660    
                         if (mb->mode == MODE_STUFFING)  
                         {  
                                 DEBUG("-- STUFFING ?");  
                                 continue;  
                         }  
   
661                          cbpy = get_cbpy(bs, 1);                          cbpy = get_cbpy(bs, 1);
662                          cbp = (cbpy << 2) | cbpc;                          cbp = (cbpy << 2) | cbpc;
663    
664                          if (mb->mode == MODE_INTRA_Q)                          if (mb->mode == MODE_INTRA_Q) {
                         {  
665                                  quant += dquant_table[BitstreamGetBits(bs,2)];                                  quant += dquant_table[BitstreamGetBits(bs,2)];
666                                  if (quant > 31)                                  if (quant > 31) {
                                 {  
667                                          quant = 31;                                          quant = 31;
668                                  }                                  } else if (quant < 1) {
                                 else if (quant < 1)  
                                 {  
669                                          quant = 1;                                          quant = 1;
670                                  }                                  }
671                          }                          }
672                          mb->quant = quant;                          mb->quant = quant;
673                            mb->mvs[0].x = mb->mvs[0].y =
674                            mb->mvs[1].x = mb->mvs[1].y =
675                            mb->mvs[2].x = mb->mvs[2].y =
676                            mb->mvs[3].x = mb->mvs[3].y =0;
677    
678                          if (dec->interlacing)                          if (dec->interlacing) {
                         {  
679                                  mb->field_dct = BitstreamGetBit(bs);                                  mb->field_dct = BitstreamGetBit(bs);
680                                  DEBUG1("deci: field_dct: ", mb->field_dct);                                  DEBUG1("deci: field_dct: ", mb->field_dct);
681                          }                          }
682    
683                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
684                                                            intra_dc_threshold, bound, reduced_resolution);
685    
686                  }                  }
687                    if(dec->out_frm)
688                      output_slice(&dec->cur, dec->edged_width,dec->width,dec->out_frm,0,y,mb_width);
689          }          }
690    
691  }  }
692    
693    
694  void get_motion_vector(DECODER *dec, Bitstream *bs, int x, int y, int k, VECTOR * mv, int fcode)  void
695    get_motion_vector(DECODER * dec,
696                                      Bitstream * bs,
697                                      int x,
698                                      int y,
699                                      int k,
700                                      VECTOR * ret_mv,
701                                      int fcode,
702                                      const int bound)
703  {  {
704    
705          int scale_fac = 1 << (fcode - 1);          int scale_fac = 1 << (fcode - 1);
# Line 472  Line 707 
707          int low = ((-32) * scale_fac);          int low = ((-32) * scale_fac);
708          int range = (64 * scale_fac);          int range = (64 * scale_fac);
709    
710          VECTOR pmv[4];          VECTOR pmv;
711          int32_t psad[4];          VECTOR mv;
   
         int mv_x, mv_y;  
         int pmv_x, pmv_y;  
712    
713            pmv = get_pmv2(dec->mbs, dec->mb_width, bound, x, y, k);
714    
715          get_pmvdata(dec->mbs, x, y, dec->mb_width, k, pmv, psad);          mv.x = get_mv(bs, fcode);
716            mv.y = get_mv(bs, fcode);
717    
718          pmv_x = pmv[0].x;          DPRINTF(DPRINTF_MV,"mv_diff (%i,%i) pred (%i,%i)", mv.x, mv.y, pmv.x, pmv.y);
         pmv_y = pmv[0].y;  
719    
720          mv_x = get_mv(bs, fcode);          mv.x += pmv.x;
721          mv_y = get_mv(bs, fcode);          mv.y += pmv.y;
722    
723          mv_x += pmv_x;          if (mv.x < low) {
724          mv_y += pmv_y;                  mv.x += range;
725            } else if (mv.x > high) {
726          if (mv_x < low)                  mv.x -= range;
         {  
                 mv_x += range;  
727          }          }
728          else if (mv_x > high)  
729          {          if (mv.y < low) {
730                  mv_x -= range;                  mv.y += range;
731            } else if (mv.y > high) {
732                    mv.y -= range;
733          }          }
734    
735          if (mv_y < low)          ret_mv->x = mv.x;
736          {          ret_mv->y = mv.y;
                 mv_y += range;  
737          }          }
738          else if (mv_y > high)  
739    
740    
741    static __inline int gmc_sanitize(int value, int quarterpel, int fcode)
742          {          {
743                  mv_y -= range;          int length = 1 << (fcode+4);
         }  
744    
745          mv->x = mv_x;          if (quarterpel) value *= 2;
         mv->y = mv_y;  
746    
747            if (value < -length)
748                    return -length;
749            else if (value >= length)
750                    return length-1;
751            else return value;
752  }  }
753    
754    
755  void decoder_pframe(DECODER * dec, Bitstream * bs, int rounding, int quant, int fcode, int intra_dc_threshold)  /* for P_VOP set gmc_mv to NULL */
756    void
757    decoder_pframe(DECODER * dec,
758                               Bitstream * bs,
759                               int rounding,
760                               int reduced_resolution,
761                               int quant,
762                               int fcode,
763                               int intra_dc_threshold,
764                               VECTOR * gmc_mv)
765  {  {
766    
767          uint32_t x, y;          uint32_t x, y;
768            uint32_t bound;
769            int cp_mb, st_mb;
770            int mb_width = dec->mb_width;
771            int mb_height = dec->mb_height;
772    
773            if (reduced_resolution)
774            {
775                    mb_width = (dec->width + 31) / 32;
776                    mb_height = (dec->height + 31) / 32;
777            }
778    
779          start_timer();          start_timer();
780          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
781                                       dec->width, dec->height);
782          stop_edges_timer();          stop_edges_timer();
783    
784          for (y = 0; y < dec->mb_height; y++)          bound = 0;
785          {  
786                  for (x = 0; x < dec->mb_width; x++)          for (y = 0; y < mb_height; y++) {
787                    cp_mb = st_mb = 0;
788                    for (x = 0; x < mb_width; x++) {
789                            MACROBLOCK *mb;
790    
791                            // skip stuffing
792                            while (BitstreamShowBits(bs, 10) == 1)
793                                    BitstreamSkip(bs, 10);
794    
795                            if (check_resync_marker(bs, fcode - 1))
796                  {                  {
797                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                                  bound = read_video_packet_header(bs, dec, fcode - 1,
798                                            &quant, &fcode, NULL, &intra_dc_threshold);
799                                    x = bound % mb_width;
800                                    y = bound / mb_width;
801                            }
802                            mb = &dec->mbs[y * dec->mb_width + x];
803    
804                            DPRINTF(DPRINTF_MB, "macroblock (%i,%i) %08x", x, y, BitstreamShowBits(bs, 32));
805    
806                          //if (!(dec->mb_skip[y*dec->mb_width + x]=BitstreamGetBit(bs)))                 // not_coded                          //if (!(dec->mb_skip[y*dec->mb_width + x]=BitstreamGetBit(bs)))                 // not_coded
807                          if (!(BitstreamGetBit(bs)))                     // not_coded                          if (!(BitstreamGetBit(bs)))                     // not_coded
# Line 538  Line 812 
812                                  uint32_t cbpy;                                  uint32_t cbpy;
813                                  uint32_t cbp;                                  uint32_t cbp;
814                                  uint32_t intra;                                  uint32_t intra;
815                                    int mcsel = 0;          // mcsel: '0'=local motion, '1'=GMC
816    
817                                    cp_mb++;
818                                  mcbpc = get_mcbpc_inter(bs);                                  mcbpc = get_mcbpc_inter(bs);
819                                  mb->mode = mcbpc & 7;                                  mb->mode = mcbpc & 7;
820                                  cbpc = (mcbpc >> 4);                                  cbpc = (mcbpc >> 4);
821    
822                                    DPRINTF(DPRINTF_MB, "mode %i", mb->mode);
823                                    DPRINTF(DPRINTF_MB, "cbpc %i", cbpc);
824                                  acpred_flag = 0;                                  acpred_flag = 0;
825    
826                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);
827    
828                                  if (intra)                                  if (intra) {
                                 {  
829                                          acpred_flag = BitstreamGetBit(bs);                                          acpred_flag = BitstreamGetBit(bs);
830                                  }                                  }
831    
832                                  if (mb->mode == MODE_STUFFING)                                  if (gmc_mv && (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q))
833                                  {                                  {
834                                          DEBUG("-- STUFFING ?");                                          mcsel = BitstreamGetBit(bs);
                                         continue;  
835                                  }                                  }
836    
837                                  cbpy = get_cbpy(bs, intra);                                  cbpy = get_cbpy(bs, intra);
838                                    DPRINTF(DPRINTF_MB, "cbpy %i", cbpy);
839    
840                                  cbp = (cbpy << 2) | cbpc;                                  cbp = (cbpy << 2) | cbpc;
841    
842                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q)                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q) {
843                                  {                                          int dquant = dquant_table[BitstreamGetBits(bs, 2)];
844                                          quant += dquant_table[BitstreamGetBits(bs,2)];                                          DPRINTF(DPRINTF_MB, "dquant %i", dquant);
845                                          if (quant > 31)                                          quant += dquant;
846                                          {                                          if (quant > 31) {
847                                                  quant = 31;                                                  quant = 31;
848                                          }                                          } else if (quant < 1) {
                                         else if (mb->quant < 1)  
                                         {  
849                                                  quant = 1;                                                  quant = 1;
850                                          }                                          }
851                                            DPRINTF(DPRINTF_MB, "quant %i", quant);
852                                  }                                  }
853                                  mb->quant = quant;                                  mb->quant = quant;
854    
855                                  if (dec->interlacing)                                  if (dec->interlacing) {
856                                  {                                          if (cbp || intra) {
857                                          mb->field_dct = BitstreamGetBit(bs);                                          mb->field_dct = BitstreamGetBit(bs);
858                                          DEBUG1("decp: field_dct: ", mb->field_dct);                                          DEBUG1("decp: field_dct: ", mb->field_dct);
859                                            }
860    
861                                          if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)                                          if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
                                         {  
862                                                  mb->field_pred = BitstreamGetBit(bs);                                                  mb->field_pred = BitstreamGetBit(bs);
863                                                  DEBUG1("decp: field_pred: ", mb->field_pred);                                                  DEBUG1("decp: field_pred: ", mb->field_pred);
864    
865                                                  if (mb->field_pred)                                                  if (mb->field_pred) {
                                                 {  
866                                                          mb->field_for_top = BitstreamGetBit(bs);                                                          mb->field_for_top = BitstreamGetBit(bs);
867                                                          DEBUG1("decp: field_for_top: ", mb->field_for_top);                                                          DEBUG1("decp: field_for_top: ", mb->field_for_top);
868                                                          mb->field_for_bot = BitstreamGetBit(bs);                                                          mb->field_for_bot = BitstreamGetBit(bs);
# Line 594  Line 871 
871                                          }                                          }
872                                  }                                  }
873    
874                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
875                                  {  
876                                          if (dec->interlacing && mb->field_pred)                                          if (mcsel)
                                         {  
                                                 get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);  
                                                 get_motion_vector(dec, bs, x, y, 0, &mb->mvs[1], fcode);  
                                         }  
                                         else  
                                         {  
                                                 get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);  
                                                 mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;  
                                                 mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;  
                                         }  
                                 }  
                                 else if (mb->mode == MODE_INTER4V /* || mb->mode == MODE_INTER4V_Q */)  
                                 {  
                                         get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);  
                                         get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode);  
                                         get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode);  
                                         get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode);  
                                 }  
                                 else  // MODE_INTRA, MODE_INTRA_Q  
877                                  {                                  {
878                                          mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = gmc_sanitize(gmc_mv[0].x, dec->quarterpel, fcode);
879                                          mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = gmc_sanitize(gmc_mv[0].y, dec->quarterpel, fcode);
880                                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);  
881                                            } else if (dec->interlacing && mb->field_pred) {
882                                                    get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
883                                                                                      fcode, bound);
884                                                    get_motion_vector(dec, bs, x, y, 0, &mb->mvs[1],
885                                                                                      fcode, bound);
886                                            } else {
887                                                    get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
888                                                                                      fcode, bound);
889                                                    mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
890                                                            mb->mvs[0].x;
891                                                    mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
892                                                            mb->mvs[0].y;
893                                            }
894                                    } else if (mb->mode == MODE_INTER4V ) {
895    
896                                            get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode, bound);
897                                            get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode, bound);
898                                            get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode, bound);
899                                            get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode, bound);
900                                    } else                  // MODE_INTRA, MODE_INTRA_Q
901                                    {
902                                            mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
903                                                    0;
904                                            mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
905                                                    0;
906                                            decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
907                                                                            intra_dc_threshold, bound, reduced_resolution);
908                                          continue;                                          continue;
909                                  }                                  }
910    
911                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant, rounding);                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant,
912                                                                    rounding, reduced_resolution);
913    
914                          }                          }
915                          else    // not coded                          else if (gmc_mv)        /* not coded S_VOP macroblock */
916                            {
917                                    mb->mode = MODE_NOT_CODED;
918                                    mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = gmc_sanitize(gmc_mv[0].x, dec->quarterpel, fcode);
919                                    mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = gmc_sanitize(gmc_mv[0].y, dec->quarterpel, fcode);
920                                    decoder_mbinter(dec, mb, x, y, 0, 0, bs, quant, rounding, reduced_resolution);
921                            }
922                            else    /* not coded P_VOP macroblock */
923                          {                          {
   
924                                  mb->mode = MODE_NOT_CODED;                                  mb->mode = MODE_NOT_CODED;
925    
926                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;
927                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;
   
928                                  // copy macroblock directly from ref to cur                                  // copy macroblock directly from ref to cur
929    
930                                  start_timer();                                  start_timer();
931    
932                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x),                                  if (reduced_resolution)
933                                                   dec->refn[0].y + (16*y)*dec->edged_width + (16*x),                                  {
934                                                   dec->edged_width);                                          transfer32x32_copy(dec->cur.y + (32*y)*dec->edged_width + (32*x),
935                                                                             dec->refn[0].y + (32*y)*dec->edged_width + (32*x),
                                 transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x+8),  
                                                  dec->refn[0].y + (16*y)*dec->edged_width + (16*x+8),  
936                                                   dec->edged_width);                                                   dec->edged_width);
937    
938                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x),                                          transfer16x16_copy(dec->cur.u + (16*y)*dec->edged_width/2 + (16*x),
939                                                   dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x),                                                                          dec->refn[0].u + (16*y)*dec->edged_width/2 + (16*x),
940                                                   dec->edged_width);                                                                          dec->edged_width/2);
941    
942                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x+8),                                          transfer16x16_copy(dec->cur.v + (16*y)*dec->edged_width/2 + (16*x),
943                                                   dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x+8),                                                                           dec->refn[0].v + (16*y)*dec->edged_width/2 + (16*x),
944                                                                             dec->edged_width/2);
945                                    }
946                                    else
947                                    {
948                                            transfer16x16_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x),
949                                                                             dec->refn[0].y + (16*y)*dec->edged_width + (16*x),
950                                                   dec->edged_width);                                                   dec->edged_width);
951    
952                                  transfer8x8_copy(dec->cur.u + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.u + (8*y)*dec->edged_width/2 + (8*x),
# Line 659  Line 956 
956                                  transfer8x8_copy(dec->cur.v + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.v + (8*y)*dec->edged_width/2 + (8*x),
957                                                   dec->refn[0].v + (8*y)*dec->edged_width/2 + (8*x),                                                   dec->refn[0].v + (8*y)*dec->edged_width/2 + (8*x),
958                                                   dec->edged_width/2);                                                   dec->edged_width/2);
959                                    }
960    
961                                  stop_transfer_timer();                                  stop_transfer_timer();
962    
963                                    if(dec->out_frm && cp_mb > 0) {
964                                      output_slice(&dec->cur, dec->edged_width,dec->width,dec->out_frm,st_mb,y,cp_mb);
965                                      cp_mb = 0;
966                                    }
967                                    st_mb = x+1;
968                          }                          }
969                  }                  }
970                    if(dec->out_frm && cp_mb > 0)
971                      output_slice(&dec->cur, dec->edged_width,dec->width,dec->out_frm,st_mb,y,cp_mb);
972          }          }
973  }  }
974    
975    
976  // add by MinChen <chenm001@163.com>  // add by MinChen <chenm001@163.com>
977  // decode B-frame motion vector  // decode B-frame motion vector
978  void get_b_motion_vector(DECODER *dec, Bitstream *bs, int x, int y, VECTOR * mv, int fcode, const VECTOR pmv)  void
979    get_b_motion_vector(DECODER * dec,
980                                            Bitstream * bs,
981                                            int x,
982                                            int y,
983                                            VECTOR * mv,
984                                            int fcode,
985                                            const VECTOR pmv)
986  {  {
987          int scale_fac = 1 << (fcode - 1);          int scale_fac = 1 << (fcode - 1);
988          int high = (32 * scale_fac) - 1;          int high = (32 * scale_fac) - 1;
# Line 688  Line 1001 
1001          mv_x += pmv_x;          mv_x += pmv_x;
1002          mv_y += pmv_y;          mv_y += pmv_y;
1003    
1004          if (mv_x < low)          if (mv_x < low) {
         {  
1005                  mv_x += range;                  mv_x += range;
1006          }          } else if (mv_x > high) {
         else if (mv_x > high)  
         {  
1007                  mv_x -= range;                  mv_x -= range;
1008          }          }
1009    
1010          if (mv_y < low)          if (mv_y < low) {
         {  
1011                  mv_y += range;                  mv_y += range;
1012          }          } else if (mv_y > high) {
         else if (mv_y > high)  
         {  
1013                  mv_y -= range;                  mv_y -= range;
1014          }          }
1015    
1016          mv->x = mv_x;          mv->x = mv_x;
1017          mv->y = mv_y;          mv->y = mv_y;
   
1018  }  }
1019    
1020    
1021  // add by MinChen <chenm001@163.com>  // add by MinChen <chenm001@163.com>
1022  // decode an B-frame forward & backward inter macroblock  // decode an B-frame forward & backward inter macroblock
1023  void decoder_bf_mbinter(DECODER * dec,  void
1024    decoder_bf_mbinter(DECODER * dec,
1025                       const MACROBLOCK * pMB,                       const MACROBLOCK * pMB,
1026                       const uint32_t x_pos,                       const uint32_t x_pos,
1027                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 739  Line 1046 
1046          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
1047          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
1048    
1049          if (!(pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q))  
1050          {          if (!(pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
1051                  uv_dx = pMB->mvs[0].x;                  uv_dx = pMB->mvs[0].x;
1052                  uv_dy = pMB->mvs[0].y;                  uv_dy = pMB->mvs[0].y;
1053    
1054                  uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;                  if (dec->quarterpel)
                 uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;  
         }  
         else  
1055          {          {
1056                            uv_dx /= 2;
1057                            uv_dy /= 2;
1058                    }
1059    
1060                    uv_dx = (uv_dx >> 1) + roundtab_79[uv_dx & 0x3];
1061                    uv_dy = (uv_dy >> 1) + roundtab_79[uv_dy & 0x3];
1062            } else {
1063                  int sum;                  int sum;
1064    
1065                    if(dec->quarterpel)
1066                            sum = (pMB->mvs[0].x / 2) + (pMB->mvs[1].x / 2) + (pMB->mvs[2].x / 2) + (pMB->mvs[3].x / 2);
1067                    else
1068                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
                 uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1069    
1070                    uv_dx = (sum >> 3) + roundtab_76[sum & 0xf];
1071    
1072                    if(dec->quarterpel)
1073                            sum = (pMB->mvs[0].y / 2) + (pMB->mvs[1].y / 2) + (pMB->mvs[2].y / 2) + (pMB->mvs[3].y / 2);
1074                    else
1075                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
1076                  uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1077                    uv_dy = (sum >> 3) + roundtab_76[sum & 0xf];
1078          }          }
1079    
1080          start_timer();          start_timer();
1081          interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos,     16*y_pos    , pMB->mvs[0].x, pMB->mvs[0].y, stride,  0);          if(dec->quarterpel) {
1082          interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos + 8, 16*y_pos    , pMB->mvs[1].x, pMB->mvs[1].y, stride,  0);                  interpolate16x16_quarterpel(dec->cur.y, dec->refn[ref].y, dec->refh.y, dec->refh.y + 64,
1083          interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos,     16*y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,  0);                                                                      dec->refh.y + 128, 16*x_pos, 16*y_pos,
1084          interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos + 8, 16*y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,  0);                                                                      pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
1085          interpolate8x8_switch(dec->cur.u, dec->refn[ref].u, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, 0);          }
1086          interpolate8x8_switch(dec->cur.v, dec->refn[ref].v, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, 0);          else {
1087                    interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos, 16*y_pos,
1088                                                              pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
1089                    interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos + 8, 16*y_pos,
1090                                                          pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
1091                    interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos, 16*y_pos + 8,
1092                                                              pMB->mvs[2].x, pMB->mvs[2].y, stride, 0);
1093                    interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16*x_pos + 8, 16*y_pos + 8,
1094                                                              pMB->mvs[3].x, pMB->mvs[3].y, stride, 0);
1095            }
1096    
1097            interpolate8x8_switch(dec->cur.u, dec->refn[ref].u, 8 * x_pos, 8 * y_pos,
1098                                                      uv_dx, uv_dy, stride2, 0);
1099            interpolate8x8_switch(dec->cur.v, dec->refn[ref].v, 8 * x_pos, 8 * y_pos,
1100                                                      uv_dx, uv_dy, stride2, 0);
1101          stop_comp_timer();          stop_comp_timer();
1102    
1103          for (i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
1104          {                  int direction = dec->alternate_vertical_scan ? 2 : 0;
1105    
1106                  if (cbp & (1 << (5-i)))                 // coded                  if (cbp & (1 << (5-i)))                 // coded
1107                  {                  {
1108                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear
1109    
1110                          start_timer();                          start_timer();
1111                          get_inter_block(bs, &block[i*64]);                          get_inter_block(bs, &block[i * 64], direction);
1112                          stop_coding_timer();                          stop_coding_timer();
1113    
1114                          start_timer();                          start_timer();
1115                          if (dec->quant_type == 0)                          if (dec->quant_type == 0) {
                         {  
1116                                  dequant_inter(&data[i*64], &block[i*64], iQuant);                                  dequant_inter(&data[i*64], &block[i*64], iQuant);
1117                          }                          } else {
                         else  
                         {  
1118                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);
1119                          }                          }
1120                          stop_iquant_timer();                          stop_iquant_timer();
# Line 793  Line 1125 
1125                  }                  }
1126          }          }
1127    
1128          if (dec->interlacing && pMB->field_dct)          if (dec->interlacing && pMB->field_dct) {
         {  
1129                  next_block = stride;                  next_block = stride;
1130                  stride *= 2;                  stride *= 2;
1131          }          }
# Line 815  Line 1146 
1146          stop_transfer_timer();          stop_transfer_timer();
1147  }  }
1148    
   
1149  // add by MinChen <chenm001@163.com>  // add by MinChen <chenm001@163.com>
1150  // decode an B-frame direct &  inter macroblock  // decode an B-frame direct &  inter macroblock
1151  void decoder_bf_interpolate_mbinter(DECODER * dec,  void
1152                           IMAGE forward, IMAGE backward,  decoder_bf_interpolate_mbinter(DECODER * dec,
1153                                                               IMAGE forward,
1154                                                               IMAGE backward,
1155                       const MACROBLOCK * pMB,                       const MACROBLOCK * pMB,
1156                       const uint32_t x_pos,                       const uint32_t x_pos,
1157                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 835  Line 1167 
1167          uint32_t iQuant = pMB->quant;          uint32_t iQuant = pMB->quant;
1168          int uv_dx, uv_dy;          int uv_dx, uv_dy;
1169          int b_uv_dx, b_uv_dy;          int b_uv_dx, b_uv_dy;
1170            uint32_t i;
1171            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
1172        const uint32_t cbp = pMB->cbp;
1173    
1174          if ((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q))          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
1175          {          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
1176            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
1177    
1178    
1179            if ((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
1180                  uv_dx = pMB->mvs[0].x;                  uv_dx = pMB->mvs[0].x;
1181                  uv_dy = pMB->mvs[0].y;                  uv_dy = pMB->mvs[0].y;
1182    
                 uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;  
                 uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;  
   
1183                  b_uv_dx = pMB->b_mvs[0].x;                  b_uv_dx = pMB->b_mvs[0].x;
1184                  b_uv_dy = pMB->b_mvs[0].y;                  b_uv_dy = pMB->b_mvs[0].y;
1185    
1186                  b_uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;                  if (dec->quarterpel)
                 b_uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;  
         }  
         else  
1187          {          {
1188                            uv_dx /= 2;
1189                            uv_dy /= 2;
1190    
1191                            b_uv_dx /= 2;
1192                            b_uv_dy /= 2;
1193                    }
1194    
1195                    uv_dx = (uv_dx >> 1) + roundtab_79[uv_dx & 0x3];
1196                    uv_dy = (uv_dy >> 1) + roundtab_79[uv_dy & 0x3];
1197    
1198                    b_uv_dx = (b_uv_dx >> 1) + roundtab_79[b_uv_dx & 0x3];
1199                    b_uv_dy = (b_uv_dy >> 1) + roundtab_79[b_uv_dy & 0x3];
1200            } else {
1201                  int sum;                  int sum;
1202    
1203                    if(dec->quarterpel)
1204                            sum = (pMB->mvs[0].x / 2) + (pMB->mvs[1].x / 2) + (pMB->mvs[2].x / 2) + (pMB->mvs[3].x / 2);
1205                    else
1206                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
                 uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1207    
1208                    uv_dx = (sum >> 3) + roundtab_76[sum & 0xf];
1209    
1210                    if(dec->quarterpel)
1211                            sum = (pMB->mvs[0].y / 2) + (pMB->mvs[1].y / 2) + (pMB->mvs[2].y / 2) + (pMB->mvs[3].y / 2);
1212                    else
1213                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
                 uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1214    
1215                    uv_dy = (sum >> 3) + roundtab_76[sum & 0xf];
1216    
1217    
1218                    if(dec->quarterpel)
1219                            sum = (pMB->b_mvs[0].x / 2) + (pMB->b_mvs[1].x / 2) + (pMB->b_mvs[2].x / 2) + (pMB->b_mvs[3].x / 2);
1220                    else
1221                  sum = pMB->b_mvs[0].x + pMB->b_mvs[1].x + pMB->b_mvs[2].x + pMB->b_mvs[3].x;                  sum = pMB->b_mvs[0].x + pMB->b_mvs[1].x + pMB->b_mvs[2].x + pMB->b_mvs[3].x;
                 b_uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1222    
1223                    b_uv_dx = (sum >> 3) + roundtab_76[sum & 0xf];
1224    
1225                    if(dec->quarterpel)
1226                            sum = (pMB->b_mvs[0].y / 2) + (pMB->b_mvs[1].y / 2) + (pMB->b_mvs[2].y / 2) + (pMB->b_mvs[3].y / 2);
1227                    else
1228                  sum = pMB->b_mvs[0].y + pMB->b_mvs[1].y + pMB->b_mvs[2].y + pMB->b_mvs[3].y;                  sum = pMB->b_mvs[0].y + pMB->b_mvs[1].y + pMB->b_mvs[2].y + pMB->b_mvs[3].y;
1229                  b_uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
1230                    b_uv_dy = (sum >> 3) + roundtab_76[sum & 0xf];
1231          }          }
1232    
1233    
1234          start_timer();          start_timer();
1235            if(dec->quarterpel) {
1236                    if((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q))
1237                            interpolate16x16_quarterpel(dec->cur.y, forward.y, dec->refh.y, dec->refh.y + 64,
1238                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos,
1239                                                                                pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
1240                    else {
1241                            interpolate8x8_quarterpel(dec->cur.y, forward.y, dec->refh.y, dec->refh.y + 64,
1242                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos,
1243                                                                                pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
1244                            interpolate8x8_quarterpel(dec->cur.y, forward.y, dec->refh.y, dec->refh.y + 64,
1245                                                                                dec->refh.y + 128, 16*x_pos + 8, 16*y_pos,
1246                                                                                pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
1247                            interpolate8x8_quarterpel(dec->cur.y, forward.y, dec->refh.y, dec->refh.y + 64,
1248                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos + 8,
1249                                                                                pMB->mvs[2].x, pMB->mvs[2].y, stride, 0);
1250                            interpolate8x8_quarterpel(dec->cur.y, forward.y, dec->refh.y, dec->refh.y + 64,
1251                                                                                dec->refh.y + 128, 16*x_pos + 8, 16*y_pos + 8,
1252                                                                                pMB->mvs[3].x, pMB->mvs[3].y, stride, 0);
1253                    }
1254            }
1255            else {
1256                    interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos,
1257                                                              pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
1258                    interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8, 16 * y_pos,
1259                                                              pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
1260                    interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos + 8,
1261                                                              pMB->mvs[2].x, pMB->mvs[2].y, stride, 0);
1262                    interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8,
1263                                                              16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
1264                                                              0);
1265            }
1266    
1267            interpolate8x8_switch(dec->cur.u, forward.u, 8 * x_pos, 8 * y_pos, uv_dx,
1268                                                      uv_dy, stride2, 0);
1269            interpolate8x8_switch(dec->cur.v, forward.v, 8 * x_pos, 8 * y_pos, uv_dx,
1270                                                      uv_dy, stride2, 0);
1271    
1272    
1273            if(dec->quarterpel) {
1274                    if((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q))
1275                            interpolate16x16_quarterpel(dec->refn[2].y, backward.y, dec->refh.y, dec->refh.y + 64,
1276                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos,
1277                                                                                pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
1278                    else {
1279                            interpolate8x8_quarterpel(dec->refn[2].y, backward.y, dec->refh.y, dec->refh.y + 64,
1280                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos,
1281                                                                                pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
1282                            interpolate8x8_quarterpel(dec->refn[2].y, backward.y, dec->refh.y, dec->refh.y + 64,
1283                                                                                dec->refh.y + 128, 16*x_pos + 8, 16*y_pos,
1284                                                                                pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride, 0);
1285                            interpolate8x8_quarterpel(dec->refn[2].y, backward.y, dec->refh.y, dec->refh.y + 64,
1286                                                                                dec->refh.y + 128, 16*x_pos, 16*y_pos + 8,
1287                                                                                pMB->b_mvs[2].x, pMB->b_mvs[2].y, stride, 0);
1288                            interpolate8x8_quarterpel(dec->refn[2].y, backward.y, dec->refh.y, dec->refh.y + 64,
1289                                                                                dec->refh.y + 128, 16*x_pos + 8, 16*y_pos + 8,
1290                                                                                pMB->b_mvs[3].x, pMB->b_mvs[3].y, stride, 0);
1291                    }
1292            }
1293            else {
1294                    interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos, 16 * y_pos,
1295                                                              pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
1296                    interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
1297                                                              16 * y_pos, pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride,
1298                                                              0);
1299                    interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos,
1300                                                              16 * y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y,
1301                                                              stride, 0);
1302                    interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
1303                                                              16 * y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y,
1304                                                              stride, 0);
1305            }
1306    
1307            interpolate8x8_switch(dec->refn[2].u, backward.u, 8 * x_pos, 8 * y_pos,
1308                                                      b_uv_dx, b_uv_dy, stride2, 0);
1309            interpolate8x8_switch(dec->refn[2].v, backward.v, 8 * x_pos, 8 * y_pos,
1310                                                      b_uv_dx, b_uv_dy, stride2, 0);
1311    
1312            interpolate8x8_avg2(dec->cur.y + (16 * y_pos * stride) + 16 * x_pos,
1313                                                    dec->cur.y + (16 * y_pos * stride) + 16 * x_pos,
1314                                                    dec->refn[2].y + (16 * y_pos * stride) + 16 * x_pos,
1315                                                    stride, 1, 8);
1316    
1317            interpolate8x8_avg2(dec->cur.y + (16 * y_pos * stride) + 16 * x_pos + 8,
1318                                                    dec->cur.y + (16 * y_pos * stride) + 16 * x_pos + 8,
1319                                                    dec->refn[2].y + (16 * y_pos * stride) + 16 * x_pos + 8,
1320                                                    stride, 1, 8);
1321    
1322            interpolate8x8_avg2(dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
1323                                                    dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
1324                                                    dec->refn[2].y + ((16 * y_pos + 8) * stride) + 16 * x_pos,
1325                                                    stride, 1, 8);
1326    
1327            interpolate8x8_avg2(dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
1328                                                    dec->cur.y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
1329                                                    dec->refn[2].y + ((16 * y_pos + 8) * stride) + 16 * x_pos + 8,
1330                                                    stride, 1, 8);
1331    
1332            interpolate8x8_avg2(dec->cur.u + (8 * y_pos * stride2) + 8 * x_pos,
1333                                                    dec->cur.u + (8 * y_pos * stride2) + 8 * x_pos,
1334                                                    dec->refn[2].u + (8 * y_pos * stride2) + 8 * x_pos,
1335                                                    stride2, 1, 8);
1336    
1337            interpolate8x8_avg2(dec->cur.v + (8 * y_pos * stride2) + 8 * x_pos,
1338                                                    dec->cur.v + (8 * y_pos * stride2) + 8 * x_pos,
1339                                                    dec->refn[2].v + (8 * y_pos * stride2) + 8 * x_pos,
1340                                                    stride2, 1, 8);
1341    
         interpolate8x8_switch(dec->cur.y, forward.y, 16*x_pos,     16*y_pos    , pMB->mvs[0].x, pMB->mvs[0].y, stride,  0);  
         interpolate8x8_switch(dec->cur.y, forward.y, 16*x_pos + 8, 16*y_pos    , pMB->mvs[1].x, pMB->mvs[1].y, stride,  0);  
         interpolate8x8_switch(dec->cur.y, forward.y, 16*x_pos,     16*y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,  0);  
         interpolate8x8_switch(dec->cur.y, forward.y, 16*x_pos + 8, 16*y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,  0);  
         interpolate8x8_switch(dec->cur.u, forward.u, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, 0);  
         interpolate8x8_switch(dec->cur.v, forward.v, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, 0);  
   
         interpolate8x8_switch(dec->refn[2].y, backward.y, 16*x_pos,     16*y_pos    , pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride,  0);  
         interpolate8x8_switch(dec->refn[2].y, backward.y, 16*x_pos + 8, 16*y_pos    , pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride,  0);  
         interpolate8x8_switch(dec->refn[2].y, backward.y, 16*x_pos,     16*y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y, stride,  0);  
         interpolate8x8_switch(dec->refn[2].y, backward.y, 16*x_pos + 8, 16*y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y, stride,  0);  
         interpolate8x8_switch(dec->refn[2].u, backward.u, 8*x_pos,      8*y_pos,      b_uv_dx,         b_uv_dy,         stride2, 0);  
         interpolate8x8_switch(dec->refn[2].v, backward.v, 8*x_pos,      8*y_pos,      b_uv_dx,         b_uv_dy,         stride2, 0);  
   
         interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16*x_pos,     16*y_pos    , stride);  
         interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16*x_pos + 8, 16*y_pos    , stride);  
         interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16*x_pos,     16*y_pos + 8, stride);  
         interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16*x_pos + 8, 16*y_pos + 8, stride);  
         interpolate8x8_c(dec->cur.u, dec->refn[2].u, 8*x_pos,      8*y_pos,      stride2);  
         interpolate8x8_c(dec->cur.v, dec->refn[2].v, 8*x_pos,      8*y_pos,      stride2);  
   
 /*  
         interpolate8x8_c(dec->cur.y, backward.y, 16*x_pos,     16*y_pos    , pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride);  
         interpolate8x8_c(dec->cur.y, backward.y, 16*x_pos + 8, 16*y_pos    , pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride);  
         interpolate8x8_c(dec->cur.y, backward.y, 16*x_pos,     16*y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y, stride);  
         interpolate8x8_c(dec->cur.y, backward.y, 16*x_pos + 8, 16*y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y, stride);  
         interpolate8x8_c(dec->cur.u, backward.u, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2);  
         interpolate8x8_c(dec->cur.v, backward.v, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2);  
 */  
1342          stop_comp_timer();          stop_comp_timer();
1343    
1344            for (i = 0; i < 6; i++) {
1345                    int direction = dec->alternate_vertical_scan ? 2 : 0;
1346    
1347                    if (cbp & (1 << (5 - i)))       // coded
1348                    {
1349                            memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
1350    
1351                            start_timer();
1352                            get_inter_block(bs, &block[i * 64], direction);
1353                            stop_coding_timer();
1354    
1355                            start_timer();
1356                            if (dec->quant_type == 0) {
1357                                    dequant_inter(&data[i * 64], &block[i * 64], iQuant);
1358                            } else {
1359                                    dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
1360                            }
1361                            stop_iquant_timer();
1362    
1363                            start_timer();
1364                            idct(&data[i * 64]);
1365                            stop_idct_timer();
1366                    }
1367            }
1368    
1369            if (dec->interlacing && pMB->field_dct) {
1370                    next_block = stride;
1371                    stride *= 2;
1372            }
1373    
1374            start_timer();
1375            if (cbp & 32)
1376                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
1377            if (cbp & 16)
1378                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
1379            if (cbp & 8)
1380                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
1381            if (cbp & 4)
1382                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
1383            if (cbp & 2)
1384                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
1385            if (cbp & 1)
1386                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
1387            stop_transfer_timer();
1388  }  }
1389    
1390    
1391  // add by MinChen <chenm001@163.com>  // add by MinChen <chenm001@163.com>
1392  // for decode B-frame dbquant  // for decode B-frame dbquant
1393  int32_t __inline get_dbquant(Bitstream * bs)  int32_t __inline
1394    get_dbquant(Bitstream * bs)
1395  {  {
1396          if (!BitstreamGetBit(bs))               // '0'          if (!BitstreamGetBit(bs))               // '0'
1397                  return(0);                  return(0);
# Line 923  Line 1408 
1408  // 01       1  // 01       1
1409  // 001      2  // 001      2
1410  // 0001     3  // 0001     3
1411  int32_t __inline get_mbtype(Bitstream * bs)  int32_t __inline
1412    get_mbtype(Bitstream * bs)
1413  {  {
1414          int32_t mb_type=0;          int32_t mb_type;
1415          for(;mb_type<=3 && (!BitstreamGetBit(bs));mb_type++);  
1416            for (mb_type = 0; mb_type <= 3; mb_type++) {
1417                    if (BitstreamGetBit(bs))
1418                            break;
1419            }
1420    
1421          if (mb_type<=3)          if (mb_type<=3)
1422                  return(mb_type);                  return(mb_type);
1423          else          else
1424                  return(-1);                  return(-1);
1425  }  }
1426    
1427  void decoder_bframe(DECODER * dec, Bitstream * bs, int quant, int fcode_forward, int fcode_backward)  void
1428    decoder_bframe(DECODER * dec,
1429                               Bitstream * bs,
1430                               int quant,
1431                               int fcode_forward,
1432                               int fcode_backward)
1433  {  {
   
1434          uint32_t        x, y;          uint32_t        x, y;
1435          VECTOR          mv, zeromv;          VECTOR mv;
1436            const VECTOR zeromv = {0,0};
1437    #ifdef BFRAMES_DEC_DEBUG
1438            FILE *fp;
1439            static char first=0;
1440    #define BFRAME_DEBUG    if (!first && fp){ \
1441                    fprintf(fp,"Y=%3d   X=%3d   MB=%2d   CBP=%02X\n",y,x,mb->mb_type,mb->cbp); \
1442            }
1443    #endif
1444    
1445          start_timer();          start_timer();
1446          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
1447          //image_setedges(&dec->refn[1], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);                                     dec->width, dec->height);
1448            image_setedges(&dec->refn[1], dec->edged_width, dec->edged_height,
1449                                       dec->width, dec->height);
1450          stop_edges_timer();          stop_edges_timer();
1451    
1452          for (y = 0; y < dec->mb_height; y++)  #ifdef BFRAMES_DEC_DEBUG
1453          {          if (!first){
1454                  for (x = 0; x < dec->mb_width; x++)                  fp=fopen("C:\\XVIDDBG.TXT","w");
1455                  {          }
1456    #endif
1457    
1458            for (y = 0; y < dec->mb_height; y++) {
1459                    // Initialize Pred Motion Vector
1460                    dec->p_fmv = dec->p_bmv = zeromv;
1461                    for (x = 0; x < dec->mb_width; x++) {
1462                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];
1463                          MACROBLOCK * last_mb = &dec->last_mbs[y*dec->mb_width + x];                          MACROBLOCK * last_mb = &dec->last_mbs[y*dec->mb_width + x];
1464    
1465                          // the last P_VOP is skip macroblock ?                          mv =
1466                            mb->b_mvs[0] = mb->b_mvs[1] = mb->b_mvs[2] = mb->b_mvs[3] =
1467                            mb->mvs[0] = mb->mvs[1] = mb->mvs[2] = mb->mvs[3] = zeromv;
1468    
1469                            // the last P_VOP is skip macroblock ?
1470                          if (last_mb->mode == MODE_NOT_CODED){                          if (last_mb->mode == MODE_NOT_CODED){
1471                                  DEBUG("Skip MB in B-frame!");                                  //DEBUG2("Skip MB in B-frame at (X,Y)=!",x,y);
1472                                    mb->cbp = 0;
1473                                  // copy macroblock directly from ref to cur  #ifdef BFRAMES_DEC_DEBUG
1474                                  start_timer();                                  mb->mb_type = MODE_NOT_CODED;
1475                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x),          BFRAME_DEBUG
1476                                                   dec->refn[0].y + (16*y)*dec->edged_width + (16*x),  #endif
1477                                                   dec->edged_width);                                  mb->mb_type = MODE_FORWARD;
1478                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x+8),                                  mb->quant = last_mb->quant;
1479                                                   dec->refn[0].y + (16*y)*dec->edged_width + (16*x+8),                                  //mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;
1480                                                   dec->edged_width);                                  //mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;
                                 transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x),  
                                                  dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x),  
                                                  dec->edged_width);  
                                 transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x+8),  
                                                  dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x+8),  
                                                  dec->edged_width);  
                                 transfer8x8_copy(dec->cur.u + (8*y)*dec->edged_width/2 + (8*x),  
                                                  dec->refn[0].u + (8*y)*dec->edged_width/2 + (8*x),  
                                                  dec->edged_width/2);  
                                 transfer8x8_copy(dec->cur.v + (8*y)*dec->edged_width/2 + (8*x),  
                                                  dec->refn[0].v + (8*y)*dec->edged_width/2 + (8*x),  
                                                  dec->edged_width/2);  
                                 stop_transfer_timer();  
1481    
1482                                  DEBUG("skip MB in B-frame!");                                  decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, mb->quant, 1);
1483                                  continue;                                  continue;
1484                          }                          }
1485    
1486                          if (!BitstreamGetBit(bs)){      // modb=='0'                          if (!BitstreamGetBit(bs)){      // modb=='0'
1487                                  uint8_t modb2=BitstreamGetBit(bs);                                  const uint8_t modb2 = BitstreamGetBit(bs);
1488    
1489                                  mb->mb_type = get_mbtype(bs);                                  mb->mb_type = get_mbtype(bs);
1490    
# Line 995  Line 1496 
1496                                  if (mb->mb_type && mb->cbp){                                  if (mb->mb_type && mb->cbp){
1497                                          quant += get_dbquant(bs);                                          quant += get_dbquant(bs);
1498    
1499                                          if (quant > 31)                                          if (quant > 31) {
                                         {  
1500                                                  quant = 31;                                                  quant = 31;
1501                                          }                                          } else if (quant < 1) {
                                         else if (mb->quant < 1)  
                                         {  
1502                                                  quant = 1;                                                  quant = 1;
1503                                          }                                          }
1504                                  }                                  }
                                 mb->quant = quant;  
1505                          } else {                          } else {
1506                                  mb->mb_type = MODE_DIRECT_NONE_MV;                                  mb->mb_type = MODE_DIRECT_NONE_MV;
1507                                  mb->cbp = 0;                                  mb->cbp = 0;
1508                          }                          }
1509    
1510                          mb->mb_type = MODE_INTER;                          mb->quant = quant;
1511                          mb->mvs[0].x=mb->mvs[0].y=zeromv.x = zeromv.y = mv.x = mv.y = 0;                          mb->mode = MODE_INTER4V;
1512                          //DEBUG1("Switch bm_type=",mb->mb_type);                          //DEBUG1("Switch bm_type=",mb->mb_type);
1513    
1514                          switch(mb->mb_type)  #ifdef BFRAMES_DEC_DEBUG
1515                          {          BFRAME_DEBUG
1516    #endif
1517    
1518                            switch (mb->mb_type) {
1519                          case MODE_DIRECT:                          case MODE_DIRECT:
1520                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], 1, zeromv);                                  get_b_motion_vector(dec, bs, x, y, &mv, 1, zeromv);
1521    
1522                          case MODE_DIRECT_NONE_MV:                          case MODE_DIRECT_NONE_MV:
1523                                  {       // Because this file is a C file not C++ so I use '{' to define var                                  {
1524                                          const int32_t   TRB=dec->time_pp-dec->time_bp,                                          const int64_t TRB = dec->time_pp - dec->time_bp, TRD = dec->time_pp;
                                                                         TRD=dec->time_pp;  
1525                                          int i;                                          int i;
                                         for(i=0;i<4;i++){  
                                                 mb->mvs[i].x    = (TRB * last_mb->mvs[i].x)/TRD+mb->mvs[0].x;  
                                                 mb->b_mvs[i].x  = (mb->mvs[0].x==0)?((TRB-TRD)*last_mb->mvs[i].x)/TRD:mb->mvs[i].x-last_mb->mvs[i].x;  
                                                 mb->mvs[i].y    = (TRB * last_mb->mvs[i].y)/TRD+mb->mvs[0].y;  
                                                 mb->b_mvs[i].y  = (mb->mvs[0].y==0)?((TRB-TRD)*last_mb->mvs[i].y)/TRD:mb->mvs[i].y-last_mb->mvs[i].y;  
1526    
1527                                                  //DEBUG2("B-direct MVF=",mb->mvs[i].x,mb->mvs[i].y);                                          for (i = 0; i < 4; i++) {
1528                                                  //DEBUG2("B-direct MVB=",mb->b_mvs[i].x,mb->b_mvs[i].y);                                                  mb->mvs[i].x = (int32_t) ((TRB * last_mb->mvs[i].x)
1529                                                                          / TRD + mv.x);
1530                                                    mb->b_mvs[i].x = (int32_t) ((mv.x == 0)
1531                                                                                    ? ((TRB - TRD) * last_mb->mvs[i].x)
1532                                                                                      / TRD
1533                                                                                    : mb->mvs[i].x - last_mb->mvs[i].x);
1534                                                    mb->mvs[i].y = (int32_t) ((TRB * last_mb->mvs[i].y)
1535                                                                          / TRD + mv.y);
1536                                                    mb->b_mvs[i].y = (int32_t) ((mv.y == 0)
1537                                                                                    ? ((TRB - TRD) * last_mb->mvs[i].y)
1538                                                                                      / TRD
1539                                                                                : mb->mvs[i].y - last_mb->mvs[i].y);
1540                                          }                                          }
1541                                          //DEBUG("B-frame Direct!\n");                                          //DEBUG("B-frame Direct!\n");
1542                                  }                                  }
1543                                  mb->mode = MODE_INTER4V;                                  decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1544                                  decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0], mb, x, y, bs);                                                                                             mb, x, y, bs);
1545                                  break;                                  break;
1546    
1547                          case MODE_INTERPOLATE:                          case MODE_INTERPOLATE:
1548                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward, dec->p_fmv);                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1549                                  dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;                                                                          dec->p_fmv);
1550                                  dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;                                  dec->p_fmv = mb->mvs[1] = mb->mvs[2] = mb->mvs[3] =     mb->mvs[0];
1551    
1552                                  get_b_motion_vector(dec, bs, x, y, &mb->b_mvs[0], fcode_backward, dec->p_bmv);                                  get_b_motion_vector(dec, bs, x, y, &mb->b_mvs[0],
1553                                  dec->p_bmv.x = mb->b_mvs[1].x = mb->b_mvs[2].x = mb->b_mvs[3].x = mb->b_mvs[0].x;                                                                          fcode_backward, dec->p_bmv);
1554                                  dec->p_bmv.y = mb->b_mvs[1].y = mb->b_mvs[2].y = mb->b_mvs[3].y = mb->b_mvs[0].y;                                  dec->p_bmv = mb->b_mvs[1] = mb->b_mvs[2] =
1555                                            mb->b_mvs[3] = mb->b_mvs[0];
1556    
1557                                  mb->mode = MODE_INTER4V;                                  decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1558                                  decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0], mb, x, y, bs);                                                                                             mb, x, y, bs);
1559                                  //DEBUG("B-frame Bidir!\n");                                  //DEBUG("B-frame Bidir!\n");
1560                                  break;                                  break;
1561    
1562                          case MODE_BACKWARD:                          case MODE_BACKWARD:
1563                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_backward, dec->p_bmv);                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_backward,
1564                                  dec->p_bmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;                                                                          dec->p_bmv);
1565                                  dec->p_bmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;                                  dec->p_bmv = mb->mvs[1] = mb->mvs[2] = mb->mvs[3] =     mb->mvs[0];
1566    
1567                                    mb->mode = MODE_INTER;
1568                                  decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 0);                                  decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 0);
1569                                  //DEBUG("B-frame Backward!\n");                                  //DEBUG("B-frame Backward!\n");
1570                                  break;                                  break;
1571    
1572                          case MODE_FORWARD:                          case MODE_FORWARD:
1573                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward, dec->p_fmv);                                  get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1574                                  dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;                                                                          dec->p_fmv);
1575                                  dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;                                  dec->p_fmv = mb->mvs[1] = mb->mvs[2] = mb->mvs[3] =     mb->mvs[0];
1576    
1577                                    mb->mode = MODE_INTER;
1578                                  decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);                                  decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);
1579                                  DEBUG("B-frame Forward!\n");                                  //DEBUG("B-frame Forward!\n");
1580                                  break;                                  break;
1581    
1582                          default:                          default:
# Line 1075  Line 1585 
1585    
1586                  }       // end of FOR                  }       // end of FOR
1587          }          }
1588    #ifdef BFRAMES_DEC_DEBUG
1589            if (!first){
1590                    first=1;
1591                    if (fp)
1592                            fclose(fp);
1593            }
1594    #endif
1595  }  }
1596    
1597  // swap two MACROBLOCK array  // swap two MACROBLOCK array
1598  void mb_swap(MACROBLOCK *mb1, MACROBLOCK *mb2)  void
1599    mb_swap(MACROBLOCK ** mb1,
1600                    MACROBLOCK ** mb2)
1601  {  {
1602          MACROBLOCK *temp=mb1;          MACROBLOCK *temp = *mb1;
1603          mb1=mb2;  
1604          mb2=temp;          *mb1 = *mb2;
1605            *mb2 = temp;
1606  }  }
1607    
1608  int decoder_decode(DECODER * dec, XVID_DEC_FRAME * frame)  int
1609    decoder_decode(DECODER * dec,
1610                               XVID_DEC_FRAME * frame, XVID_DEC_STATS * stats)
1611  {  {
1612    
1613          Bitstream bs;          Bitstream bs;
1614          uint32_t rounding;          uint32_t rounding;
1615            uint32_t reduced_resolution;
1616          uint32_t quant;          uint32_t quant;
1617          uint32_t fcode_forward;          uint32_t fcode_forward;
1618          uint32_t fcode_backward;          uint32_t fcode_backward;
1619          uint32_t intra_dc_threshold;          uint32_t intra_dc_threshold;
1620            VECTOR gmc_mv[5];
1621          uint32_t vop_type;          uint32_t vop_type;
1622            int success = 0;
1623    
1624          start_global_timer();          start_global_timer();
1625    
1626            dec->out_frm = (frame->colorspace == XVID_CSP_EXTERN) ? frame->image : NULL;
1627    
1628          BitstreamInit(&bs, frame->bitstream, frame->length);          BitstreamInit(&bs, frame->bitstream, frame->length);
1629    
1630            // XXX: 0x7f is only valid whilst decoding vfw xvid/divx5 avi's
1631            if(frame->length == 1 && BitstreamShowBits(&bs, 8) == 0x7f)
1632            {
1633                    if (stats)
1634                            stats->notify = XVID_DEC_VOP;
1635                    frame->length = 1;
1636                    image_output(&dec->refn[0], dec->width, dec->height, dec->edged_width,
1637                                             frame->image, frame->stride, frame->colorspace, dec->interlacing);
1638                    emms();
1639                    return XVID_ERR_OK;
1640            }
1641    
1642    start:
1643          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
1644          // for support B-frame to reference last 2 frame          // for support B-frame to reference last 2 frame
1645          dec->frames ++;          dec->frames ++;
         vop_type=BitstreamReadHeaders(&bs, dec, &rounding, &quant, &fcode_forward, &fcode_backward, &intra_dc_threshold);  
1646    
1647          dec->p_bmv.x=dec->p_bmv.y=dec->p_fmv.y=dec->p_fmv.y=0;          // init pred vector to 0  xxx:
1648          switch (vop_type)          vop_type =
1649                    BitstreamReadHeaders(&bs, dec, &rounding, &reduced_resolution,
1650                            &quant, &fcode_forward, &fcode_backward, &intra_dc_threshold, gmc_mv);
1651    
1652            //DPRINTF(DPRINTF_HEADER, "vop_type=%i", vop_type);
1653    
1654            if (vop_type == -1 && success)
1655                    goto done;
1656    
1657            if (vop_type == -2 || vop_type == -3)
1658          {          {
1659                    if (vop_type == -3)
1660                            decoder_resize(dec);
1661    
1662                    if (stats)
1663                    {
1664                            stats->notify = XVID_DEC_VOL;
1665                            stats->data.vol.general = 0;
1666                            if (dec->interlacing)
1667                                    stats->data.vol.general |= XVID_INTERLACING;
1668                            stats->data.vol.width = dec->width;
1669                            stats->data.vol.height = dec->height;
1670                            stats->data.vol.aspect_ratio = dec->aspect_ratio;
1671                            stats->data.vol.par_width = dec->par_width;
1672                            stats->data.vol.par_height = dec->par_height;
1673                            frame->length = BitstreamPos(&bs) / 8;
1674                            return XVID_ERR_OK;
1675                    }
1676                    goto xxx;
1677            }
1678    
1679            dec->p_bmv.x = dec->p_bmv.y = dec->p_fmv.y = dec->p_fmv.y = 0;  // init pred vector to 0
1680    
1681            switch (vop_type) {
1682          case P_VOP :          case P_VOP :
1683                  decoder_pframe(dec, &bs, rounding, quant, fcode_forward, intra_dc_threshold);                  decoder_pframe(dec, &bs, rounding, reduced_resolution, quant,
1684                                                    fcode_forward, intra_dc_threshold, NULL);
1685    #ifdef BFRAMES_DEC
1686                  DEBUG1("P_VOP  Time=",dec->time);                  DEBUG1("P_VOP  Time=",dec->time);
1687    #endif
1688                  break;                  break;
1689    
1690          case I_VOP :          case I_VOP :
1691                  decoder_iframe(dec, &bs, quant, intra_dc_threshold);                  decoder_iframe(dec, &bs, reduced_resolution, quant, intra_dc_threshold);
1692    #ifdef BFRAMES_DEC
1693                  DEBUG1("I_VOP  Time=",dec->time);                  DEBUG1("I_VOP  Time=",dec->time);
1694    #endif
1695                  break;                  break;
1696    
1697          case B_VOP :          case B_VOP :
1698    #ifdef BFRAMES_DEC
1699                  if (dec->time_pp > dec->time_bp){                  if (dec->time_pp > dec->time_bp){
                         decoder_bframe(dec, &bs, quant, fcode_forward, fcode_backward);  
1700                          DEBUG1("B_VOP  Time=",dec->time);                          DEBUG1("B_VOP  Time=",dec->time);
1701                            decoder_bframe(dec, &bs, quant, fcode_forward, fcode_backward);
1702                  } else {                  } else {
1703                          DEBUG("broken B-frame!");                          DEBUG("broken B-frame!");
1704                  }                  }
1705    #else
1706                    image_copy(&dec->cur, &dec->refn[0], dec->edged_width, dec->height);
1707    #endif
1708                    break;
1709    
1710            case S_VOP :
1711                    decoder_pframe(dec, &bs, rounding, reduced_resolution, quant,
1712                                                    fcode_forward, intra_dc_threshold, gmc_mv);
1713                  break;                  break;
1714    
1715          case N_VOP :    // vop not coded          case N_VOP :    // vop not coded
1716                    // when low_delay==0, N_VOP's should interpolate between the past and future frames
1717                    image_copy(&dec->cur, &dec->refn[0], dec->edged_width, dec->height);
1718    #ifdef BFRAMES_DEC
1719                    DEBUG1("N_VOP  Time=", dec->time);
1720    #endif
1721                  break;                  break;
1722    
1723          default :          default :
1724                    if (stats)
1725                            stats->notify = 0;
1726    
1727                    emms();
1728                  return XVID_ERR_FAIL;                  return XVID_ERR_FAIL;
1729          }          }
1730    
         frame->length = BitstreamPos(&bs) / 8;  
1731    
1732          if (dec->frames >= 1){          if (reduced_resolution)
                 start_timer();  
                 if ((vop_type == I_VOP || vop_type == P_VOP))  
1733                  {                  {
1734                          image_output(&dec->refn[1], dec->width, dec->height, dec->edged_width,                  image_deblock_rrv(&dec->cur, dec->edged_width, dec->mbs,
1735                                       frame->image, frame->stride, frame->colorspace);                          (dec->width + 31) / 32, (dec->height + 31) / 32, dec->mb_width);
1736                  } else if (vop_type == B_VOP) {          }
1737    
1738            BitstreamByteAlign(&bs);
1739    
1740    #ifdef BFRAMES_DEC
1741            // test if no B_VOP
1742            if (dec->low_delay || dec->frames == 0 || ((dec->packed_mode) && !(frame->length > BitstreamPos(&bs) / 8))) {
1743    #endif
1744                          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,                          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,
1745                                       frame->image, frame->stride, frame->colorspace);                                           frame->image, frame->stride, frame->colorspace, dec->interlacing);
1746    
1747    #ifdef BFRAMES_DEC
1748            } else {
1749                    if (dec->frames >= 1 && !(dec->packed_mode)) {
1750                            start_timer();
1751                            if ((vop_type == I_VOP || vop_type == P_VOP || vop_type == S_VOP)) {
1752                                    image_output(&dec->refn[0], dec->width, dec->height,
1753                                                             dec->edged_width, frame->image, frame->stride,
1754                                                             frame->colorspace, dec->interlacing);
1755                            } else if (vop_type == B_VOP) {
1756                                    image_output(&dec->cur, dec->width, dec->height,
1757                                                             dec->edged_width, frame->image, frame->stride,
1758                                                             frame->colorspace, dec->interlacing);
1759                  }                  }
1760                  stop_conv_timer();                  stop_conv_timer();
1761          }          }
1762          if (vop_type==I_VOP || vop_type==P_VOP){          }
1763    #endif
1764    
1765            if (vop_type == I_VOP || vop_type == P_VOP || vop_type == S_VOP) {
1766                  image_swap(&dec->refn[0], &dec->refn[1]);                  image_swap(&dec->refn[0], &dec->refn[1]);
1767                  image_swap(&dec->cur, &dec->refn[0]);                  image_swap(&dec->cur, &dec->refn[0]);
1768    
1769                  // swap MACROBLOCK                  // swap MACROBLOCK
1770                  mb_swap(dec->mbs, dec->last_mbs);                  // the Divx will not set the low_delay flage some times
1771                    // so follow code will wrong to not swap at that time
1772                    // this will broken bitstream! so I'm change it,
1773                    // But that is not the best way! can anyone tell me how
1774                    // to do another way?
1775                    // 18-07-2002   MinChen<chenm001@163.com>
1776                    //if (!dec->low_delay && vop_type == P_VOP)
1777                    if (vop_type == P_VOP)
1778                            mb_swap(&dec->mbs, &dec->last_mbs);
1779            }
1780    
1781    
1782            if (success == 0 && dec->packed_mode)
1783            {
1784                    success = 1;
1785            //      if (frame->length > BitstreamPos(&bs) / 8)      // multiple vops packed together
1786                    goto start;
1787            }
1788    
1789    done :
1790    
1791            frame->length = BitstreamPos(&bs) / 8;
1792    
1793            if (stats)
1794            {
1795                    stats->notify = XVID_DEC_VOP;
1796                    stats->data.vop.time_base = (int)dec->time_base;
1797                    stats->data.vop.time_increment = 0;     //XXX: todo
1798          }          }
1799    
1800          emms();          emms();
# Line 1160  Line 1802 
1802          stop_global_timer();          stop_global_timer();
1803    
1804          return XVID_ERR_OK;          return XVID_ERR_OK;
   
1805  }  }

Legend:
Removed from v.1.14  
changed lines
  Added in v.1.37.2.18

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4