[cvs] / xvidcore / src / decoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/decoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.11, Tue Apr 23 00:04:03 2002 UTC revision 1.19, Wed Jun 12 20:38:39 2002 UTC
# Line 1  Line 1 
1  /**************************************************************************  /**************************************************************************
2   *   *
3   *      XVID MPEG-4 VIDEO CODEC   *      XVID MPEG-4 VIDEO CODEC
4   *      decoder main   *  -  Decoder main module  -
5   *   *
6   *      This program is an implementation of a part of one or more MPEG-4   *      This program is an implementation of a part of one or more MPEG-4
7   *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending   *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending
# Line 12  Line 12 
12   *      editors and their companies, will have no liability for use of this   *      editors and their companies, will have no liability for use of this
13   *      software or modifications or derivatives thereof.   *      software or modifications or derivatives thereof.
14   *   *
15   *      This program is xvid_free software; you can redistribute it and/or modify   *  This program is free software; you can redistribute it and/or modify
16   *      it under the terms of the GNU General Public License as published by   *      it under the terms of the GNU General Public License as published by
17   *      the xvid_free Software Foundation; either version 2 of the License, or   *  the Free Software Foundation; either version 2 of the License, or
18   *      (at your option) any later version.   *      (at your option) any later version.
19   *   *
20   *      This program is distributed in the hope that it will be useful,   *      This program is distributed in the hope that it will be useful,
# Line 23  Line 23 
23   *      GNU General Public License for more details.   *      GNU General Public License for more details.
24   *   *
25   *      You should have received a copy of the GNU General Public License   *      You should have received a copy of the GNU General Public License
26   *      along with this program; if not, write to the xvid_free Software   *  along with this program; if not, write to the Free Software
27   *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
28   *   *
29   *************************************************************************/   *************************************************************************/
30    
# Line 32  Line 32 
32   *   *
33   *      History:   *      History:
34   *   *
35     *  08.05.2002  add low_delay support for B_VOP decode
36     *              MinChen <chenm001@163.com>
37     *  05.05.2002  fix some B-frame decode problem
38     *  02.05.2002  add B-frame decode support(have some problem);
39     *              MinChen <chenm001@163.com>
40   *  22.04.2002  add some B-frame decode support;  chenm001 <chenm001@163.com>   *  22.04.2002  add some B-frame decode support;  chenm001 <chenm001@163.com>
41   *  29.03.2002  interlacing fix - compensated block wasn't being used when   *  29.03.2002  interlacing fix - compensated block wasn't being used when
42   *              reconstructing blocks, thus artifacts   *              reconstructing blocks, thus artifacts
# Line 39  Line 44 
44   *              interlaced decoding should be as fast as progressive now   *              interlaced decoding should be as fast as progressive now
45   *  26.03.2002  interlacing support - moved transfers outside decode loop   *  26.03.2002  interlacing support - moved transfers outside decode loop
46   *      26.12.2001      decoder_mbinter: dequant/idct moved within if(coded) block   *      26.12.2001      decoder_mbinter: dequant/idct moved within if(coded) block
47   *      22.12.2001      block based interpolation   *  22.12.2001  lock based interpolation
48   *      01.12.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>   *      01.12.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>
49   *   *
50     *  $Id$
51     *
52   *************************************************************************/   *************************************************************************/
53    
54  #include <stdlib.h>  #include <stdlib.h>
55  #include <string.h>  // memset  #include <string.h>
56    
57  #include "xvid.h"  #include "xvid.h"
58  #include "portab.h"  #include "portab.h"
# Line 70  Line 77 
77  #include "image/colorspace.h"  #include "image/colorspace.h"
78  #include "utils/mem_align.h"  #include "utils/mem_align.h"
79    
80  int decoder_create(XVID_DEC_PARAM * param)  int
81    decoder_create(XVID_DEC_PARAM * param)
82  {  {
83          DECODER * dec;          DECODER * dec;
84    
85          dec = xvid_malloc(sizeof(DECODER), CACHE_LINE);          dec = xvid_malloc(sizeof(DECODER), CACHE_LINE);
86          if (dec == NULL)          if (dec == NULL) {
         {  
87                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
88          }          }
89          param->handle = dec;          param->handle = dec;
# Line 90  Line 97 
97          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;
98          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;
99    
100          if (image_create(&dec->cur, dec->edged_width, dec->edged_height))          if (image_create(&dec->cur, dec->edged_width, dec->edged_height)) {
         {  
101                  xvid_free(dec);                  xvid_free(dec);
102                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
103          }          }
104    
105          if (image_create(&dec->refn[0], dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[0], dec->edged_width, dec->edged_height)) {
         {  
106                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
107                  xvid_free(dec);                  xvid_free(dec);
108                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
109          }          }
110          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
111          // for support B-frame to reference last 2 frame          // for support B-frame to reference last 2 frame
112          if (image_create(&dec->refn[1], dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[1], dec->edged_width, dec->edged_height)) {
113          {                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
114                    image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
115                    xvid_free(dec);
116                    return XVID_ERR_MEMORY;
117            }
118            if (image_create(&dec->refn[2], dec->edged_width, dec->edged_height)) {
119                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
120                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
121                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
122                  xvid_free(dec);                  xvid_free(dec);
123                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
124          }          }
125    
126          dec->mbs = xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height, CACHE_LINE);          dec->mbs =
127          if (dec->mbs == NULL)                  xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
128          {                                          CACHE_LINE);
129            if (dec->mbs == NULL) {
130                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
131                    image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
132                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
133                    image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
134                    xvid_free(dec);
135                    return XVID_ERR_MEMORY;
136            }
137            // add by chenm001 <chenm001@163.com>
138            // for skip MB flag
139            dec->last_mbs =
140                    xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
141                                            CACHE_LINE);
142            if (dec->last_mbs == NULL) {
143                    xvid_free(dec->mbs);
144                    image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
145                    image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
146                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
147                    image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
148                  xvid_free(dec);                  xvid_free(dec);
149                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
150          }          }
151    
152          init_timer();          init_timer();
153    
154            // add by chenm001 <chenm001@163.com>
155            // for support B-frame to save reference frame's time
156            dec->frames = -1;
157            dec->time = dec->time_base = dec->last_time_base = 0;
158    
159          return XVID_ERR_OK;          return XVID_ERR_OK;
160  }  }
161    
162    
163  int decoder_destroy(DECODER * dec)  int
164    decoder_destroy(DECODER * dec)
165  {  {
166            xvid_free(dec->last_mbs);
167          xvid_free(dec->mbs);          xvid_free(dec->mbs);
168          image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);          image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
169            image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
170            image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
171          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
172          xvid_free(dec);          xvid_free(dec);
173    
# Line 139  Line 177 
177    
178    
179    
180  static const int32_t dquant_table[4] =  static const int32_t dquant_table[4] = {
 {  
181          -1, -2, 1, 2          -1, -2, 1, 2
182  };  };
183    
184    
185    
186    
187  // decode an intra macroblock  // decode an intra macroblock
188    
189  void decoder_mbintra(DECODER * dec,  void
190    decoder_mbintra(DECODER * dec,
191                       MACROBLOCK * pMB,                       MACROBLOCK * pMB,
192                       const uint32_t x_pos,                       const uint32_t x_pos,
193                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 174  Line 214 
214    
215          memset(block, 0, 6*64*sizeof(int16_t));         // clear          memset(block, 0, 6*64*sizeof(int16_t));         // clear
216    
217          for (i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
218                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
219                  int16_t predictors[8];                  int16_t predictors[8];
220                  int start_coeff;                  int start_coeff;
221    
222                  start_timer();                  start_timer();
223                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i*64], iQuant, iDcScaler, predictors);                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i * 64],
224                  if (!acpred_flag)                                           iQuant, iDcScaler, predictors);
225                  {                  if (!acpred_flag) {
226                          pMB->acpred_directions[i] = 0;                          pMB->acpred_directions[i] = 0;
227                  }                  }
228                  stop_prediction_timer();                  stop_prediction_timer();
229    
230                  if (quant < intra_dc_threshold)                  if (quant < intra_dc_threshold) {
                 {  
231                          int dc_size;                          int dc_size;
232                          int dc_dif;                          int dc_dif;
233    
234                          dc_size = i < 4 ?  get_dc_size_lum(bs) : get_dc_size_chrom(bs);                          dc_size = i < 4 ?  get_dc_size_lum(bs) : get_dc_size_chrom(bs);
235                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;
236    
237                          if (dc_size > 8)                          if (dc_size > 8) {
                         {  
238                                  BitstreamSkip(bs, 1);           // marker                                  BitstreamSkip(bs, 1);           // marker
239                          }                          }
240    
241                          block[i*64 + 0] = dc_dif;                          block[i*64 + 0] = dc_dif;
242                          start_coeff = 1;                          start_coeff = 1;
243                  }                  } else {
                 else  
                 {  
244                          start_coeff = 0;                          start_coeff = 0;
245                  }                  }
246    
247                  start_timer();                  start_timer();
248                  if (cbp & (1 << (5-i)))                 // coded                  if (cbp & (1 << (5-i)))                 // coded
249                  {                  {
250                          get_intra_block(bs, &block[i*64], pMB->acpred_directions[i], start_coeff);                          get_intra_block(bs, &block[i * 64], pMB->acpred_directions[i],
251                                                            start_coeff);
252                  }                  }
253                  stop_coding_timer();                  stop_coding_timer();
254    
# Line 221  Line 257 
257                  stop_prediction_timer();                  stop_prediction_timer();
258    
259                  start_timer();                  start_timer();
260                  if (dec->quant_type == 0)                  if (dec->quant_type == 0) {
                 {  
261                          dequant_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);                          dequant_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
262                  }                  } else {
                 else  
                 {  
263                          dequant4_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);                          dequant4_intra(&data[i*64], &block[i*64], iQuant, iDcScaler);
264                  }                  }
265                  stop_iquant_timer();                  stop_iquant_timer();
# Line 236  Line 269 
269                  stop_idct_timer();                  stop_idct_timer();
270          }          }
271    
272          if (dec->interlacing && pMB->field_dct)          if (dec->interlacing && pMB->field_dct) {
         {  
273                  next_block = stride;                  next_block = stride;
274                  stride *= 2;                  stride *= 2;
275          }          }
# Line 264  Line 296 
296    
297  // decode an inter macroblock  // decode an inter macroblock
298    
299  void decoder_mbinter(DECODER * dec,  void
300    decoder_mbinter(DECODER * dec,
301                       const MACROBLOCK * pMB,                       const MACROBLOCK * pMB,
302                       const uint32_t x_pos,                       const uint32_t x_pos,
303                       const uint32_t y_pos,                       const uint32_t y_pos,
# Line 290  Line 323 
323          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
324          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
325    
326          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q) {
         {  
327                  uv_dx = pMB->mvs[0].x;                  uv_dx = pMB->mvs[0].x;
328                  uv_dy = pMB->mvs[0].y;                  uv_dy = pMB->mvs[0].y;
329    
330                  uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;                  uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
331                  uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;                  uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
332          }          } else {
         else  
         {  
333                  int sum;                  int sum;
334    
335                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
336                  uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );                  uv_dx =
337                            (sum ==
338                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
339                                                                      (ABS(sum) / 16) * 2));
340    
341                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;                  sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
342                  uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );                  uv_dy =
343                            (sum ==
344                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
345                                                                      (ABS(sum) / 16) * 2));
346          }          }
347    
348          start_timer();          start_timer();
349          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos,     16*y_pos    , pMB->mvs[0].x, pMB->mvs[0].y, stride,  rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos, 16 * y_pos,
350          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos    , pMB->mvs[1].x, pMB->mvs[1].y, stride,  rounding);                                                    pMB->mvs[0].x, pMB->mvs[0].y, stride, rounding);
351          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos,     16*y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,  rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos + 8,
352          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16*x_pos + 8, 16*y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,  rounding);                                                    16 * y_pos, pMB->mvs[1].x, pMB->mvs[1].y, stride,
353          interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, rounding);                                                    rounding);
354          interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8*x_pos,      8*y_pos,      uv_dx,         uv_dy,         stride2, rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos,
355                                                      16 * y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,
356                                                      rounding);
357            interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos + 8,
358                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
359                                                      rounding);
360            interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8 * x_pos, 8 * y_pos,
361                                                      uv_dx, uv_dy, stride2, rounding);
362            interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8 * x_pos, 8 * y_pos,
363                                                      uv_dx, uv_dy, stride2, rounding);
364          stop_comp_timer();          stop_comp_timer();
365    
366          for (i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
367                  if (cbp & (1 << (5-i)))                 // coded                  if (cbp & (1 << (5-i)))                 // coded
368                  {                  {
369                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear                          memset(&block[i*64], 0, 64 * sizeof(int16_t));          // clear
# Line 328  Line 373 
373                          stop_coding_timer();                          stop_coding_timer();
374    
375                          start_timer();                          start_timer();
376                          if (dec->quant_type == 0)                          if (dec->quant_type == 0) {
                         {  
377                                  dequant_inter(&data[i*64], &block[i*64], iQuant);                                  dequant_inter(&data[i*64], &block[i*64], iQuant);
378                          }                          } else {
                         else  
                         {  
379                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);                                  dequant4_inter(&data[i*64], &block[i*64], iQuant);
380                          }                          }
381                          stop_iquant_timer();                          stop_iquant_timer();
# Line 344  Line 386 
386                  }                  }
387          }          }
388    
389          if (dec->interlacing && pMB->field_dct)          if (dec->interlacing && pMB->field_dct) {
         {  
390                  next_block = stride;                  next_block = stride;
391                  stride *= 2;                  stride *= 2;
392          }          }
# Line 367  Line 408 
408  }  }
409    
410    
411  void decoder_iframe(DECODER * dec, Bitstream * bs, int quant, int intra_dc_threshold)  void
412    decoder_iframe(DECODER * dec,
413                               Bitstream * bs,
414                               int quant,
415                               int intra_dc_threshold)
416  {  {
417    
418          uint32_t x, y;          uint32_t x, y;
419    
420          for (y = 0; y < dec->mb_height; y++)          for (y = 0; y < dec->mb_height; y++) {
421          {                  for (x = 0; x < dec->mb_width; x++) {
                 for (x = 0; x < dec->mb_width; x++)  
                 {  
422                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];
423    
424                          uint32_t mcbpc;                          uint32_t mcbpc;
# Line 390  Line 433 
433    
434                          acpred_flag = BitstreamGetBit(bs);                          acpred_flag = BitstreamGetBit(bs);
435    
436                          if (mb->mode == MODE_STUFFING)                          if (mb->mode == MODE_STUFFING) {
                         {  
437                                  DEBUG("-- STUFFING ?");                                  DEBUG("-- STUFFING ?");
438                                  continue;                                  continue;
439                          }                          }
# Line 399  Line 441 
441                          cbpy = get_cbpy(bs, 1);                          cbpy = get_cbpy(bs, 1);
442                          cbp = (cbpy << 2) | cbpc;                          cbp = (cbpy << 2) | cbpc;
443    
444                          if (mb->mode == MODE_INTRA_Q)                          if (mb->mode == MODE_INTRA_Q) {
                         {  
445                                  quant += dquant_table[BitstreamGetBits(bs,2)];                                  quant += dquant_table[BitstreamGetBits(bs,2)];
446                                  if (quant > 31)                                  if (quant > 31) {
                                 {  
447                                          quant = 31;                                          quant = 31;
448                                  }                                  } else if (quant < 1) {
                                 else if (quant < 1)  
                                 {  
449                                          quant = 1;                                          quant = 1;
450                                  }                                  }
451                          }                          }
452                          mb->quant = quant;                          mb->quant = quant;
453    
454                          if (dec->interlacing)                          if (dec->interlacing) {
                         {  
455                                  mb->field_dct = BitstreamGetBit(bs);                                  mb->field_dct = BitstreamGetBit(bs);
456                                  DEBUG1("deci: field_dct: ", mb->field_dct);                                  DEBUG1("deci: field_dct: ", mb->field_dct);
457                          }                          }
458    
459                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
460                                                            intra_dc_threshold);
461                  }                  }
462          }          }
463    
464  }  }
465    
466    
467  void get_motion_vector(DECODER *dec, Bitstream *bs, int x, int y, int k, VECTOR * mv, int fcode)  void
468    get_motion_vector(DECODER * dec,
469                                      Bitstream * bs,
470                                      int x,
471                                      int y,
472                                      int k,
473                                      VECTOR * mv,
474                                      int fcode)
475  {  {
476    
477          int scale_fac = 1 << (fcode - 1);          int scale_fac = 1 << (fcode - 1);
# Line 435  Line 480 
480          int range = (64 * scale_fac);          int range = (64 * scale_fac);
481    
482          VECTOR pmv[4];          VECTOR pmv[4];
483          uint32_t psad[4];          int32_t psad[4];
484    
485          int mv_x, mv_y;          int mv_x, mv_y;
486          int pmv_x, pmv_y;          int pmv_x, pmv_y;
# Line 452  Line 497 
497          mv_x += pmv_x;          mv_x += pmv_x;
498          mv_y += pmv_y;          mv_y += pmv_y;
499    
500          if (mv_x < low)          if (mv_x < low) {
         {  
501                  mv_x += range;                  mv_x += range;
502          }          } else if (mv_x > high) {
         else if (mv_x > high)  
         {  
503                  mv_x -= range;                  mv_x -= range;
504          }          }
505    
506          if (mv_y < low)          if (mv_y < low) {
         {  
507                  mv_y += range;                  mv_y += range;
508          }          } else if (mv_y > high) {
         else if (mv_y > high)  
         {  
509                  mv_y -= range;                  mv_y -= range;
510          }          }
511    
# Line 476  Line 515 
515  }  }
516    
517    
518  void decoder_pframe(DECODER * dec, Bitstream * bs, int rounding, int quant, int fcode, int intra_dc_threshold)  void
519    decoder_pframe(DECODER * dec,
520                               Bitstream * bs,
521                               int rounding,
522                               int quant,
523                               int fcode,
524                               int intra_dc_threshold)
525  {  {
526    
527          uint32_t x, y;          uint32_t x, y;
528    
529          start_timer();          start_timer();
530          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
531                                       dec->width, dec->height, dec->interlacing);
532          stop_edges_timer();          stop_edges_timer();
533    
534          for (y = 0; y < dec->mb_height; y++)          for (y = 0; y < dec->mb_height; y++) {
535          {                  for (x = 0; x < dec->mb_width; x++) {
                 for (x = 0; x < dec->mb_width; x++)  
                 {  
536                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];
537    
538                          if (!BitstreamGetBit(bs))                       // not_coded                          //if (!(dec->mb_skip[y*dec->mb_width + x]=BitstreamGetBit(bs)))         // not_coded
539                            if (!(BitstreamGetBit(bs)))     // not_coded
540                          {                          {
541                                  uint32_t mcbpc;                                  uint32_t mcbpc;
542                                  uint32_t cbpc;                                  uint32_t cbpc;
# Line 507  Line 552 
552    
553                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);
554    
555                                  if (intra)                                  if (intra) {
                                 {  
556                                          acpred_flag = BitstreamGetBit(bs);                                          acpred_flag = BitstreamGetBit(bs);
557                                  }                                  }
558    
559                                  if (mb->mode == MODE_STUFFING)                                  if (mb->mode == MODE_STUFFING) {
                                 {  
560                                          DEBUG("-- STUFFING ?");                                          DEBUG("-- STUFFING ?");
561                                          continue;                                          continue;
562                                  }                                  }
# Line 521  Line 564 
564                                  cbpy = get_cbpy(bs, intra);                                  cbpy = get_cbpy(bs, intra);
565                                  cbp = (cbpy << 2) | cbpc;                                  cbp = (cbpy << 2) | cbpc;
566    
567                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q)                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q) {
                                 {  
568                                          quant += dquant_table[BitstreamGetBits(bs,2)];                                          quant += dquant_table[BitstreamGetBits(bs,2)];
569                                          if (quant > 31)                                          if (quant > 31) {
                                         {  
570                                                  quant = 31;                                                  quant = 31;
571                                          }                                          } else if (mb->quant < 1) {
                                         else if (mb->quant < 1)  
                                         {  
572                                                  quant = 1;                                                  quant = 1;
573                                          }                                          }
574                                  }                                  }
575                                  mb->quant = quant;                                  mb->quant = quant;
576    
577                                  if (dec->interlacing)                                  if (dec->interlacing) {
                                 {  
578                                          mb->field_dct = BitstreamGetBit(bs);                                          mb->field_dct = BitstreamGetBit(bs);
579                                          DEBUG1("decp: field_dct: ", mb->field_dct);                                          DEBUG1("decp: field_dct: ", mb->field_dct);
580    
581                                          if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)                                          if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
                                         {  
582                                                  mb->field_pred = BitstreamGetBit(bs);                                                  mb->field_pred = BitstreamGetBit(bs);
583                                                  DEBUG1("decp: field_pred: ", mb->field_pred);                                                  DEBUG1("decp: field_pred: ", mb->field_pred);
584    
585                                                  if (mb->field_pred)                                                  if (mb->field_pred) {
                                                 {  
586                                                          mb->field_for_top = BitstreamGetBit(bs);                                                          mb->field_for_top = BitstreamGetBit(bs);
587                                                          DEBUG1("decp: field_for_top: ", mb->field_for_top);                                                          DEBUG1("decp: field_for_top: ", mb->field_for_top);
588                                                          mb->field_for_bot = BitstreamGetBit(bs);                                                          mb->field_for_bot = BitstreamGetBit(bs);
# Line 555  Line 591 
591                                          }                                          }
592                                  }                                  }
593    
594                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
595                                  {                                          if (dec->interlacing && mb->field_pred) {
596                                          if (dec->interlacing && mb->field_pred)                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
597                                          {                                                                                    fcode);
598                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[1],
599                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[1], fcode);                                                                                    fcode);
600                                          }                                          } else {
601                                          else                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
602                                          {                                                                                    fcode);
603                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);                                                  mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
604                                                  mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;                                                          mb->mvs[0].x;
605                                                  mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;                                                  mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
606                                          }                                                          mb->mvs[0].y;
607                                  }                                  }
608                                  else if (mb->mode == MODE_INTER4V /* || mb->mode == MODE_INTER4V_Q */)                                  } else if (mb->mode ==
609                                  {                                                     MODE_INTER4V /* || mb->mode == MODE_INTER4V_Q */ ) {
610                                          get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);                                          get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);
611                                          get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode);                                          get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode);
612                                          get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode);                                          get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode);
613                                          get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode);                                          get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode);
614                                  }                                  } else                  // MODE_INTRA, MODE_INTRA_Q
                                 else  // MODE_INTRA, MODE_INTRA_Q  
615                                  {                                  {
616                                          mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                          mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
617                                          mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                                  0;
618                                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);                                          mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
619                                                    0;
620                                            decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
621                                                                            intra_dc_threshold);
622                                          continue;                                          continue;
623                                  }                                  }
624    
625                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant, rounding);                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant,
626                          }                                                                  rounding);
627                          else    // not coded                          } else                          // not coded
628                          {                          {
629                                    //DEBUG2("P-frame MB at (X,Y)=",x,y);
630                                  mb->mode = MODE_NOT_CODED;                                  mb->mode = MODE_NOT_CODED;
631                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;
632                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;
# Line 597  Line 635 
635    
636                                  start_timer();                                  start_timer();
637    
638                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x),                                  transfer8x8_copy(dec->cur.y + (16 * y) * dec->edged_width +
639                                                   dec->refn[0].y + (16*y)*dec->edged_width + (16*x),                                                                   (16 * x),
640                                                   dec->edged_width);                                                                   dec->refn[0].y + (16 * y) * dec->edged_width +
641                                                                     (16 * x), dec->edged_width);
642                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x+8),  
643                                                   dec->refn[0].y + (16*y)*dec->edged_width + (16*x+8),                                  transfer8x8_copy(dec->cur.y + (16 * y) * dec->edged_width +
644                                                   dec->edged_width);                                                                   (16 * x + 8),
645                                                                     dec->refn[0].y + (16 * y) * dec->edged_width +
646                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x),                                                                   (16 * x + 8), dec->edged_width);
647                                                   dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x),  
648                                                   dec->edged_width);                                  transfer8x8_copy(dec->cur.y + (16 * y + 8) * dec->edged_width +
649                                                                     (16 * x),
650                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x+8),                                                                   dec->refn[0].y + (16 * y +
651                                                   dec->refn[0].y + (16*y+8)*dec->edged_width + (16*x+8),                                                                                                     8) * dec->edged_width +
652                                                   dec->edged_width);                                                                   (16 * x), dec->edged_width);
653    
654                                  transfer8x8_copy(dec->cur.u + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.y + (16 * y + 8) * dec->edged_width +
655                                                   dec->refn[0].u + (8*y)*dec->edged_width/2 + (8*x),                                                                   (16 * x + 8),
656                                                                     dec->refn[0].y + (16 * y +
657                                                                                                       8) * dec->edged_width +
658                                                                     (16 * x + 8), dec->edged_width);
659    
660                                    transfer8x8_copy(dec->cur.u + (8 * y) * dec->edged_width / 2 +
661                                                                     (8 * x),
662                                                                     dec->refn[0].u +
663                                                                     (8 * y) * dec->edged_width / 2 + (8 * x),
664                                                   dec->edged_width/2);                                                   dec->edged_width/2);
665    
666                                  transfer8x8_copy(dec->cur.v + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.v + (8 * y) * dec->edged_width / 2 +
667                                                   dec->refn[0].v + (8*y)*dec->edged_width/2 + (8*x),                                                                   (8 * x),
668                                                                     dec->refn[0].v +
669                                                                     (8 * y) * dec->edged_width / 2 + (8 * x),
670                                                   dec->edged_width/2);                                                   dec->edged_width/2);
671    
672                                  stop_transfer_timer();                                  stop_transfer_timer();
# Line 627  Line 675 
675          }          }
676  }  }
677    
678  int decoder_decode(DECODER * dec, XVID_DEC_FRAME * frame)  
679    // add by MinChen <chenm001@163.com>
680    // decode B-frame motion vector
681    void
682    get_b_motion_vector(DECODER * dec,
683                                            Bitstream * bs,
684                                            int x,
685                                            int y,
686                                            VECTOR * mv,
687                                            int fcode,
688                                            const VECTOR pmv)
689    {
690            int scale_fac = 1 << (fcode - 1);
691            int high = (32 * scale_fac) - 1;
692            int low = ((-32) * scale_fac);
693            int range = (64 * scale_fac);
694    
695            int mv_x, mv_y;
696            int pmv_x, pmv_y;
697    
698            pmv_x = pmv.x;
699            pmv_y = pmv.y;
700    
701            mv_x = get_mv(bs, fcode);
702            mv_y = get_mv(bs, fcode);
703    
704            mv_x += pmv_x;
705            mv_y += pmv_y;
706    
707            if (mv_x < low) {
708                    mv_x += range;
709            } else if (mv_x > high) {
710                    mv_x -= range;
711            }
712    
713            if (mv_y < low) {
714                    mv_y += range;
715            } else if (mv_y > high) {
716                    mv_y -= range;
717            }
718    
719            mv->x = mv_x;
720            mv->y = mv_y;
721    }
722    
723    
724    // add by MinChen <chenm001@163.com>
725    // decode an B-frame forward & backward inter macroblock
726    void
727    decoder_bf_mbinter(DECODER * dec,
728                                       const MACROBLOCK * pMB,
729                                       const uint32_t x_pos,
730                                       const uint32_t y_pos,
731                                       const uint32_t cbp,
732                                       Bitstream * bs,
733                                       const uint32_t quant,
734                                       const uint8_t ref)
735    {
736    
737            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
738            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
739    
740            uint32_t stride = dec->edged_width;
741            uint32_t stride2 = stride / 2;
742            uint32_t next_block = stride * 8;
743            uint32_t i;
744            uint32_t iQuant = pMB->quant;
745            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
746            int uv_dx, uv_dy;
747    
748            pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
749            pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
750            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
751    
752            if (!(pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
753                    uv_dx = pMB->mvs[0].x;
754                    uv_dy = pMB->mvs[0].y;
755    
756                    uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
757                    uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
758            } else {
759                    int sum;
760    
761                    sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
762                    uv_dx =
763                            (sum ==
764                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
765                                                                      (ABS(sum) / 16) * 2));
766    
767                    sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
768                    uv_dy =
769                            (sum ==
770                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
771                                                                      (ABS(sum) / 16) * 2));
772            }
773    
774            start_timer();
775            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos, 16 * y_pos,
776                                                      pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
777            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos + 8,
778                                                      16 * y_pos, pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
779            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos,
780                                                      16 * y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,
781                                                      0);
782            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos + 8,
783                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
784                                                      0);
785            interpolate8x8_switch(dec->cur.u, dec->refn[ref].u, 8 * x_pos, 8 * y_pos,
786                                                      uv_dx, uv_dy, stride2, 0);
787            interpolate8x8_switch(dec->cur.v, dec->refn[ref].v, 8 * x_pos, 8 * y_pos,
788                                                      uv_dx, uv_dy, stride2, 0);
789            stop_comp_timer();
790    
791            for (i = 0; i < 6; i++) {
792                    if (cbp & (1 << (5 - i)))       // coded
793                    {
794                            memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
795    
796                            start_timer();
797                            get_inter_block(bs, &block[i * 64]);
798                            stop_coding_timer();
799    
800                            start_timer();
801                            if (dec->quant_type == 0) {
802                                    dequant_inter(&data[i * 64], &block[i * 64], iQuant);
803                            } else {
804                                    dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
805                            }
806                            stop_iquant_timer();
807    
808                            start_timer();
809                            idct(&data[i * 64]);
810                            stop_idct_timer();
811                    }
812            }
813    
814            if (dec->interlacing && pMB->field_dct) {
815                    next_block = stride;
816                    stride *= 2;
817            }
818    
819            start_timer();
820            if (cbp & 32)
821                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
822            if (cbp & 16)
823                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
824            if (cbp & 8)
825                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
826            if (cbp & 4)
827                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
828            if (cbp & 2)
829                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
830            if (cbp & 1)
831                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
832            stop_transfer_timer();
833    }
834    
835    
836    // add by MinChen <chenm001@163.com>
837    // decode an B-frame direct &  inter macroblock
838    void
839    decoder_bf_interpolate_mbinter(DECODER * dec,
840                                                               IMAGE forward,
841                                                               IMAGE backward,
842                                                               const MACROBLOCK * pMB,
843                                                               const uint32_t x_pos,
844                                                               const uint32_t y_pos,
845                                                               const uint32_t cbp,
846                                                               Bitstream * bs)
847    {
848    
849            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
850            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
851    
852            uint32_t stride = dec->edged_width;
853            uint32_t stride2 = stride / 2;
854            uint32_t next_block = stride * 8;
855            uint32_t iQuant = pMB->quant;
856            int uv_dx, uv_dy;
857            int b_uv_dx, b_uv_dy;
858            uint32_t i;
859            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
860    
861            pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
862            pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
863            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
864    
865            if ((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
866                    uv_dx = pMB->mvs[0].x;
867                    uv_dy = pMB->mvs[0].y;
868    
869                    uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
870                    uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
871    
872                    b_uv_dx = pMB->b_mvs[0].x;
873                    b_uv_dy = pMB->b_mvs[0].y;
874    
875                    b_uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
876                    b_uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
877            } else {
878                    int sum;
879    
880                    sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
881                    uv_dx =
882                            (sum ==
883                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
884                                                                      (ABS(sum) / 16) * 2));
885    
886                    sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
887                    uv_dy =
888                            (sum ==
889                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
890                                                                      (ABS(sum) / 16) * 2));
891    
892                    sum =
893                            pMB->b_mvs[0].x + pMB->b_mvs[1].x + pMB->b_mvs[2].x +
894                            pMB->b_mvs[3].x;
895                    b_uv_dx =
896                            (sum ==
897                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
898                                                                      (ABS(sum) / 16) * 2));
899    
900                    sum =
901                            pMB->b_mvs[0].y + pMB->b_mvs[1].y + pMB->b_mvs[2].y +
902                            pMB->b_mvs[3].y;
903                    b_uv_dy =
904                            (sum ==
905                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
906                                                                      (ABS(sum) / 16) * 2));
907            }
908    
909    
910            start_timer();
911            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos,
912                                                      pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
913            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8, 16 * y_pos,
914                                                      pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
915            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos + 8,
916                                                      pMB->mvs[2].x, pMB->mvs[2].y, stride, 0);
917            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8,
918                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
919                                                      0);
920            interpolate8x8_switch(dec->cur.u, forward.u, 8 * x_pos, 8 * y_pos, uv_dx,
921                                                      uv_dy, stride2, 0);
922            interpolate8x8_switch(dec->cur.v, forward.v, 8 * x_pos, 8 * y_pos, uv_dx,
923                                                      uv_dy, stride2, 0);
924    
925    
926            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos, 16 * y_pos,
927                                                      pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
928            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
929                                                      16 * y_pos, pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride,
930                                                      0);
931            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos,
932                                                      16 * y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y,
933                                                      stride, 0);
934            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
935                                                      16 * y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y,
936                                                      stride, 0);
937            interpolate8x8_switch(dec->refn[2].u, backward.u, 8 * x_pos, 8 * y_pos,
938                                                      b_uv_dx, b_uv_dy, stride2, 0);
939            interpolate8x8_switch(dec->refn[2].v, backward.v, 8 * x_pos, 8 * y_pos,
940                                                      b_uv_dx, b_uv_dy, stride2, 0);
941    
942            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos, 16 * y_pos,
943                                             stride);
944            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos + 8, 16 * y_pos,
945                                             stride);
946            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos, 16 * y_pos + 8,
947                                             stride);
948            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos + 8,
949                                             16 * y_pos + 8, stride);
950            interpolate8x8_c(dec->cur.u, dec->refn[2].u, 8 * x_pos, 8 * y_pos,
951                                             stride2);
952            interpolate8x8_c(dec->cur.v, dec->refn[2].v, 8 * x_pos, 8 * y_pos,
953                                             stride2);
954    
955            stop_comp_timer();
956    
957            for (i = 0; i < 6; i++) {
958                    if (cbp & (1 << (5 - i)))       // coded
959                    {
960                            memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
961    
962                            start_timer();
963                            get_inter_block(bs, &block[i * 64]);
964                            stop_coding_timer();
965    
966                            start_timer();
967                            if (dec->quant_type == 0) {
968                                    dequant_inter(&data[i * 64], &block[i * 64], iQuant);
969                            } else {
970                                    dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
971                            }
972                            stop_iquant_timer();
973    
974                            start_timer();
975                            idct(&data[i * 64]);
976                            stop_idct_timer();
977                    }
978            }
979    
980            if (dec->interlacing && pMB->field_dct) {
981                    next_block = stride;
982                    stride *= 2;
983            }
984    
985            start_timer();
986            if (cbp & 32)
987                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
988            if (cbp & 16)
989                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
990            if (cbp & 8)
991                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
992            if (cbp & 4)
993                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
994            if (cbp & 2)
995                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
996            if (cbp & 1)
997                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
998            stop_transfer_timer();
999    }
1000    
1001    
1002    // add by MinChen <chenm001@163.com>
1003    // for decode B-frame dbquant
1004    int32_t __inline
1005    get_dbquant(Bitstream * bs)
1006    {
1007            if (!BitstreamGetBit(bs))       // '0'
1008                    return (0);
1009            else if (!BitstreamGetBit(bs))  // '10'
1010                    return (-2);
1011            else
1012                    return (2);                             // '11'
1013    }
1014    
1015    // add by MinChen <chenm001@163.com>
1016    // for decode B-frame mb_type
1017    // bit   ret_value
1018    // 1        0
1019    // 01       1
1020    // 001      2
1021    // 0001     3
1022    int32_t __inline
1023    get_mbtype(Bitstream * bs)
1024    {
1025            int32_t mb_type;
1026    
1027            for (mb_type = 0; mb_type <= 3; mb_type++) {
1028                    if (BitstreamGetBit(bs))
1029                            break;
1030            }
1031    
1032            if (mb_type <= 3)
1033                    return (mb_type);
1034            else
1035                    return (-1);
1036    }
1037    
1038    void
1039    decoder_bframe(DECODER * dec,
1040                               Bitstream * bs,
1041                               int quant,
1042                               int fcode_forward,
1043                               int fcode_backward)
1044    {
1045    
1046            uint32_t x, y;
1047            VECTOR mv, zeromv;
1048    
1049            start_timer();
1050            image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
1051                                       dec->width, dec->height, dec->interlacing);
1052            //image_setedges(&dec->refn[1], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);
1053            stop_edges_timer();
1054    
1055    
1056            for (y = 0; y < dec->mb_height; y++) {
1057                    // Initialize Pred Motion Vector
1058                    dec->p_fmv.x = dec->p_fmv.y = dec->p_bmv.x = dec->p_bmv.y = 0;
1059                    for (x = 0; x < dec->mb_width; x++) {
1060                            MACROBLOCK *mb = &dec->mbs[y * dec->mb_width + x];
1061                            MACROBLOCK *last_mb = &dec->last_mbs[y * dec->mb_width + x];
1062    
1063                            mb->mvs[0].x = mb->mvs[0].y = zeromv.x = zeromv.y = mv.x = mv.y =
1064                                    0;
1065    
1066                            // the last P_VOP is skip macroblock ?
1067                            if (last_mb->mode == MODE_NOT_CODED) {
1068                                    //DEBUG2("Skip MB in B-frame at (X,Y)=!",x,y);
1069                                    mb->mb_type = MODE_FORWARD;
1070                                    mb->cbp = 0;
1071                                    mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;
1072                                    mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;
1073                                    mb->quant = 8;
1074    
1075                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);
1076                                    continue;
1077                            }
1078                            //t=BitstreamShowBits(bs,32);
1079    
1080                            if (!BitstreamGetBit(bs)) {     // modb=='0'
1081                                    const uint8_t modb2 = BitstreamGetBit(bs);
1082    
1083                                    mb->mb_type = get_mbtype(bs);
1084    
1085                                    if (!modb2) {   // modb=='00'
1086                                            mb->cbp = BitstreamGetBits(bs, 6);
1087                                    } else {
1088                                            mb->cbp = 0;
1089                                    }
1090                                    if (mb->mb_type && mb->cbp) {
1091                                            quant += get_dbquant(bs);
1092    
1093                                            if (quant > 31) {
1094                                                    quant = 31;
1095                                            } else if (mb->quant < 1) {
1096                                                    quant = 1;
1097                                            }
1098                                    } else {
1099                                            quant = 8;
1100                                    }
1101                                    mb->quant = quant;
1102                            } else {
1103                                    mb->mb_type = MODE_DIRECT_NONE_MV;
1104                                    mb->cbp = 0;
1105                            }
1106    
1107                            mb->mode = MODE_INTER;
1108                            //DEBUG1("Switch bm_type=",mb->mb_type);
1109    
1110                            switch (mb->mb_type) {
1111                            case MODE_DIRECT:
1112                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], 1, zeromv);
1113    
1114                            case MODE_DIRECT_NONE_MV:
1115                                    {                               // Because this file is a C file not C++ so I use '{' to define var
1116                                            const int64_t TRB = dec->time_pp - dec->time_bp, TRD =
1117                                                    dec->time_pp;
1118                                            int i;
1119    
1120                                            for (i = 0; i < 4; i++) {
1121                                                    mb->mvs[i].x =
1122                                                            (int32_t) ((TRB * last_mb->mvs[i].x) / TRD +
1123                                                                               mb->mvs[0].x);
1124                                                    mb->b_mvs[i].x =
1125                                                            (int32_t) ((mb->mvs[0].x ==
1126                                                                                    0) ? ((TRB -
1127                                                                                               TRD) * last_mb->mvs[i].x) /
1128                                                                               TRD : mb->mvs[i].x - last_mb->mvs[i].x);
1129                                                    mb->mvs[i].y =
1130                                                            (int32_t) ((TRB * last_mb->mvs[i].y) / TRD +
1131                                                                               mb->mvs[0].y);
1132                                                    mb->b_mvs[i].y =
1133                                                            (int32_t) ((mb->mvs[0].y ==
1134                                                                                    0) ? ((TRB -
1135                                                                                               TRD) * last_mb->mvs[i].y) /
1136                                                                               TRD : mb->mvs[i].y - last_mb->mvs[i].y);
1137                                            }
1138                                            //DEBUG("B-frame Direct!\n");
1139                                    }
1140                                    mb->mode = MODE_INTER4V;
1141                                    decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1142                                                                                               mb, x, y, mb->cbp, bs);
1143                                    break;
1144    
1145                            case MODE_INTERPOLATE:
1146                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1147                                                                            dec->p_fmv);
1148                                    dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1149                                            mb->mvs[0].x;
1150                                    dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1151                                            mb->mvs[0].y;
1152    
1153                                    get_b_motion_vector(dec, bs, x, y, &mb->b_mvs[0],
1154                                                                            fcode_backward, dec->p_bmv);
1155                                    dec->p_bmv.x = mb->b_mvs[1].x = mb->b_mvs[2].x =
1156                                            mb->b_mvs[3].x = mb->b_mvs[0].x;
1157                                    dec->p_bmv.y = mb->b_mvs[1].y = mb->b_mvs[2].y =
1158                                            mb->b_mvs[3].y = mb->b_mvs[0].y;
1159    
1160                                    decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1161                                                                                               mb, x, y, mb->cbp, bs);
1162                                    //DEBUG("B-frame Bidir!\n");
1163                                    break;
1164    
1165                            case MODE_BACKWARD:
1166                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_backward,
1167                                                                            dec->p_bmv);
1168                                    dec->p_bmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1169                                            mb->mvs[0].x;
1170                                    dec->p_bmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1171                                            mb->mvs[0].y;
1172    
1173                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 0);
1174                                    //DEBUG("B-frame Backward!\n");
1175                                    break;
1176    
1177                            case MODE_FORWARD:
1178                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1179                                                                            dec->p_fmv);
1180                                    dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1181                                            mb->mvs[0].x;
1182                                    dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1183                                            mb->mvs[0].y;
1184    
1185                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);
1186                                    //DEBUG("B-frame Forward!\n");
1187                                    break;
1188    
1189                            default:
1190                                    DEBUG1("Not support B-frame mb_type =", mb->mb_type);
1191                            }
1192    
1193                    }                                               // end of FOR
1194            }
1195    }
1196    
1197    // swap two MACROBLOCK array
1198    void
1199    mb_swap(MACROBLOCK ** mb1,
1200                    MACROBLOCK ** mb2)
1201    {
1202            MACROBLOCK *temp = *mb1;
1203    
1204            *mb1 = *mb2;
1205            *mb2 = temp;
1206    }
1207    
1208    int
1209    decoder_decode(DECODER * dec,
1210                               XVID_DEC_FRAME * frame)
1211  {  {
1212    
1213          Bitstream bs;          Bitstream bs;
1214          uint32_t rounding;          uint32_t rounding;
1215          uint32_t quant;          uint32_t quant;
1216          uint32_t fcode;          uint32_t fcode_forward;
1217            uint32_t fcode_backward;
1218          uint32_t intra_dc_threshold;          uint32_t intra_dc_threshold;
1219          uint32_t vop_type;          uint32_t vop_type;
1220    
# Line 643  Line 1224 
1224    
1225          // add by chenm001 <chenm001@163.com>          // add by chenm001 <chenm001@163.com>
1226          // for support B-frame to reference last 2 frame          // for support B-frame to reference last 2 frame
1227          vop_type=BitstreamReadHeaders(&bs, dec, &rounding, &quant, &fcode, &intra_dc_threshold);          dec->frames++;
1228            vop_type =
1229                    BitstreamReadHeaders(&bs, dec, &rounding, &quant, &fcode_forward,
1230                                                             &fcode_backward, &intra_dc_threshold);
1231    
1232          if (vop_type==I_VOP || vop_type==P_VOP){          dec->p_bmv.x = dec->p_bmv.y = dec->p_fmv.y = dec->p_fmv.y = 0;  // init pred vector to 0
                 image_swap(&dec->refn[0], &dec->refn[1]);  
                 image_swap(&dec->cur, &dec->refn[0]);  
         }  
1233    
1234          switch (vop_type)          switch (vop_type) {
         {  
1235          case P_VOP :          case P_VOP :
1236                  decoder_pframe(dec, &bs, rounding, quant, fcode, intra_dc_threshold);                  decoder_pframe(dec, &bs, rounding, quant, fcode_forward,
1237                                               intra_dc_threshold);
1238                    DEBUG1("P_VOP  Time=", dec->time);
1239                  break;                  break;
1240    
1241          case I_VOP :          case I_VOP :
                 //DEBUG1("",intra_dc_threshold);  
1242                  decoder_iframe(dec, &bs, quant, intra_dc_threshold);                  decoder_iframe(dec, &bs, quant, intra_dc_threshold);
1243                    DEBUG1("I_VOP  Time=", dec->time);
1244                  break;                  break;
1245    
1246          case B_VOP :    // ignore          case B_VOP:
1247    #ifdef BFRAMES
1248                    if (dec->time_pp > dec->time_bp) {
1249                            DEBUG1("B_VOP  Time=", dec->time);
1250                            decoder_bframe(dec, &bs, quant, fcode_forward, fcode_backward);
1251                    } else {
1252                            DEBUG("broken B-frame!");
1253                    }
1254    #endif
1255                  break;                  break;
1256    
1257          case N_VOP :    // vop not coded          case N_VOP :    // vop not coded
# Line 673  Line 1263 
1263    
1264          frame->length = BitstreamPos(&bs) / 8;          frame->length = BitstreamPos(&bs) / 8;
1265    
1266          start_timer();  #ifdef BFRAMES
1267            // test if no B_VOP
1268            if (dec->low_delay) {
1269    #endif
1270          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,
1271                       frame->image, frame->stride, frame->colorspace);                       frame->image, frame->stride, frame->colorspace);
1272    #ifdef BFRAMES
1273            } else {
1274                    if (dec->frames >= 1) {
1275                            start_timer();
1276                            if ((vop_type == I_VOP || vop_type == P_VOP)) {
1277                                    image_output(&dec->refn[0], dec->width, dec->height,
1278                                                             dec->edged_width, frame->image, frame->stride,
1279                                                             frame->colorspace);
1280                            } else if (vop_type == B_VOP) {
1281                                    image_output(&dec->cur, dec->width, dec->height,
1282                                                             dec->edged_width, frame->image, frame->stride,
1283                                                             frame->colorspace);
1284                            }
1285          stop_conv_timer();          stop_conv_timer();
1286                    }
1287            }
1288    #endif
1289    
1290            if (vop_type == I_VOP || vop_type == P_VOP) {
1291                    image_swap(&dec->refn[0], &dec->refn[1]);
1292                    image_swap(&dec->cur, &dec->refn[0]);
1293                    // swap MACROBLOCK
1294                    if (dec->low_delay && vop_type == P_VOP)
1295                            mb_swap(&dec->mbs, &dec->last_mbs);
1296            }
1297    
1298          emms();          emms();
1299    
1300          stop_global_timer();          stop_global_timer();
1301    
1302          return XVID_ERR_OK;          return XVID_ERR_OK;
   
1303  }  }

Legend:
Removed from v.1.11  
changed lines
  Added in v.1.19

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4