[cvs] / xvidcore / src / decoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/decoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.2, Sat Mar 9 14:45:40 2002 UTC revision 1.20, Fri Jun 14 13:21:13 2002 UTC
# Line 1  Line 1 
1  /**************************************************************************  /**************************************************************************
2   *   *
3   *      XVID MPEG-4 VIDEO CODEC   *      XVID MPEG-4 VIDEO CODEC
4   *      decoder main   *  -  Decoder main module  -
5   *   *
6   *      This program is an implementation of a part of one or more MPEG-4   *      This program is an implementation of a part of one or more MPEG-4
7   *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending   *      Video tools as specified in ISO/IEC 14496-2 standard.  Those intending
# Line 24  Line 24 
24   *   *
25   *      You should have received a copy of the GNU General Public License   *      You should have received a copy of the GNU General Public License
26   *      along with this program; if not, write to the Free Software   *      along with this program; if not, write to the Free Software
27   *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
28   *   *
29   *************************************************************************/   *************************************************************************/
30    
# Line 32  Line 32 
32   *   *
33   *      History:   *      History:
34   *   *
35     *  08.05.2002  add low_delay support for B_VOP decode
36     *              MinChen <chenm001@163.com>
37     *  05.05.2002  fix some B-frame decode problem
38     *  02.05.2002  add B-frame decode support(have some problem);
39     *              MinChen <chenm001@163.com>
40     *  22.04.2002  add some B-frame decode support;  chenm001 <chenm001@163.com>
41     *  29.03.2002  interlacing fix - compensated block wasn't being used when
42     *              reconstructing blocks, thus artifacts
43     *              interlacing speedup - used transfers to re-interlace
44     *              interlaced decoding should be as fast as progressive now
45     *  26.03.2002  interlacing support - moved transfers outside decode loop
46   *      26.12.2001      decoder_mbinter: dequant/idct moved within if(coded) block   *      26.12.2001      decoder_mbinter: dequant/idct moved within if(coded) block
47   *      22.12.2001      block based interpolation   *  22.12.2001  lock based interpolation
48   *      01.12.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>   *      01.12.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>
49   *   *
50     *  $Id$
51     *
52   *************************************************************************/   *************************************************************************/
53    
54  #include <stdlib.h>  #include <stdlib.h>
55  #include <string.h>  // memset  #include <string.h>
56    
57  #include "xvid.h"  #include "xvid.h"
58  #include "portab.h"  #include "portab.h"
# Line 62  Line 75 
75    
76  #include "image/image.h"  #include "image/image.h"
77  #include "image/colorspace.h"  #include "image/colorspace.h"
78    #include "utils/mem_align.h"
79    
80  int decoder_create(XVID_DEC_PARAM * param)  int
81    decoder_create(XVID_DEC_PARAM * param)
82  {  {
83          DECODER * dec;          DECODER * dec;
84    
85          dec = malloc(sizeof(DECODER));          dec = xvid_malloc(sizeof(DECODER), CACHE_LINE);
86          if (dec == NULL)          if (dec == NULL) {
         {  
87                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
88          }          }
89          param->handle = dec;          param->handle = dec;
# Line 82  Line 96 
96    
97          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;          dec->edged_width = 16 * dec->mb_width + 2 * EDGE_SIZE;
98          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;          dec->edged_height = 16 * dec->mb_height + 2 * EDGE_SIZE;
99            dec->low_delay = 0;
100    
101          if (image_create(&dec->cur, dec->edged_width, dec->edged_height))          if (image_create(&dec->cur, dec->edged_width, dec->edged_height)) {
102          {                  xvid_free(dec);
                 free(dec);  
103                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
104          }          }
105    
106          if (image_create(&dec->refn, dec->edged_width, dec->edged_height))          if (image_create(&dec->refn[0], dec->edged_width, dec->edged_height)) {
107          {                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
108                    xvid_free(dec);
109                    return XVID_ERR_MEMORY;
110            }
111            // add by chenm001 <chenm001@163.com>
112            // for support B-frame to reference last 2 frame
113            if (image_create(&dec->refn[1], dec->edged_width, dec->edged_height)) {
114                    image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
115                    image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
116                    xvid_free(dec);
117                    return XVID_ERR_MEMORY;
118            }
119            if (image_create(&dec->refn[2], dec->edged_width, dec->edged_height)) {
120                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
121                  free(dec);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
122                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
123                    xvid_free(dec);
124                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
125          }          }
126    
127          dec->mbs = malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height);          dec->mbs =
128          if (dec->mbs == NULL)                  xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
129          {                                          CACHE_LINE);
130            if (dec->mbs == NULL) {
131                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);                  image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
132                  free(dec);                  image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
133                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
134                    image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
135                    xvid_free(dec);
136                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
137          }          }
138    
139            memset(dec->mbs, 0, sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height);
140    
141            // add by chenm001 <chenm001@163.com>
142            // for skip MB flag
143            dec->last_mbs =
144                    xvid_malloc(sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height,
145                                            CACHE_LINE);
146            if (dec->last_mbs == NULL) {
147                    xvid_free(dec->mbs);
148                    image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
149                    image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
150                    image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
151                    image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
152                    xvid_free(dec);
153                    return XVID_ERR_MEMORY;
154            }
155    
156            memset(dec->last_mbs, 0, sizeof(MACROBLOCK) * dec->mb_width * dec->mb_height);
157    
158          init_timer();          init_timer();
159          create_vlc_tables();  
160            // add by chenm001 <chenm001@163.com>
161            // for support B-frame to save reference frame's time
162            dec->frames = -1;
163            dec->time = dec->time_base = dec->last_time_base = 0;
164    
165          return XVID_ERR_OK;          return XVID_ERR_OK;
166  }  }
167    
168    
169  int decoder_destroy(DECODER * dec)  int
170    decoder_destroy(DECODER * dec)
171  {  {
172          free(dec->mbs);          xvid_free(dec->last_mbs);
173          image_destroy(&dec->refn, dec->edged_width, dec->edged_height);          xvid_free(dec->mbs);
174            image_destroy(&dec->refn[0], dec->edged_width, dec->edged_height);
175            image_destroy(&dec->refn[1], dec->edged_width, dec->edged_height);
176            image_destroy(&dec->refn[2], dec->edged_width, dec->edged_height);
177          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);          image_destroy(&dec->cur, dec->edged_width, dec->edged_height);
178          free(dec);          xvid_free(dec);
   
         destroy_vlc_tables();  
179    
180          write_timer();          write_timer();
181          return XVID_ERR_OK;          return XVID_ERR_OK;
# Line 126  Line 183 
183    
184    
185    
186  static const int32_t dquant_table[4] =  static const int32_t dquant_table[4] = {
 {  
187          -1, -2, 1, 2          -1, -2, 1, 2
188  };  };
189    
190    
191    
192    
193  // decode an intra macroblock  // decode an intra macroblock
194    
195  void decoder_mbintra(DECODER * dec, MACROBLOCK * mb, int x, int y, uint32_t acpred_flag, uint32_t cbp, Bitstream * bs, int quant, int intra_dc_threshold)  void
196  {  decoder_mbintra(DECODER * dec,
197          uint32_t k;                                  MACROBLOCK * pMB,
198                                    const uint32_t x_pos,
199                                    const uint32_t y_pos,
200                                    const uint32_t acpred_flag,
201                                    const uint32_t cbp,
202                                    Bitstream * bs,
203                                    const uint32_t quant,
204                                    const uint32_t intra_dc_threshold)
205    {
206    
207            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
208            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
209    
210            uint32_t stride = dec->edged_width;
211            uint32_t stride2 = stride / 2;
212            uint32_t next_block = stride * 8;
213            uint32_t i;
214            uint32_t iQuant = pMB->quant;
215            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
216    
217            pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
218            pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
219            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
220    
221          for (k = 0; k < 6; k++)          memset(block, 0, 6 * 64 * sizeof(int16_t));     // clear
222          {  
223                  uint32_t dcscalar;          for (i = 0; i < 6; i++) {
224                  int16_t block[64];                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
                 int16_t data[64];  
225                  int16_t predictors[8];                  int16_t predictors[8];
226                  int start_coeff;                  int start_coeff;
227    
                 dcscalar = get_dc_scaler(mb->quant, k < 4);  
   
228                  start_timer();                  start_timer();
229                  predict_acdc(dec->mbs, x, y, dec->mb_width, k, block, mb->quant, dcscalar, predictors);                  predict_acdc(dec->mbs, x_pos, y_pos, dec->mb_width, i, &block[i * 64],
230                  if (!acpred_flag)                                           iQuant, iDcScaler, predictors);
231                  {                  if (!acpred_flag) {
232                          mb->acpred_directions[k] = 0;                          pMB->acpred_directions[i] = 0;
233                  }                  }
234                  stop_prediction_timer();                  stop_prediction_timer();
235    
236                  memset(block, 0, 64*sizeof(int16_t));           // clear                  if (quant < intra_dc_threshold) {
   
                 if (quant < intra_dc_threshold)  
                 {  
237                          int dc_size;                          int dc_size;
238                          int dc_dif;                          int dc_dif;
239    
240                          dc_size = k < 4 ?  get_dc_size_lum(bs) : get_dc_size_chrom(bs);                          dc_size = i < 4 ? get_dc_size_lum(bs) : get_dc_size_chrom(bs);
241                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;                          dc_dif = dc_size ? get_dc_dif(bs, dc_size) : 0 ;
242    
243                          if (dc_size > 8)                          if (dc_size > 8) {
                         {  
244                                  BitstreamSkip(bs, 1);           // marker                                  BitstreamSkip(bs, 1);           // marker
245                          }                          }
246    
247                          block[0] = dc_dif;                          block[i * 64 + 0] = dc_dif;
248                          start_coeff = 1;                          start_coeff = 1;
249                  }                  } else {
                 else  
                 {  
250                          start_coeff = 0;                          start_coeff = 0;
251                  }                  }
252    
253                  start_timer();                  start_timer();
254                  if (cbp & (1 << (5-k)))                 // coded                  if (cbp & (1 << (5 - i)))       // coded
255                  {                  {
256                          get_intra_block(bs, block, mb->acpred_directions[k], start_coeff);                          get_intra_block(bs, &block[i * 64], pMB->acpred_directions[i],
257                                                            start_coeff);
258                  }                  }
259                  stop_coding_timer();                  stop_coding_timer();
260    
261                  start_timer();                  start_timer();
262                  add_acdc(mb, k, block, dcscalar, predictors);                  add_acdc(pMB, i, &block[i * 64], iDcScaler, predictors);
263                  stop_prediction_timer();                  stop_prediction_timer();
264    
265                  start_timer();                  start_timer();
266                  if (dec->quant_type == 0)                  if (dec->quant_type == 0) {
267                  {                          dequant_intra(&data[i * 64], &block[i * 64], iQuant, iDcScaler);
268                          dequant_intra(data, block, mb->quant, dcscalar);                  } else {
269                  }                          dequant4_intra(&data[i * 64], &block[i * 64], iQuant, iDcScaler);
                 else  
                 {  
                         dequant4_intra(data, block, mb->quant, dcscalar);  
270                  }                  }
271                  stop_iquant_timer();                  stop_iquant_timer();
272    
273                  start_timer();                  start_timer();
274                  idct(data);                  idct(&data[i * 64]);
275                  stop_idct_timer();                  stop_idct_timer();
   
                 start_timer();  
                 if (k < 4)  
                 {  
                         transfer_16to8copy(dec->cur.y + (16*y*dec->edged_width) + 16*x + (4*(k&2)*dec->edged_width) + 8*(k&1), data, dec->edged_width);  
276                  }                  }
277                  else if (k == 4)  
278                  {          if (dec->interlacing && pMB->field_dct) {
279                          transfer_16to8copy(dec->cur.u+ 8*y*(dec->edged_width/2) + 8*x, data, (dec->edged_width/2));                  next_block = stride;
280                  }                  stride *= 2;
                 else    // if (k == 5)  
                 {  
                         transfer_16to8copy(dec->cur.v + 8*y*(dec->edged_width/2) + 8*x, data, (dec->edged_width/2));  
281                  }                  }
282    
283            start_timer();
284            transfer_16to8copy(pY_Cur, &data[0 * 64], stride);
285            transfer_16to8copy(pY_Cur + 8, &data[1 * 64], stride);
286            transfer_16to8copy(pY_Cur + next_block, &data[2 * 64], stride);
287            transfer_16to8copy(pY_Cur + 8 + next_block, &data[3 * 64], stride);
288            transfer_16to8copy(pU_Cur, &data[4 * 64], stride2);
289            transfer_16to8copy(pV_Cur, &data[5 * 64], stride2);
290                  stop_transfer_timer();                  stop_transfer_timer();
291          }          }
 }  
292    
293    
294    
# Line 234  Line 302 
302    
303  // decode an inter macroblock  // decode an inter macroblock
304    
305  void decoder_mbinter(DECODER * dec, MACROBLOCK * mb, int x, int y, uint32_t acpred_flag, uint32_t cbp, Bitstream * bs, int quant, int rounding)  void
306  {  decoder_mbinter(DECODER * dec,
307          const uint32_t stride = dec->edged_width;                                  const MACROBLOCK * pMB,
308          const uint32_t stride2 = dec->edged_width / 2;                                  const uint32_t x_pos,
309                                    const uint32_t y_pos,
310                                    const uint32_t acpred_flag,
311                                    const uint32_t cbp,
312                                    Bitstream * bs,
313                                    const uint32_t quant,
314                                    const uint32_t rounding)
315    {
316    
317            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
318            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
319    
320            uint32_t stride = dec->edged_width;
321            uint32_t stride2 = stride / 2;
322            uint32_t next_block = stride * 8;
323            uint32_t i;
324            uint32_t iQuant = pMB->quant;
325            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
326          int uv_dx, uv_dy;          int uv_dx, uv_dy;
         uint32_t k;  
327    
328          if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)          pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
329          {          pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
330                  uv_dx = mb->mvs[0].x;          pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
331                  uv_dy = mb->mvs[0].y;  
332            if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q) {
333                    uv_dx = pMB->mvs[0].x;
334                    uv_dy = pMB->mvs[0].y;
335    
336                  uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;                  uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
337                  uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;                  uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
338          }          } else {
         else  
         {  
339                  int sum;                  int sum;
                 sum = mb->mvs[0].x + mb->mvs[1].x + mb->mvs[2].x + mb->mvs[3].x;  
                 uv_dx = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );  
340    
341                  sum = mb->mvs[0].y + mb->mvs[1].y + mb->mvs[2].y + mb->mvs[3].y;                  sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
342                  uv_dy = (sum == 0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] + (ABS(sum) / 16) * 2) );                  uv_dx =
343                            (sum ==
344                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
345                                                                      (ABS(sum) / 16) * 2));
346    
347                    sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
348                    uv_dy =
349                            (sum ==
350                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
351                                                                      (ABS(sum) / 16) * 2));
352          }          }
353    
354          start_timer();          start_timer();
355          interpolate8x8_switch(dec->cur.y, dec->refn.y, 16*x,     16*y    , mb->mvs[0].x, mb->mvs[0].y, stride,  rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos, 16 * y_pos,
356          interpolate8x8_switch(dec->cur.y, dec->refn.y, 16*x + 8, 16*y    , mb->mvs[1].x, mb->mvs[1].y, stride,  rounding);                                                    pMB->mvs[0].x, pMB->mvs[0].y, stride, rounding);
357          interpolate8x8_switch(dec->cur.y, dec->refn.y, 16*x,     16*y + 8, mb->mvs[2].x, mb->mvs[2].y, stride,  rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos + 8,
358          interpolate8x8_switch(dec->cur.y, dec->refn.y, 16*x + 8, 16*y + 8, mb->mvs[3].x, mb->mvs[3].y, stride,  rounding);                                                    16 * y_pos, pMB->mvs[1].x, pMB->mvs[1].y, stride,
359          interpolate8x8_switch(dec->cur.u, dec->refn.u, 8*x, 8*y, uv_dx, uv_dy, stride2, rounding);                                                    rounding);
360          interpolate8x8_switch(dec->cur.v, dec->refn.v, 8*x, 8*y, uv_dx, uv_dy, stride2, rounding);          interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos,
361                                                      16 * y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,
362                                                      rounding);
363            interpolate8x8_switch(dec->cur.y, dec->refn[0].y, 16 * x_pos + 8,
364                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
365                                                      rounding);
366            interpolate8x8_switch(dec->cur.u, dec->refn[0].u, 8 * x_pos, 8 * y_pos,
367                                                      uv_dx, uv_dy, stride2, rounding);
368            interpolate8x8_switch(dec->cur.v, dec->refn[0].v, 8 * x_pos, 8 * y_pos,
369                                                      uv_dx, uv_dy, stride2, rounding);
370          stop_comp_timer();          stop_comp_timer();
371    
372            for (i = 0; i < 6; i++) {
373          for (k = 0; k < 6; k++)                  if (cbp & (1 << (5 - i)))       // coded
374          {          {
375                  int16_t block[64];                          memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
                 int16_t data[64];  
   
                 if (cbp & (1 << (5-k)))                 // coded  
                 {  
                         memset(block, 0, 64 * sizeof(int16_t));         // clear  
376    
377                          start_timer();                          start_timer();
378                          get_inter_block(bs, block);                          get_inter_block(bs, &block[i * 64]);
379                          stop_coding_timer();                          stop_coding_timer();
380    
381                          start_timer();                          start_timer();
382                          if (dec->quant_type == 0)                          if (dec->quant_type == 0) {
383                          {                                  dequant_inter(&data[i * 64], &block[i * 64], iQuant);
384                                  dequant_inter(data, block, mb->quant);                          } else {
385                          }                                  dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
                         else  
                         {  
                                 dequant4_inter(data, block, mb->quant);  
386                          }                          }
387                          stop_iquant_timer();                          stop_iquant_timer();
388    
389                          start_timer();                          start_timer();
390                          idct(data);                          idct(&data[i * 64]);
391                          stop_idct_timer();                          stop_idct_timer();
   
                         start_timer();  
                         if (k < 4)  
                         {  
                                 transfer_16to8add(dec->cur.y + (16*y + 4*(k&2))*stride + 16*x + 8*(k&1), data, stride);  
392                          }                          }
                         else if (k == 4)  
                         {  
                                 transfer_16to8add(dec->cur.u + 8*y*stride2 + 8*x, data, stride2);  
393                          }                          }
394                          else // k == 5  
395                          {          if (dec->interlacing && pMB->field_dct) {
396                                  transfer_16to8add(dec->cur.v + 8*y*stride2 + 8*x, data, stride2);                  next_block = stride;
397                    stride *= 2;
398                          }                          }
399    
400            start_timer();
401            if (cbp & 32)
402                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
403            if (cbp & 16)
404                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
405            if (cbp & 8)
406                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
407            if (cbp & 4)
408                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
409            if (cbp & 2)
410                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
411            if (cbp & 1)
412                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
413                          stop_transfer_timer();                          stop_transfer_timer();
414                  }                  }
         }  
 }  
   
415    
416    
417  void decoder_iframe(DECODER * dec, Bitstream * bs, int quant, int intra_dc_threshold)  void
418    decoder_iframe(DECODER * dec,
419                               Bitstream * bs,
420                               int quant,
421                               int intra_dc_threshold)
422  {  {
423    
424          uint32_t x, y;          uint32_t x, y;
425    
426          for (y = 0; y < dec->mb_height; y++)          for (y = 0; y < dec->mb_height; y++) {
427          {                  for (x = 0; x < dec->mb_width; x++) {
                 for (x = 0; x < dec->mb_width; x++)  
                 {  
428                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];
429    
430                          uint32_t mcbpc;                          uint32_t mcbpc;
# Line 339  Line 439 
439    
440                          acpred_flag = BitstreamGetBit(bs);                          acpred_flag = BitstreamGetBit(bs);
441    
442                          if (mb->mode == MODE_STUFFING)                          if (mb->mode == MODE_STUFFING) {
                         {  
443                                  DEBUG("-- STUFFING ?");                                  DEBUG("-- STUFFING ?");
444                                  continue;                                  continue;
445                          }                          }
# Line 348  Line 447 
447                          cbpy = get_cbpy(bs, 1);                          cbpy = get_cbpy(bs, 1);
448                          cbp = (cbpy << 2) | cbpc;                          cbp = (cbpy << 2) | cbpc;
449    
450                          if (mb->mode == MODE_INTRA_Q)                          if (mb->mode == MODE_INTRA_Q) {
                         {  
451                                  quant += dquant_table[BitstreamGetBits(bs,2)];                                  quant += dquant_table[BitstreamGetBits(bs,2)];
452                                  if (quant > 31)                                  if (quant > 31) {
                                 {  
453                                          quant = 31;                                          quant = 31;
454                                  }                                  } else if (quant < 1) {
                                 else if (quant < 1)  
                                 {  
455                                          quant = 1;                                          quant = 1;
456                                  }                                  }
457                          }                          }
458                          mb->quant = quant;                          mb->quant = quant;
459    
460                            if (dec->interlacing) {
461                                    mb->field_dct = BitstreamGetBit(bs);
462                                    DEBUG1("deci: field_dct: ", mb->field_dct);
463                            }
464    
465                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
466                                                            intra_dc_threshold);
467                  }                  }
468          }          }
469    
470  }  }
471    
472    
473  void get_motion_vector(DECODER *dec, Bitstream *bs, int x, int y, int k, VECTOR * mv, int fcode)  void
474    get_motion_vector(DECODER * dec,
475                                      Bitstream * bs,
476                                      int x,
477                                      int y,
478                                      int k,
479                                      VECTOR * mv,
480                                      int fcode)
481  {  {
482    
483          int scale_fac = 1 << (fcode - 1);          int scale_fac = 1 << (fcode - 1);
484          int high = (32 * scale_fac) - 1;          int high = (32 * scale_fac) - 1;
485          int low = ((-32) * scale_fac);          int low = ((-32) * scale_fac);
486          int range = (64 * scale_fac);          int range = (64 * scale_fac);
487    
488          VECTOR pmv[4];          VECTOR pmv[4];
489          uint32_t psad[4];          int32_t psad[4];
490    
491          int mv_x, mv_y;          int mv_x, mv_y;
492          int pmv_x, pmv_y;          int pmv_x, pmv_y;
# Line 394  Line 503 
503          mv_x += pmv_x;          mv_x += pmv_x;
504          mv_y += pmv_y;          mv_y += pmv_y;
505    
506          if (mv_x < low)          if (mv_x < low) {
         {  
507                  mv_x += range;                  mv_x += range;
508          }          } else if (mv_x > high) {
         else if (mv_x > high)  
         {  
509                  mv_x -= range;                  mv_x -= range;
510          }          }
511    
512          if (mv_y < low)          if (mv_y < low) {
         {  
513                  mv_y += range;                  mv_y += range;
514          }          } else if (mv_y > high) {
         else if (mv_y > high)  
         {  
515                  mv_y -= range;                  mv_y -= range;
516          }          }
517    
# Line 418  Line 521 
521  }  }
522    
523    
524  void decoder_pframe(DECODER * dec, Bitstream * bs, int rounding, int quant, int fcode, int intra_dc_threshold)  void
525    decoder_pframe(DECODER * dec,
526                               Bitstream * bs,
527                               int rounding,
528                               int quant,
529                               int fcode,
530                               int intra_dc_threshold)
531  {  {
         uint32_t x, y;  
532    
533          image_swap(&dec->cur, &dec->refn);          uint32_t x, y;
534    
535          start_timer();          start_timer();
536          image_setedges(&dec->refn, dec->edged_width, dec->edged_height, dec->width, dec->height);          image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
537                                       dec->width, dec->height, dec->interlacing);
538          stop_edges_timer();          stop_edges_timer();
539    
540          for (y = 0; y < dec->mb_height; y++)          for (y = 0; y < dec->mb_height; y++) {
541          {                  for (x = 0; x < dec->mb_width; x++) {
                 for (x = 0; x < dec->mb_width; x++)  
                 {  
542                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];                          MACROBLOCK * mb = &dec->mbs[y*dec->mb_width + x];
543    
544                          if (!BitstreamGetBit(bs))                       // not_coded                          //if (!(dec->mb_skip[y*dec->mb_width + x]=BitstreamGetBit(bs)))         // not_coded
545                            if (!(BitstreamGetBit(bs)))     // not_coded
546                          {                          {
547                                  uint32_t mcbpc;                                  uint32_t mcbpc;
548                                  uint32_t cbpc;                                  uint32_t cbpc;
# Line 450  Line 558 
558    
559                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);                                  intra = (mb->mode == MODE_INTRA || mb->mode == MODE_INTRA_Q);
560    
561                                  if (intra)                                  if (intra) {
                                 {  
562                                          acpred_flag = BitstreamGetBit(bs);                                          acpred_flag = BitstreamGetBit(bs);
563                                  }                                  }
564    
565                                  if (mb->mode == MODE_STUFFING)                                  if (mb->mode == MODE_STUFFING) {
                                 {  
566                                          DEBUG("-- STUFFING ?");                                          DEBUG("-- STUFFING ?");
567                                          continue;                                          continue;
568                                  }                                  }
# Line 464  Line 570 
570                                  cbpy = get_cbpy(bs, intra);                                  cbpy = get_cbpy(bs, intra);
571                                  cbp = (cbpy << 2) | cbpc;                                  cbp = (cbpy << 2) | cbpc;
572    
573                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q)                                  if (mb->mode == MODE_INTER_Q || mb->mode == MODE_INTRA_Q) {
                                 {  
574                                          quant += dquant_table[BitstreamGetBits(bs,2)];                                          quant += dquant_table[BitstreamGetBits(bs,2)];
575                                          if (quant > 31)                                          if (quant > 31) {
                                         {  
576                                                  quant = 31;                                                  quant = 31;
577                                          }                                          } else if (mb->quant < 1) {
                                         else if (mb->quant < 1)  
                                         {  
578                                                  quant = 1;                                                  quant = 1;
579                                          }                                          }
580                                  }                                  }
581                                  mb->quant = quant;                                  mb->quant = quant;
582    
583                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q)                                  if (dec->interlacing) {
584                                  {                                          mb->field_dct = BitstreamGetBit(bs);
585                                            DEBUG1("decp: field_dct: ", mb->field_dct);
586    
587                                            if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
588                                                    mb->field_pred = BitstreamGetBit(bs);
589                                                    DEBUG1("decp: field_pred: ", mb->field_pred);
590    
591                                                    if (mb->field_pred) {
592                                                            mb->field_for_top = BitstreamGetBit(bs);
593                                                            DEBUG1("decp: field_for_top: ", mb->field_for_top);
594                                                            mb->field_for_bot = BitstreamGetBit(bs);
595                                                            DEBUG1("decp: field_for_bot: ", mb->field_for_bot);
596                                                    }
597                                            }
598                                    }
599    
600                                          get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);                                  if (mb->mode == MODE_INTER || mb->mode == MODE_INTER_Q) {
601                                          mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;                                          if (dec->interlacing && mb->field_pred) {
602                                          mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;                                                  get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
603                                                                                      fcode);
604                                                    get_motion_vector(dec, bs, x, y, 0, &mb->mvs[1],
605                                                                                      fcode);
606                                            } else {
607                                                    get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0],
608                                                                                      fcode);
609                                                    mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
610                                                            mb->mvs[0].x;
611                                                    mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
612                                                            mb->mvs[0].y;
613                                  }                                  }
614                                  else if (mb->mode == MODE_INTER4V /* || mb->mode == MODE_INTER4V_Q */)                                  } else if (mb->mode ==
615                                  {                                                     MODE_INTER4V /* || mb->mode == MODE_INTER4V_Q */ ) {
616                                          get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);                                          get_motion_vector(dec, bs, x, y, 0, &mb->mvs[0], fcode);
617                                          get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode);                                          get_motion_vector(dec, bs, x, y, 1, &mb->mvs[1], fcode);
618                                          get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode);                                          get_motion_vector(dec, bs, x, y, 2, &mb->mvs[2], fcode);
619                                          get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode);                                          get_motion_vector(dec, bs, x, y, 3, &mb->mvs[3], fcode);
620                                  }                                  } else                  // MODE_INTRA, MODE_INTRA_Q
                                 else  // MODE_INTRA, MODE_INTRA_Q  
621                                  {                                  {
622                                          mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                          mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
623                                          mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                                  0;
624                                          decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant, intra_dc_threshold);                                          mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
625                                                    0;
626                                            decoder_mbintra(dec, mb, x, y, acpred_flag, cbp, bs, quant,
627                                                                            intra_dc_threshold);
628                                          continue;                                          continue;
629                                  }                                  }
630    
631                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant, rounding);                                  decoder_mbinter(dec, mb, x, y, acpred_flag, cbp, bs, quant,
632                          }                                                                  rounding);
633                          else    // not coded                          } else                          // not coded
634                          {                          {
635                                    //DEBUG2("P-frame MB at (X,Y)=",x,y);
636                                  mb->mode = MODE_NOT_CODED;                                  mb->mode = MODE_NOT_CODED;
637                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;                                  mb->mvs[0].x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = 0;
638                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;                                  mb->mvs[0].y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = 0;
# Line 513  Line 641 
641    
642                                  start_timer();                                  start_timer();
643    
644                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x),                                  transfer8x8_copy(dec->cur.y + (16 * y) * dec->edged_width +
645                                                                  dec->refn.y + (16*y)*dec->edged_width + (16*x),                                                                   (16 * x),
646                                                                  dec->edged_width);                                                                   dec->refn[0].y + (16 * y) * dec->edged_width +
647                                                                     (16 * x), dec->edged_width);
648                                  transfer8x8_copy(dec->cur.y + (16*y)*dec->edged_width + (16*x+8),  
649                                                                  dec->refn.y + (16*y)*dec->edged_width + (16*x+8),                                  transfer8x8_copy(dec->cur.y + (16 * y) * dec->edged_width +
650                                                                  dec->edged_width);                                                                   (16 * x + 8),
651                                                                     dec->refn[0].y + (16 * y) * dec->edged_width +
652                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x),                                                                   (16 * x + 8), dec->edged_width);
653                                                                  dec->refn.y + (16*y+8)*dec->edged_width + (16*x),  
654                                                                  dec->edged_width);                                  transfer8x8_copy(dec->cur.y + (16 * y + 8) * dec->edged_width +
655                                                                     (16 * x),
656                                  transfer8x8_copy(dec->cur.y + (16*y+8)*dec->edged_width + (16*x+8),                                                                   dec->refn[0].y + (16 * y +
657                                                                  dec->refn.y + (16*y+8)*dec->edged_width + (16*x+8),                                                                                                     8) * dec->edged_width +
658                                                                  dec->edged_width);                                                                   (16 * x), dec->edged_width);
659    
660                                  transfer8x8_copy(dec->cur.u + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.y + (16 * y + 8) * dec->edged_width +
661                                                                  dec->refn.u + (8*y)*dec->edged_width/2 + (8*x),                                                                   (16 * x + 8),
662                                                                     dec->refn[0].y + (16 * y +
663                                                                                                       8) * dec->edged_width +
664                                                                     (16 * x + 8), dec->edged_width);
665    
666                                    transfer8x8_copy(dec->cur.u + (8 * y) * dec->edged_width / 2 +
667                                                                     (8 * x),
668                                                                     dec->refn[0].u +
669                                                                     (8 * y) * dec->edged_width / 2 + (8 * x),
670                                                                  dec->edged_width/2);                                                                  dec->edged_width/2);
671    
672                                  transfer8x8_copy(dec->cur.v + (8*y)*dec->edged_width/2 + (8*x),                                  transfer8x8_copy(dec->cur.v + (8 * y) * dec->edged_width / 2 +
673                                                                  dec->refn.v + (8*y)*dec->edged_width/2 + (8*x),                                                                   (8 * x),
674                                                                     dec->refn[0].v +
675                                                                     (8 * y) * dec->edged_width / 2 + (8 * x),
676                                                                  dec->edged_width/2);                                                                  dec->edged_width/2);
677    
678                                  stop_transfer_timer();                                  stop_transfer_timer();
# Line 543  Line 681 
681          }          }
682  }  }
683    
684  int decoder_decode(DECODER * dec, XVID_DEC_FRAME * frame)  
685    // add by MinChen <chenm001@163.com>
686    // decode B-frame motion vector
687    void
688    get_b_motion_vector(DECODER * dec,
689                                            Bitstream * bs,
690                                            int x,
691                                            int y,
692                                            VECTOR * mv,
693                                            int fcode,
694                                            const VECTOR pmv)
695  {  {
696            int scale_fac = 1 << (fcode - 1);
697            int high = (32 * scale_fac) - 1;
698            int low = ((-32) * scale_fac);
699            int range = (64 * scale_fac);
700    
701            int mv_x, mv_y;
702            int pmv_x, pmv_y;
703    
704            pmv_x = pmv.x;
705            pmv_y = pmv.y;
706    
707            mv_x = get_mv(bs, fcode);
708            mv_y = get_mv(bs, fcode);
709    
710            mv_x += pmv_x;
711            mv_y += pmv_y;
712    
713            if (mv_x < low) {
714                    mv_x += range;
715            } else if (mv_x > high) {
716                    mv_x -= range;
717            }
718    
719            if (mv_y < low) {
720                    mv_y += range;
721            } else if (mv_y > high) {
722                    mv_y -= range;
723            }
724    
725            mv->x = mv_x;
726            mv->y = mv_y;
727    }
728    
729    
730    // add by MinChen <chenm001@163.com>
731    // decode an B-frame forward & backward inter macroblock
732    void
733    decoder_bf_mbinter(DECODER * dec,
734                                       const MACROBLOCK * pMB,
735                                       const uint32_t x_pos,
736                                       const uint32_t y_pos,
737                                       const uint32_t cbp,
738                                       Bitstream * bs,
739                                       const uint32_t quant,
740                                       const uint8_t ref)
741    {
742    
743            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
744            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
745    
746            uint32_t stride = dec->edged_width;
747            uint32_t stride2 = stride / 2;
748            uint32_t next_block = stride * 8;
749            uint32_t i;
750            uint32_t iQuant = pMB->quant;
751            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
752            int uv_dx, uv_dy;
753    
754            pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
755            pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
756            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
757    
758            if (!(pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
759                    uv_dx = pMB->mvs[0].x;
760                    uv_dy = pMB->mvs[0].y;
761    
762                    uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
763                    uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
764            } else {
765                    int sum;
766    
767                    sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
768                    uv_dx =
769                            (sum ==
770                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
771                                                                      (ABS(sum) / 16) * 2));
772    
773                    sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
774                    uv_dy =
775                            (sum ==
776                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
777                                                                      (ABS(sum) / 16) * 2));
778            }
779    
780            start_timer();
781            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos, 16 * y_pos,
782                                                      pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
783            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos + 8,
784                                                      16 * y_pos, pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
785            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos,
786                                                      16 * y_pos + 8, pMB->mvs[2].x, pMB->mvs[2].y, stride,
787                                                      0);
788            interpolate8x8_switch(dec->cur.y, dec->refn[ref].y, 16 * x_pos + 8,
789                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
790                                                      0);
791            interpolate8x8_switch(dec->cur.u, dec->refn[ref].u, 8 * x_pos, 8 * y_pos,
792                                                      uv_dx, uv_dy, stride2, 0);
793            interpolate8x8_switch(dec->cur.v, dec->refn[ref].v, 8 * x_pos, 8 * y_pos,
794                                                      uv_dx, uv_dy, stride2, 0);
795            stop_comp_timer();
796    
797            for (i = 0; i < 6; i++) {
798                    if (cbp & (1 << (5 - i)))       // coded
799                    {
800                            memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
801    
802                            start_timer();
803                            get_inter_block(bs, &block[i * 64]);
804                            stop_coding_timer();
805    
806                            start_timer();
807                            if (dec->quant_type == 0) {
808                                    dequant_inter(&data[i * 64], &block[i * 64], iQuant);
809                            } else {
810                                    dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
811                            }
812                            stop_iquant_timer();
813    
814                            start_timer();
815                            idct(&data[i * 64]);
816                            stop_idct_timer();
817                    }
818            }
819    
820            if (dec->interlacing && pMB->field_dct) {
821                    next_block = stride;
822                    stride *= 2;
823            }
824    
825            start_timer();
826            if (cbp & 32)
827                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
828            if (cbp & 16)
829                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
830            if (cbp & 8)
831                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
832            if (cbp & 4)
833                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
834            if (cbp & 2)
835                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
836            if (cbp & 1)
837                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
838            stop_transfer_timer();
839    }
840    
841    
842    // add by MinChen <chenm001@163.com>
843    // decode an B-frame direct &  inter macroblock
844    void
845    decoder_bf_interpolate_mbinter(DECODER * dec,
846                                                               IMAGE forward,
847                                                               IMAGE backward,
848                                                               const MACROBLOCK * pMB,
849                                                               const uint32_t x_pos,
850                                                               const uint32_t y_pos,
851                                                               const uint32_t cbp,
852                                                               Bitstream * bs)
853    {
854    
855            DECLARE_ALIGNED_MATRIX(block, 6, 64, int16_t, CACHE_LINE);
856            DECLARE_ALIGNED_MATRIX(data, 6, 64, int16_t, CACHE_LINE);
857    
858            uint32_t stride = dec->edged_width;
859            uint32_t stride2 = stride / 2;
860            uint32_t next_block = stride * 8;
861            uint32_t iQuant = pMB->quant;
862            int uv_dx, uv_dy;
863            int b_uv_dx, b_uv_dy;
864            uint32_t i;
865            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
866    
867            pY_Cur = dec->cur.y + (y_pos << 4) * stride + (x_pos << 4);
868            pU_Cur = dec->cur.u + (y_pos << 3) * stride2 + (x_pos << 3);
869            pV_Cur = dec->cur.v + (y_pos << 3) * stride2 + (x_pos << 3);
870    
871            if ((pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)) {
872                    uv_dx = pMB->mvs[0].x;
873                    uv_dy = pMB->mvs[0].y;
874    
875                    uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
876                    uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
877    
878                    b_uv_dx = pMB->b_mvs[0].x;
879                    b_uv_dy = pMB->b_mvs[0].y;
880    
881                    b_uv_dx = (uv_dx & 3) ? (uv_dx >> 1) | 1 : uv_dx / 2;
882                    b_uv_dy = (uv_dy & 3) ? (uv_dy >> 1) | 1 : uv_dy / 2;
883            } else {
884                    int sum;
885    
886                    sum = pMB->mvs[0].x + pMB->mvs[1].x + pMB->mvs[2].x + pMB->mvs[3].x;
887                    uv_dx =
888                            (sum ==
889                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
890                                                                      (ABS(sum) / 16) * 2));
891    
892                    sum = pMB->mvs[0].y + pMB->mvs[1].y + pMB->mvs[2].y + pMB->mvs[3].y;
893                    uv_dy =
894                            (sum ==
895                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
896                                                                      (ABS(sum) / 16) * 2));
897    
898                    sum =
899                            pMB->b_mvs[0].x + pMB->b_mvs[1].x + pMB->b_mvs[2].x +
900                            pMB->b_mvs[3].x;
901                    b_uv_dx =
902                            (sum ==
903                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
904                                                                      (ABS(sum) / 16) * 2));
905    
906                    sum =
907                            pMB->b_mvs[0].y + pMB->b_mvs[1].y + pMB->b_mvs[2].y +
908                            pMB->b_mvs[3].y;
909                    b_uv_dy =
910                            (sum ==
911                             0 ? 0 : SIGN(sum) * (roundtab[ABS(sum) % 16] +
912                                                                      (ABS(sum) / 16) * 2));
913            }
914    
915    
916            start_timer();
917            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos,
918                                                      pMB->mvs[0].x, pMB->mvs[0].y, stride, 0);
919            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8, 16 * y_pos,
920                                                      pMB->mvs[1].x, pMB->mvs[1].y, stride, 0);
921            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos, 16 * y_pos + 8,
922                                                      pMB->mvs[2].x, pMB->mvs[2].y, stride, 0);
923            interpolate8x8_switch(dec->cur.y, forward.y, 16 * x_pos + 8,
924                                                      16 * y_pos + 8, pMB->mvs[3].x, pMB->mvs[3].y, stride,
925                                                      0);
926            interpolate8x8_switch(dec->cur.u, forward.u, 8 * x_pos, 8 * y_pos, uv_dx,
927                                                      uv_dy, stride2, 0);
928            interpolate8x8_switch(dec->cur.v, forward.v, 8 * x_pos, 8 * y_pos, uv_dx,
929                                                      uv_dy, stride2, 0);
930    
931    
932            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos, 16 * y_pos,
933                                                      pMB->b_mvs[0].x, pMB->b_mvs[0].y, stride, 0);
934            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
935                                                      16 * y_pos, pMB->b_mvs[1].x, pMB->b_mvs[1].y, stride,
936                                                      0);
937            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos,
938                                                      16 * y_pos + 8, pMB->b_mvs[2].x, pMB->b_mvs[2].y,
939                                                      stride, 0);
940            interpolate8x8_switch(dec->refn[2].y, backward.y, 16 * x_pos + 8,
941                                                      16 * y_pos + 8, pMB->b_mvs[3].x, pMB->b_mvs[3].y,
942                                                      stride, 0);
943            interpolate8x8_switch(dec->refn[2].u, backward.u, 8 * x_pos, 8 * y_pos,
944                                                      b_uv_dx, b_uv_dy, stride2, 0);
945            interpolate8x8_switch(dec->refn[2].v, backward.v, 8 * x_pos, 8 * y_pos,
946                                                      b_uv_dx, b_uv_dy, stride2, 0);
947    
948            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos, 16 * y_pos,
949                                             stride);
950            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos + 8, 16 * y_pos,
951                                             stride);
952            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos, 16 * y_pos + 8,
953                                             stride);
954            interpolate8x8_c(dec->cur.y, dec->refn[2].y, 16 * x_pos + 8,
955                                             16 * y_pos + 8, stride);
956            interpolate8x8_c(dec->cur.u, dec->refn[2].u, 8 * x_pos, 8 * y_pos,
957                                             stride2);
958            interpolate8x8_c(dec->cur.v, dec->refn[2].v, 8 * x_pos, 8 * y_pos,
959                                             stride2);
960    
961            stop_comp_timer();
962    
963            for (i = 0; i < 6; i++) {
964                    if (cbp & (1 << (5 - i)))       // coded
965                    {
966                            memset(&block[i * 64], 0, 64 * sizeof(int16_t));        // clear
967    
968                            start_timer();
969                            get_inter_block(bs, &block[i * 64]);
970                            stop_coding_timer();
971    
972                            start_timer();
973                            if (dec->quant_type == 0) {
974                                    dequant_inter(&data[i * 64], &block[i * 64], iQuant);
975                            } else {
976                                    dequant4_inter(&data[i * 64], &block[i * 64], iQuant);
977                            }
978                            stop_iquant_timer();
979    
980                            start_timer();
981                            idct(&data[i * 64]);
982                            stop_idct_timer();
983                    }
984            }
985    
986            if (dec->interlacing && pMB->field_dct) {
987                    next_block = stride;
988                    stride *= 2;
989            }
990    
991            start_timer();
992            if (cbp & 32)
993                    transfer_16to8add(pY_Cur, &data[0 * 64], stride);
994            if (cbp & 16)
995                    transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
996            if (cbp & 8)
997                    transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
998            if (cbp & 4)
999                    transfer_16to8add(pY_Cur + 8 + next_block, &data[3 * 64], stride);
1000            if (cbp & 2)
1001                    transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
1002            if (cbp & 1)
1003                    transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
1004            stop_transfer_timer();
1005    }
1006    
1007    
1008    // add by MinChen <chenm001@163.com>
1009    // for decode B-frame dbquant
1010    int32_t __inline
1011    get_dbquant(Bitstream * bs)
1012    {
1013            if (!BitstreamGetBit(bs))       // '0'
1014                    return (0);
1015            else if (!BitstreamGetBit(bs))  // '10'
1016                    return (-2);
1017            else
1018                    return (2);                             // '11'
1019    }
1020    
1021    // add by MinChen <chenm001@163.com>
1022    // for decode B-frame mb_type
1023    // bit   ret_value
1024    // 1        0
1025    // 01       1
1026    // 001      2
1027    // 0001     3
1028    int32_t __inline
1029    get_mbtype(Bitstream * bs)
1030    {
1031            int32_t mb_type;
1032    
1033            for (mb_type = 0; mb_type <= 3; mb_type++) {
1034                    if (BitstreamGetBit(bs))
1035                            break;
1036            }
1037    
1038            if (mb_type <= 3)
1039                    return (mb_type);
1040            else
1041                    return (-1);
1042    }
1043    
1044    void
1045    decoder_bframe(DECODER * dec,
1046                               Bitstream * bs,
1047                               int quant,
1048                               int fcode_forward,
1049                               int fcode_backward)
1050    {
1051    
1052            uint32_t x, y;
1053            VECTOR mv, zeromv;
1054    
1055            start_timer();
1056            image_setedges(&dec->refn[0], dec->edged_width, dec->edged_height,
1057                                       dec->width, dec->height, dec->interlacing);
1058            //image_setedges(&dec->refn[1], dec->edged_width, dec->edged_height, dec->width, dec->height, dec->interlacing);
1059            stop_edges_timer();
1060    
1061    
1062            for (y = 0; y < dec->mb_height; y++) {
1063                    // Initialize Pred Motion Vector
1064                    dec->p_fmv.x = dec->p_fmv.y = dec->p_bmv.x = dec->p_bmv.y = 0;
1065                    for (x = 0; x < dec->mb_width; x++) {
1066                            MACROBLOCK *mb = &dec->mbs[y * dec->mb_width + x];
1067                            MACROBLOCK *last_mb = &dec->last_mbs[y * dec->mb_width + x];
1068    
1069                            mb->mvs[0].x = mb->mvs[0].y = zeromv.x = zeromv.y = mv.x = mv.y =
1070                                    0;
1071    
1072                            // the last P_VOP is skip macroblock ?
1073                            if (last_mb->mode == MODE_NOT_CODED) {
1074                                    //DEBUG2("Skip MB in B-frame at (X,Y)=!",x,y);
1075                                    mb->mb_type = MODE_FORWARD;
1076                                    mb->cbp = 0;
1077                                    mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x = mb->mvs[0].x;
1078                                    mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y = mb->mvs[0].y;
1079                                    mb->quant = 8;
1080    
1081                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);
1082                                    continue;
1083                            }
1084                            //t=BitstreamShowBits(bs,32);
1085    
1086                            if (!BitstreamGetBit(bs)) {     // modb=='0'
1087                                    const uint8_t modb2 = BitstreamGetBit(bs);
1088    
1089                                    mb->mb_type = get_mbtype(bs);
1090    
1091                                    if (!modb2) {   // modb=='00'
1092                                            mb->cbp = BitstreamGetBits(bs, 6);
1093                                    } else {
1094                                            mb->cbp = 0;
1095                                    }
1096                                    if (mb->mb_type && mb->cbp) {
1097                                            quant += get_dbquant(bs);
1098    
1099                                            if (quant > 31) {
1100                                                    quant = 31;
1101                                            } else if (mb->quant < 1) {
1102                                                    quant = 1;
1103                                            }
1104                                    } else {
1105                                            quant = 8;
1106                                    }
1107                                    mb->quant = quant;
1108                            } else {
1109                                    mb->mb_type = MODE_DIRECT_NONE_MV;
1110                                    mb->cbp = 0;
1111                            }
1112    
1113                            mb->mode = MODE_INTER;
1114                            //DEBUG1("Switch bm_type=",mb->mb_type);
1115    
1116                            switch (mb->mb_type) {
1117                            case MODE_DIRECT:
1118                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], 1, zeromv);
1119    
1120                            case MODE_DIRECT_NONE_MV:
1121                                    {                               // Because this file is a C file not C++ so I use '{' to define var
1122                                            const int64_t TRB = dec->time_pp - dec->time_bp, TRD =
1123                                                    dec->time_pp;
1124                                            int i;
1125    
1126                                            for (i = 0; i < 4; i++) {
1127                                                    mb->mvs[i].x =
1128                                                            (int32_t) ((TRB * last_mb->mvs[i].x) / TRD +
1129                                                                               mb->mvs[0].x);
1130                                                    mb->b_mvs[i].x =
1131                                                            (int32_t) ((mb->mvs[0].x ==
1132                                                                                    0) ? ((TRB -
1133                                                                                               TRD) * last_mb->mvs[i].x) /
1134                                                                               TRD : mb->mvs[i].x - last_mb->mvs[i].x);
1135                                                    mb->mvs[i].y =
1136                                                            (int32_t) ((TRB * last_mb->mvs[i].y) / TRD +
1137                                                                               mb->mvs[0].y);
1138                                                    mb->b_mvs[i].y =
1139                                                            (int32_t) ((mb->mvs[0].y ==
1140                                                                                    0) ? ((TRB -
1141                                                                                               TRD) * last_mb->mvs[i].y) /
1142                                                                               TRD : mb->mvs[i].y - last_mb->mvs[i].y);
1143                                            }
1144                                            //DEBUG("B-frame Direct!\n");
1145                                    }
1146                                    mb->mode = MODE_INTER4V;
1147                                    decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1148                                                                                               mb, x, y, mb->cbp, bs);
1149                                    break;
1150    
1151                            case MODE_INTERPOLATE:
1152                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1153                                                                            dec->p_fmv);
1154                                    dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1155                                            mb->mvs[0].x;
1156                                    dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1157                                            mb->mvs[0].y;
1158    
1159                                    get_b_motion_vector(dec, bs, x, y, &mb->b_mvs[0],
1160                                                                            fcode_backward, dec->p_bmv);
1161                                    dec->p_bmv.x = mb->b_mvs[1].x = mb->b_mvs[2].x =
1162                                            mb->b_mvs[3].x = mb->b_mvs[0].x;
1163                                    dec->p_bmv.y = mb->b_mvs[1].y = mb->b_mvs[2].y =
1164                                            mb->b_mvs[3].y = mb->b_mvs[0].y;
1165    
1166                                    decoder_bf_interpolate_mbinter(dec, dec->refn[1], dec->refn[0],
1167                                                                                               mb, x, y, mb->cbp, bs);
1168                                    //DEBUG("B-frame Bidir!\n");
1169                                    break;
1170    
1171                            case MODE_BACKWARD:
1172                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_backward,
1173                                                                            dec->p_bmv);
1174                                    dec->p_bmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1175                                            mb->mvs[0].x;
1176                                    dec->p_bmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1177                                            mb->mvs[0].y;
1178    
1179                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 0);
1180                                    //DEBUG("B-frame Backward!\n");
1181                                    break;
1182    
1183                            case MODE_FORWARD:
1184                                    get_b_motion_vector(dec, bs, x, y, &mb->mvs[0], fcode_forward,
1185                                                                            dec->p_fmv);
1186                                    dec->p_fmv.x = mb->mvs[1].x = mb->mvs[2].x = mb->mvs[3].x =
1187                                            mb->mvs[0].x;
1188                                    dec->p_fmv.y = mb->mvs[1].y = mb->mvs[2].y = mb->mvs[3].y =
1189                                            mb->mvs[0].y;
1190    
1191                                    decoder_bf_mbinter(dec, mb, x, y, mb->cbp, bs, quant, 1);
1192                                    //DEBUG("B-frame Forward!\n");
1193                                    break;
1194    
1195                            default:
1196                                    DEBUG1("Not support B-frame mb_type =", mb->mb_type);
1197                            }
1198    
1199                    }                                               // end of FOR
1200            }
1201    }
1202    
1203    // swap two MACROBLOCK array
1204    void
1205    mb_swap(MACROBLOCK ** mb1,
1206                    MACROBLOCK ** mb2)
1207    {
1208            MACROBLOCK *temp = *mb1;
1209    
1210            *mb1 = *mb2;
1211            *mb2 = temp;
1212    }
1213    
1214    int
1215    decoder_decode(DECODER * dec,
1216                               XVID_DEC_FRAME * frame)
1217    {
1218    
1219          Bitstream bs;          Bitstream bs;
1220          uint32_t rounding;          uint32_t rounding;
1221          uint32_t quant;          uint32_t quant;
1222          uint32_t fcode;          uint32_t fcode_forward;
1223            uint32_t fcode_backward;
1224          uint32_t intra_dc_threshold;          uint32_t intra_dc_threshold;
1225            uint32_t vop_type;
1226    
1227          start_global_timer();          start_global_timer();
1228    
1229          BitstreamInit(&bs, frame->bitstream, frame->length);          BitstreamInit(&bs, frame->bitstream, frame->length);
1230    
1231          switch (BitstreamReadHeaders(&bs, dec, &rounding, &quant, &fcode, &intra_dc_threshold))          // add by chenm001 <chenm001@163.com>
1232          {          // for support B-frame to reference last 2 frame
1233            dec->frames++;
1234            vop_type =
1235                    BitstreamReadHeaders(&bs, dec, &rounding, &quant, &fcode_forward,
1236                                                             &fcode_backward, &intra_dc_threshold);
1237    
1238            dec->p_bmv.x = dec->p_bmv.y = dec->p_fmv.y = dec->p_fmv.y = 0;  // init pred vector to 0
1239    
1240            switch (vop_type) {
1241          case P_VOP :          case P_VOP :
1242                  decoder_pframe(dec, &bs, rounding, quant, fcode, intra_dc_threshold);                  decoder_pframe(dec, &bs, rounding, quant, fcode_forward,
1243                                               intra_dc_threshold);
1244                    DEBUG1("P_VOP  Time=", dec->time);
1245                  break;                  break;
1246    
1247          case I_VOP :          case I_VOP :
                 //DEBUG1("",intra_dc_threshold);  
1248                  decoder_iframe(dec, &bs, quant, intra_dc_threshold);                  decoder_iframe(dec, &bs, quant, intra_dc_threshold);
1249                    DEBUG1("I_VOP  Time=", dec->time);
1250                  break;                  break;
1251    
1252          case B_VOP :    // ignore          case B_VOP:
1253    #ifdef BFRAMES
1254                    if (dec->time_pp > dec->time_bp) {
1255                            DEBUG1("B_VOP  Time=", dec->time);
1256                            decoder_bframe(dec, &bs, quant, fcode_forward, fcode_backward);
1257                    } else {
1258                            DEBUG("broken B-frame!");
1259                    }
1260    #endif
1261                  break;                  break;
1262    
1263          case N_VOP :    // vop not coded          case N_VOP :    // vop not coded
# Line 578  Line 1269 
1269    
1270          frame->length = BitstreamPos(&bs) / 8;          frame->length = BitstreamPos(&bs) / 8;
1271    
1272          start_timer();  #ifdef BFRAMES
1273            // test if no B_VOP
1274            if (dec->low_delay) {
1275    #endif
1276          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,          image_output(&dec->cur, dec->width, dec->height, dec->edged_width,
1277                                  frame->image, frame->stride, frame->colorspace);                                  frame->image, frame->stride, frame->colorspace);
1278    #ifdef BFRAMES
1279            } else {
1280                    if (dec->frames >= 1) {
1281                            start_timer();
1282                            if ((vop_type == I_VOP || vop_type == P_VOP)) {
1283                                    image_output(&dec->refn[0], dec->width, dec->height,
1284                                                             dec->edged_width, frame->image, frame->stride,
1285                                                             frame->colorspace);
1286                            } else if (vop_type == B_VOP) {
1287                                    image_output(&dec->cur, dec->width, dec->height,
1288                                                             dec->edged_width, frame->image, frame->stride,
1289                                                             frame->colorspace);
1290                            }
1291          stop_conv_timer();          stop_conv_timer();
1292                    }
1293            }
1294    #endif
1295    
1296            if (vop_type == I_VOP || vop_type == P_VOP) {
1297                    image_swap(&dec->refn[0], &dec->refn[1]);
1298                    image_swap(&dec->cur, &dec->refn[0]);
1299                    // swap MACROBLOCK
1300                    if (dec->low_delay && vop_type == P_VOP)
1301                            mb_swap(&dec->mbs, &dec->last_mbs);
1302            }
1303    
1304          emms();          emms();
1305    

Legend:
Removed from v.1.2  
changed lines
  Added in v.1.20

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4