[cvs] / xvidcore / src / encoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/encoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.95.2.30, Fri Jun 13 12:11:27 2003 UTC revision 1.135.2.6, Thu Apr 7 19:07:36 2011 UTC
# Line 3  Line 3 
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  - Encoder main module -   *  - Encoder main module -
5   *   *
6   *  Copyright(C) 2002      Michael Militzer <isibaar@xvid.org>   *  Copyright(C) 2002-2010 Michael Militzer <isibaar@xvid.org>
7   *               2002-2003 Peter Ross <pross@xvid.org>   *               2002-2003 Peter Ross <pross@xvid.org>
8   *               2002      Daniel Smith <danielsmith@astroboymail.com>   *               2002      Daniel Smith <danielsmith@astroboymail.com>
9   *   *
# Line 38  Line 38 
38  #include "image/font.h"  #include "image/font.h"
39  #include "motion/sad.h"  #include "motion/sad.h"
40  #include "motion/motion.h"  #include "motion/motion.h"
41    #include "motion/gmc.h"
42    
43  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
44  #include "utils/mbfunctions.h"  #include "utils/mbfunctions.h"
45  #include "bitstream/bitstream.h"  #include "bitstream/bitstream.h"
# Line 47  Line 49 
49  #include "quant/quant_matrix.h"  #include "quant/quant_matrix.h"
50  #include "utils/mem_align.h"  #include "utils/mem_align.h"
51    
52    # include "motion/motion_smp.h"
53    
54    
55  /*****************************************************************************  /*****************************************************************************
56   * Local function prototypes   * Local function prototypes
57   ****************************************************************************/   ****************************************************************************/
# Line 55  Line 60 
60                                            Bitstream * bs);                                            Bitstream * bs);
61    
62  static int FrameCodeP(Encoder * pEnc,  static int FrameCodeP(Encoder * pEnc,
63                                            Bitstream * bs,                                            Bitstream * bs);
                                           bool force_inter,  
                                           bool vol_header);  
64    
65  static void FrameCodeB(Encoder * pEnc,  static void FrameCodeB(Encoder * pEnc,
66                                             FRAMEINFO * frame,                                             FRAMEINFO * frame,
# Line 85  Line 88 
88  /*  /*
89   * Simplify the "fincr/fbase" fraction   * Simplify the "fincr/fbase" fraction
90  */  */
91    static int
92    gcd(int a, int b)
93    {
94            int r ;
95    
96            if (b > a) {
97                    r = a;
98                    a = b;
99                    b = r;
100            }
101    
102            while ((r = a % b)) {
103                    a = b;
104                    b = r;
105            }
106            return b;
107    }
108    
109  static void  static void
110  simplify_time(int *inc, int *base)  simplify_time(int *inc, int *base)
111  {  {
112          /* common factor */          /* common factor */
113          int i = *inc;          const int s = gcd(*inc, *base);
114          while (i > 1) {    *inc  /= s;
115                  if (*inc % i == 0 && *base % i == 0) {    *base /= s;
116                          *inc /= i;  
117                          *base /= i;          if (*base > 65535 || *inc > 65535) {
118                          i = *inc;                  int *biggest;
119                          continue;                  int *other;
120                  }                  float div;
121                  i--;  
122                    if (*base > *inc) {
123                            biggest = base;
124                            other = inc;
125                    } else {
126                            biggest = inc;
127                            other = base;
128          }          }
129    
130          /* if neccessary, round to 65535 accuracy */                  div = ((float)*biggest)/((float)65535);
131          if (*base > 65535) {                  *biggest = (unsigned int)(((float)*biggest)/div);
132                  float div = (float) *base / 65535;                  *other = (unsigned int)(((float)*other)/div);
                 *base = (int) (*base / div);  
                 *inc = (int) (*inc / div);  
133          }          }
134  }  }
135    
# Line 115  Line 140 
140          Encoder *pEnc;          Encoder *pEnc;
141      int n;      int n;
142    
143          if (XVID_MAJOR(create->version) != 1)   /* v1.x.x */          if (XVID_VERSION_MAJOR(create->version) != 1) /* v1.x.x */
144                  return XVID_ERR_VERSION;                  return XVID_ERR_VERSION;
145    
146          if (create->width%2 || create->height%2)          if (create->width%2 || create->height%2)
147                  return XVID_ERR_FAIL;                  return XVID_ERR_FAIL;
148    
149            if (create->width<=0 || create->height<=0)
150                    return XVID_ERR_FAIL;
151    
152          /* allocate encoder struct */          /* allocate encoder struct */
153    
154          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);
# Line 132  Line 160 
160    
161          /* global flags */          /* global flags */
162      pEnc->mbParam.global_flags = create->global;      pEnc->mbParam.global_flags = create->global;
163      if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED))
164        pEnc->mbParam.global_flags |= XVID_GLOBAL_DIVX5_USERDATA;
165    
166      /* width, height */      /* width, height */
167          pEnc->mbParam.width = create->width;          pEnc->mbParam.width = create->width;
# Line 145  Line 175 
175      pEnc->mbParam.fincr = MAX(create->fincr, 0);      pEnc->mbParam.fincr = MAX(create->fincr, 0);
176          pEnc->mbParam.fbase = create->fincr <= 0 ? 25 : create->fbase;          pEnc->mbParam.fbase = create->fincr <= 0 ? 25 : create->fbase;
177      if (pEnc->mbParam.fincr>0)      if (pEnc->mbParam.fincr>0)
178              simplify_time(&pEnc->mbParam.fincr, &pEnc->mbParam.fbase);                  simplify_time((int*)&pEnc->mbParam.fincr, (int*)&pEnc->mbParam.fbase);
179    
180      /* zones */      /* zones */
181      if(create->num_zones > 0) {      if(create->num_zones > 0) {
# Line 176  Line 206 
206    
207          memset(&pinfo, 0, sizeof(xvid_plg_info_t));          memset(&pinfo, 0, sizeof(xvid_plg_info_t));
208          pinfo.version = XVID_VERSION;          pinfo.version = XVID_VERSION;
209          if (create->plugins[n].func(0, XVID_PLG_INFO, &pinfo, 0) >= 0) {                  if (create->plugins[n].func(NULL, XVID_PLG_INFO, &pinfo, NULL) >= 0) {
210              pEnc->mbParam.plugin_flags |= pinfo.flags;              pEnc->mbParam.plugin_flags |= pinfo.flags;
211          }          }
212    
# Line 186  Line 216 
216          pcreate.zones = pEnc->zones;          pcreate.zones = pEnc->zones;
217          pcreate.width = pEnc->mbParam.width;          pcreate.width = pEnc->mbParam.width;
218          pcreate.height = pEnc->mbParam.height;          pcreate.height = pEnc->mbParam.height;
219                    pcreate.mb_width = pEnc->mbParam.mb_width;
220                    pcreate.mb_height = pEnc->mbParam.mb_height;
221          pcreate.fincr = pEnc->mbParam.fincr;          pcreate.fincr = pEnc->mbParam.fincr;
222          pcreate.fbase = pEnc->mbParam.fbase;          pcreate.fbase = pEnc->mbParam.fbase;
223          pcreate.param = create->plugins[n].param;          pcreate.param = create->plugins[n].param;
224    
225          pEnc->plugins[n].func = NULL;   /* disable plugins that fail */          pEnc->plugins[n].func = NULL;   /* disable plugins that fail */
226          if (create->plugins[n].func(0, XVID_PLG_CREATE, &pcreate, &pEnc->plugins[n].param) >= 0) {                  if (create->plugins[n].func(NULL, XVID_PLG_CREATE, &pcreate, &pEnc->plugins[n].param) >= 0) {
227              pEnc->plugins[n].func = create->plugins[n].func;              pEnc->plugins[n].func = create->plugins[n].func;
228          }          }
229      }      }
# Line 209  Line 241 
241              goto xvid_err_memory1a;              goto xvid_err_memory1a;
242      }      }
243    
244            /* temp lambdas */
245            if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
246                    pEnc->temp_lambda = (float *) xvid_malloc(pEnc->mbParam.mb_width *
247                                                    pEnc->mbParam.mb_height * 6 * sizeof(float), CACHE_LINE);
248                    if (pEnc->temp_lambda == NULL)
249                            goto xvid_err_memory1a;
250            }
251    
252          /* bframes */          /* bframes */
253          pEnc->mbParam.max_bframes = MAX(create->max_bframes, 0);          pEnc->mbParam.max_bframes = MAX(create->max_bframes, 0);
254          pEnc->mbParam.bquant_ratio = MAX(create->bquant_ratio, 0);          pEnc->mbParam.bquant_ratio = MAX(create->bquant_ratio, 0);
# Line 224  Line 264 
264          pEnc->mbParam.frame_drop_ratio = MAX(create->frame_drop_ratio, 0);          pEnc->mbParam.frame_drop_ratio = MAX(create->frame_drop_ratio, 0);
265    
266      /* max keyframe interval */      /* max keyframe interval */
267      pEnc->mbParam.iMaxKeyInterval = create->max_key_interval <= 0 ?          pEnc->mbParam.iMaxKeyInterval = create->max_key_interval <= 0 ? (10 * (int)pEnc->mbParam.fbase) / (int)pEnc->mbParam.fincr : create->max_key_interval;
                 (10 * pEnc->mbParam.fbase) / pEnc->mbParam.fincr : create->max_key_interval;  
268    
269      /* allocate working frame-image memory */      /* allocate working frame-image memory */
270    
# Line 247  Line 286 
286          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)
287                  goto xvid_err_memory2;                  goto xvid_err_memory2;
288    
289            /* allocate quant matrix memory */
290    
291            pEnc->mbParam.mpeg_quant_matrices =
292                    xvid_malloc(sizeof(uint16_t) * 64 * 8, CACHE_LINE);
293    
294            if (pEnc->mbParam.mpeg_quant_matrices == NULL)
295                    goto xvid_err_memory2a;
296    
297          /* allocate interpolation image memory */          /* allocate interpolation image memory */
298    
299      if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {      if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
# Line 262  Line 309 
309          image_null(&pEnc->reference->image);          image_null(&pEnc->reference->image);
310          image_null(&pEnc->vInterH);          image_null(&pEnc->vInterH);
311          image_null(&pEnc->vInterV);          image_null(&pEnc->vInterV);
         image_null(&pEnc->vInterVf);  
312          image_null(&pEnc->vInterHV);          image_null(&pEnc->vInterHV);
         image_null(&pEnc->vInterHVf);  
313    
314          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
315          if (image_create          if (image_create
# Line 308  Line 353 
353                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
354                  goto xvid_err_memory3;                  goto xvid_err_memory3;
355          if (image_create          if (image_create
                 (&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                  pEnc->mbParam.edged_height) < 0)  
                 goto xvid_err_memory3;  
         if (image_create  
356                  (&pEnc->vInterHV, pEnc->mbParam.edged_width,                  (&pEnc->vInterHV, pEnc->mbParam.edged_width,
357                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
358                  goto xvid_err_memory3;                  goto xvid_err_memory3;
         if (image_create  
                 (&pEnc->vInterHVf, pEnc->mbParam.edged_width,  
                  pEnc->mbParam.edged_height) < 0)  
                 goto xvid_err_memory3;  
359    
360  /* Create full bitplane for GMC, this might be wasteful */  /* Create full bitplane for GMC, this might be wasteful */
361          if (image_create          if (image_create
# Line 388  Line 425 
425                  image_null(&pEnc->queue[n].image);                  image_null(&pEnc->queue[n].image);
426    
427    
428          for (n = 0; n < pEnc->mbParam.max_bframes+1; n++)          for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
         {  
429                  if (image_create                  if (image_create
430                          (&pEnc->queue[n].image, pEnc->mbParam.edged_width,                          (&pEnc->queue[n].image, pEnc->mbParam.edged_width,
431                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
432                          goto xvid_err_memory5;                          goto xvid_err_memory5;
   
433          }          }
434    
   
435          /* timestamp stuff */          /* timestamp stuff */
436    
437          pEnc->mbParam.m_stamp = 0;          pEnc->mbParam.m_stamp = 0;
438          pEnc->m_framenum = 0;          pEnc->m_framenum = create->start_frame_num;
439          pEnc->current->stamp = 0;          pEnc->current->stamp = 0;
440          pEnc->reference->stamp = 0;          pEnc->reference->stamp = 0;
441    
# Line 410  Line 444 
444          pEnc->iFrameNum = 0;          pEnc->iFrameNum = 0;
445          pEnc->fMvPrevSigma = -1;          pEnc->fMvPrevSigma = -1;
446    
447            /* slices */
448            pEnc->num_slices = MIN(MAX(1, create->num_slices), (int) pEnc->mbParam.mb_height);
449    
450            /* multithreaded stuff */
451            if (create->num_threads > 0) {
452    #ifndef HAVE_PTHREAD
453                    int t = MAX(1, create->num_threads);
454    #else
455                    int t = MIN(create->num_threads, (int) (pEnc->mbParam.mb_height>>1)); /* at least two rows per thread */
456    #endif
457                    int threads_per_slice = MAX(1, (t / pEnc->num_slices));
458                    int rows_per_thread = (pEnc->mbParam.mb_height + threads_per_slice - 1) / threads_per_slice;
459    
460                    pEnc->num_threads = t;
461                    pEnc->smpData = xvid_malloc(t*sizeof(SMPData), CACHE_LINE);
462                    if (!pEnc->smpData)
463                            goto xvid_err_nosmp;
464    
465                    /* tmp bitstream buffer for slice coding */
466                    pEnc->smpData[0].tmp_buffer = xvid_malloc(16*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height*sizeof(uint8_t), CACHE_LINE);
467                    if (! pEnc->smpData[0].tmp_buffer) goto xvid_err_nosmp;
468    
469                    for (n = 0; n < t; n++) {
470                            int s = MIN(pEnc->num_threads, pEnc->num_slices);
471    
472                            pEnc->smpData[n].complete_count_self =
473                                    xvid_malloc(rows_per_thread * sizeof(int), CACHE_LINE);
474    
475                            if (!pEnc->smpData[n].complete_count_self)
476                                    goto xvid_err_nosmp;
477    
478                            if (n > 0 && n < s) {
479                                    pEnc->smpData[n].bs = (Bitstream *) xvid_malloc(sizeof(Bitstream), CACHE_LINE);
480                                    if (!pEnc->smpData[n].bs)
481                                            goto xvid_err_nosmp;
482    
483                                    pEnc->smpData[n].sStat = (Statistics *) xvid_malloc(sizeof(Statistics), CACHE_LINE);
484                                    if (!pEnc->smpData[n].sStat)
485                                            goto xvid_err_nosmp;
486    
487                                    pEnc->smpData[n].tmp_buffer = pEnc->smpData[0].tmp_buffer + 16*(((n-1)*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height)/s);
488                                    BitstreamInit(pEnc->smpData[n].bs, pEnc->smpData[n].tmp_buffer, 0);
489                            }
490    
491                            if (n != 0)
492                                    pEnc->smpData[n].complete_count_above =
493                                            pEnc->smpData[n-1].complete_count_self;
494                    }
495                    pEnc->smpData[0].complete_count_above =
496                            pEnc->smpData[t-1].complete_count_self - 1;
497    
498            } else {
499      xvid_err_nosmp:
500                    /* no SMP */
501                    if (pEnc->smpData) {
502                            if (pEnc->smpData[0].tmp_buffer)
503                                    xvid_free(pEnc->smpData[0].tmp_buffer);
504                    }
505                    else {
506                            pEnc->smpData = xvid_malloc(1*sizeof(SMPData), CACHE_LINE);
507                            if (pEnc->smpData == NULL)
508                                    goto xvid_err_memory5;
509                    }
510    
511                    create->num_threads = 0;
512            }
513    
514      create->handle = (void *) pEnc;      create->handle = (void *) pEnc;
515    
516          init_timer();          init_timer();
517            init_mpeg_matrix(pEnc->mbParam.mpeg_quant_matrices);
518    
519      return 0;   /* ok */      return 0;   /* ok */
520    
# Line 422  Line 524 
524    
525    xvid_err_memory5:    xvid_err_memory5:
526    
527          if (pEnc->mbParam.max_bframes > 0) {          for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
528          int i;                          image_destroy(&pEnc->queue[n].image, pEnc->mbParam.edged_width,
   
                 for (i = 0; i < pEnc->mbParam.max_bframes+1; i++) {  
                         image_destroy(&pEnc->queue[i].image, pEnc->mbParam.edged_width,  
529                                                    pEnc->mbParam.edged_height);                                                    pEnc->mbParam.edged_height);
530                  }                  }
531    
532                  xvid_free(pEnc->queue);                  xvid_free(pEnc->queue);
         }  
533    
534    xvid_err_memory4:    xvid_err_memory4:
535    
# Line 444  Line 543 
543    
544                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
545                                                    pEnc->mbParam.edged_height);                                                    pEnc->mbParam.edged_height);
   
546                          xvid_free(pEnc->bframes[i]->mbs);                          xvid_free(pEnc->bframes[i]->mbs);
   
547                          xvid_free(pEnc->bframes[i]);                          xvid_free(pEnc->bframes[i]);
   
548                  }                  }
549    
550                  xvid_free(pEnc->bframes);                  xvid_free(pEnc->bframes);
# Line 478  Line 574 
574                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
575          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
576                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
577          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
578                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
579    
580  /* destroy GMC image */  /* destroy GMC image */
581          image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
582                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
583    
584      xvid_err_memory2a:
585            xvid_free(pEnc->mbParam.mpeg_quant_matrices);
586    
587    xvid_err_memory2:    xvid_err_memory2:
588          xvid_free(pEnc->current->mbs);          xvid_free(pEnc->current->mbs);
# Line 503  Line 597 
597              xvid_free(pEnc->temp_dquants);              xvid_free(pEnc->temp_dquants);
598      }      }
599    
600            if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
601                    xvid_free(pEnc->temp_lambda);
602            }
603    
604    xvid_err_memory0:    xvid_err_memory0:
605      for (n=0; n<pEnc->num_plugins;n++) {      for (n=0; n<pEnc->num_plugins;n++) {
606          if (pEnc->plugins[n].func) {          if (pEnc->plugins[n].func) {
607              pEnc->plugins[n].func(pEnc->plugins[n].param, XVID_PLG_DESTROY, 0, 0);                          pEnc->plugins[n].func(pEnc->plugins[n].param, XVID_PLG_DESTROY, NULL, NULL);
608          }          }
609      }      }
610      xvid_free(pEnc->plugins);      xvid_free(pEnc->plugins);
# Line 537  Line 635 
635          int i;          int i;
636    
637          /* B Frames specific */          /* B Frames specific */
         if (pEnc->mbParam.max_bframes > 0) {  
   
638                  for (i = 0; i < pEnc->mbParam.max_bframes+1; i++) {                  for (i = 0; i < pEnc->mbParam.max_bframes+1; i++) {
   
639                          image_destroy(&pEnc->queue[i].image, pEnc->mbParam.edged_width,                          image_destroy(&pEnc->queue[i].image, pEnc->mbParam.edged_width,
640                                            pEnc->mbParam.edged_height);                                            pEnc->mbParam.edged_height);
641                  }                  }
                 xvid_free(pEnc->queue);  
         }  
642    
643            xvid_free(pEnc->queue);
644    
645          if (pEnc->mbParam.max_bframes > 0) {          if (pEnc->mbParam.max_bframes > 0) {
646    
# Line 557  Line 651 
651    
652                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
653                                            pEnc->mbParam.edged_height);                                            pEnc->mbParam.edged_height);
   
654                          xvid_free(pEnc->bframes[i]->mbs);                          xvid_free(pEnc->bframes[i]->mbs);
   
655                          xvid_free(pEnc->bframes[i]);                          xvid_free(pEnc->bframes[i]);
656                  }                  }
657    
# Line 577  Line 669 
669                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
670          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
671                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
672          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
673                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
   
674          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
675                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
676          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
# Line 612  Line 699 
699          xvid_free(pEnc->temp_dquants);          xvid_free(pEnc->temp_dquants);
700      }      }
701    
702            if ((pEnc->mbParam.plugin_flags & XVID_REQLAMBDA)) {
703                    xvid_free(pEnc->temp_lambda);
704            }
705    
706      if (pEnc->num_plugins>0) {      if (pEnc->num_plugins>0) {
707          xvid_plg_destroy_t pdestroy;          xvid_plg_destroy_t pdestroy;
# Line 622  Line 712 
712    
713          for (i=0; i<pEnc->num_plugins;i++) {          for (i=0; i<pEnc->num_plugins;i++) {
714              if (pEnc->plugins[i].func) {              if (pEnc->plugins[i].func) {
715                  pEnc->plugins[i].func(pEnc->plugins[i].param, XVID_PLG_DESTROY, &pdestroy, 0);                                  pEnc->plugins[i].func(pEnc->plugins[i].param, XVID_PLG_DESTROY, &pdestroy, NULL);
716              }              }
717          }          }
718          xvid_free(pEnc->plugins);          xvid_free(pEnc->plugins);
719      }      }
720    
721      if (pEnc->num_plugins>0)          xvid_free(pEnc->mbParam.mpeg_quant_matrices);
722    
723            if (pEnc->num_zones > 0)
724          xvid_free(pEnc->zones);          xvid_free(pEnc->zones);
725    
726            if (pEnc->num_threads > 0) {
727                    for (i = 1; i < MAX(1, MIN(pEnc->num_threads, pEnc->num_slices)); i++) {
728                            xvid_free(pEnc->smpData[i].bs);
729                            xvid_free(pEnc->smpData[i].sStat);
730                    }
731                    if (pEnc->smpData[0].tmp_buffer) xvid_free(pEnc->smpData[0].tmp_buffer);
732    
733                    for (i = 0; i < pEnc->num_threads; i++)
734                            xvid_free(pEnc->smpData[i].complete_count_self);
735            }
736            xvid_free(pEnc->smpData);
737    
738          xvid_free(pEnc);          xvid_free(pEnc);
739    
740          return 0;  /* ok */          return 0;  /* ok */
# Line 644  Line 748 
748  static void call_plugins(Encoder * pEnc, FRAMEINFO * frame, IMAGE * original,  static void call_plugins(Encoder * pEnc, FRAMEINFO * frame, IMAGE * original,
749                           int opt, int * type, int * quant, xvid_enc_stats_t * stats)                           int opt, int * type, int * quant, xvid_enc_stats_t * stats)
750  {  {
751      unsigned int i, j;          unsigned int i, j, k;
752      xvid_plg_data_t data;      xvid_plg_data_t data;
753    
754      /* set data struct */      /* set data struct */
# Line 662  Line 766 
766      data.mb_height = pEnc->mbParam.mb_height;      data.mb_height = pEnc->mbParam.mb_height;
767      data.fincr = frame->fincr;      data.fincr = frame->fincr;
768      data.fbase = pEnc->mbParam.fbase;      data.fbase = pEnc->mbParam.fbase;
769            data.bquant_ratio = pEnc->mbParam.bquant_ratio;
770            data.bquant_offset = pEnc->mbParam.bquant_offset;
771    
772      for (i=0; i<3; i++) {      for (i=0; i<3; i++) {
773          data.min_quant[i] = pEnc->mbParam.min_quant[i];          data.min_quant[i] = pEnc->mbParam.min_quant[i];
774          data.max_quant[i] = pEnc->mbParam.max_quant[i];          data.max_quant[i] = pEnc->mbParam.max_quant[i];
775      }      }
776    
777      data.reference.csp = XVID_CSP_USER;          data.reference.csp = XVID_CSP_PLANAR;
778      data.reference.plane[0] = pEnc->reference->image.y;      data.reference.plane[0] = pEnc->reference->image.y;
779      data.reference.plane[1] = pEnc->reference->image.u;      data.reference.plane[1] = pEnc->reference->image.u;
780      data.reference.plane[2] = pEnc->reference->image.v;      data.reference.plane[2] = pEnc->reference->image.v;
# Line 676  Line 782 
782      data.reference.stride[1] = pEnc->mbParam.edged_width/2;      data.reference.stride[1] = pEnc->mbParam.edged_width/2;
783      data.reference.stride[2] = pEnc->mbParam.edged_width/2;      data.reference.stride[2] = pEnc->mbParam.edged_width/2;
784    
785      data.current.csp = XVID_CSP_USER;          data.current.csp = XVID_CSP_PLANAR;
786      data.current.plane[0] = frame->image.y;      data.current.plane[0] = frame->image.y;
787      data.current.plane[1] = frame->image.u;      data.current.plane[1] = frame->image.u;
788      data.current.plane[2] = frame->image.v;      data.current.plane[2] = frame->image.v;
# Line 690  Line 796 
796          data.type = *type;          data.type = *type;
797          data.quant = *quant;          data.quant = *quant;
798    
799                    data.vol_flags = frame->vol_flags;
800                    data.vop_flags = frame->vop_flags;
801                    data.motion_flags = frame->motion_flags;
802    
803            } else if (opt == XVID_PLG_FRAME) {
804                    data.type = coding2type(frame->coding_type);
805                    data.quant = frame->quant;
806    
807                  if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {                  if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
808              data.dquant = pEnc->temp_dquants;              data.dquant = pEnc->temp_dquants;
809              data.dquant_stride = pEnc->mbParam.mb_width;              data.dquant_stride = pEnc->mbParam.mb_width;
810                          memset(data.dquant, 0, data.mb_width*data.mb_height);                          memset(data.dquant, 0, data.mb_width*data.mb_height*sizeof(int));
811          }          }
812    
813          data.vol_flags = frame->vol_flags;                  if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
814          data.vop_flags = frame->vop_flags;                          int block = 0;
815          data.motion_flags = frame->motion_flags;                          emms();
816                            data.lambda = pEnc->temp_lambda;
817                            for(i = 0;i < pEnc->mbParam.mb_height; i++)
818                                    for(j = 0;j < pEnc->mbParam.mb_width; j++)
819                                            for (k = 0; k < 6; k++)
820                                                    data.lambda[block++] = 1.0f;
821                    }
822    
823      } else { /* XVID_PLG_AFTER */      } else { /* XVID_PLG_AFTER */
824          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
825              data.original.csp = XVID_CSP_USER;                          data.original.csp = XVID_CSP_PLANAR;
826              data.original.plane[0] = original->y;              data.original.plane[0] = original->y;
827              data.original.plane[1] = original->u;              data.original.plane[1] = original->u;
828              data.original.plane[2] = original->v;              data.original.plane[2] = original->v;
# Line 739  Line 859 
859    
860              for (j=0; j<pEnc->mbParam.mb_height; j++)              for (j=0; j<pEnc->mbParam.mb_height; j++)
861              for (i=0; i<pEnc->mbParam.mb_width; i++) {              for (i=0; i<pEnc->mbParam.mb_width; i++) {
862                  data.dquant[j*data.dquant_stride + i] = frame->mbs[j*pEnc->mbParam.mb_width + i].dquant;;                                  data.dquant[j*data.dquant_stride + i] = frame->mbs[j*pEnc->mbParam.mb_width + i].dquant;
863              }              }
864          }          }
865    
# Line 752  Line 872 
872          data.mblks = frame->sStat.mblks;          data.mblks = frame->sStat.mblks;
873          data.ublks = frame->sStat.ublks;          data.ublks = frame->sStat.ublks;
874    
875          if (stats) {                  /* New code */
876                  stats->type = coding2type(frame->coding_type);                  data.stats.type      = coding2type(frame->coding_type);
877                  stats->quant = frame->quant;                  data.stats.quant     = frame->quant;
878                  stats->vol_flags = frame->vol_flags;                  data.stats.vol_flags = frame->vol_flags;
879                  stats->vop_flags = frame->vop_flags;                  data.stats.vop_flags = frame->vop_flags;
880                  stats->length = frame->length;                  data.stats.length    = frame->length;
881                  stats->hlength = frame->length - (frame->sStat.iTextBits / 8);                  data.stats.hlength   = frame->length - (frame->sStat.iTextBits / 8);
882                  stats->kblks = frame->sStat.kblks;                  data.stats.kblks     = frame->sStat.kblks;
883                  stats->mblks = frame->sStat.mblks;                  data.stats.mblks     = frame->sStat.mblks;
884                  stats->ublks = frame->sStat.ublks;                  data.stats.ublks     = frame->sStat.ublks;
885              stats->sse_y = data.sse_y;                  data.stats.sse_y     = data.sse_y;
886              stats->sse_u = data.sse_u;                  data.stats.sse_u     = data.sse_u;
887              stats->sse_v = data.sse_v;                  data.stats.sse_v     = data.sse_v;
888          }  
889                    if (stats)
890                            *stats = data.stats;
891      }      }
892    
893      /* call plugins */      /* call plugins */
894      for (i=0; i<pEnc->num_plugins;i++) {          for (i=0; i<(unsigned int)pEnc->num_plugins;i++) {
895          emms();          emms();
896          if (pEnc->plugins[i].func) {          if (pEnc->plugins[i].func) {
897              if (pEnc->plugins[i].func(pEnc->plugins[i].param, opt, &data, 0) < 0) {                          if (pEnc->plugins[i].func(pEnc->plugins[i].param, opt, &data, NULL) < 0) {
898                  continue;                  continue;
899              }              }
900          }          }
# Line 784  Line 906 
906          *type = data.type;          *type = data.type;
907          *quant = data.quant > 0 ? data.quant : 2;   /* default */          *quant = data.quant > 0 ? data.quant : 2;   /* default */
908    
909                    frame->vol_flags = data.vol_flags;
910                    frame->vop_flags = data.vop_flags;
911                    frame->motion_flags = data.motion_flags;
912    
913            } else if (opt == XVID_PLG_FRAME) {
914    
915          if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {          if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
916              for (j=0; j<pEnc->mbParam.mb_height; j++)              for (j=0; j<pEnc->mbParam.mb_height; j++)
917              for (i=0; i<pEnc->mbParam.mb_width; i++) {              for (i=0; i<pEnc->mbParam.mb_width; i++) {
# Line 796  Line 924 
924              }              }
925          }          }
926    
927          frame->vol_flags = data.vol_flags;                  if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
928          frame->vop_flags = data.vop_flags;                          for (j = 0; j < pEnc->mbParam.mb_height; j++)
929          frame->motion_flags = data.motion_flags;                                  for (i = 0; i < pEnc->mbParam.mb_width; i++)
930                                            for (k = 0; k < 6; k++) {
931                                                    frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] =
932                                                            (int) ((float)(1<<LAMBDA_EXP) * data.lambda[6 * (j * data.mb_width + i) + k]);
933                                            }
934                    } else {
935                            for (j = 0; j<pEnc->mbParam.mb_height; j++)
936                                    for (i = 0; i<pEnc->mbParam.mb_width; i++)
937                                            for (k = 0; k < 6; k++) {
938                                                    frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] = 1<<LAMBDA_EXP;
939                                            }
940      }      }
941    
942    
943                    frame->mbs[0].quant = data.quant; /* FRAME will not affect the quant in stats */
944  }  }
945    
946    
947    }
948    
949    
950  static __inline void inc_frame_num(Encoder * pEnc)  static __inline void inc_frame_num(Encoder * pEnc)
# Line 820  Line 962 
962      pEnc->m_framenum--; /* debug ticker */      pEnc->m_framenum--; /* debug ticker */
963  }  }
964    
965    static __inline void
966    MBSetDquant(MACROBLOCK * pMB, int x, int y, MBParam * mbParam)
967    {
968            if (pMB->cbp == 0) {
969                    /* we want to code dquant but the quantizer value will not be used yet
970                            let's find out if we can postpone dquant to next MB
971                    */
972                    if (x == mbParam->mb_width-1 && y == mbParam->mb_height-1) {
973                            pMB->dquant = 0; /* it's the last MB of all, the easiest case */
974                            return;
975                    } else {
976                            MACROBLOCK * next = pMB + 1;
977                            const MACROBLOCK * prev = pMB - 1;
978                            if (next->mode != MODE_INTER4V && next->mode != MODE_NOT_CODED)
979                                    /* mode allows dquant change in the future */
980                                    if (abs(next->quant - prev->quant) <= 2) {
981                                            /* quant change is not out of range */
982                                            pMB->quant = prev->quant;
983                                            pMB->dquant = 0;
984                                            next->dquant = next->quant - prev->quant;
985                                            return;
986                                    }
987                    }
988            }
989            /* couldn't skip this dquant */
990            pMB->mode = MODE_INTER_Q;
991    }
992    
993    
994    
995  static __inline void  static __inline void
# Line 829  Line 999 
999      pCur->ticks = (int32_t)pCur->stamp % time_base;      pCur->ticks = (int32_t)pCur->stamp % time_base;
1000                  pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;                  pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;
1001    
1002                  /* HEAVY DEBUG OUTPUT remove when timecodes prove to be stable */  #if 0   /* HEAVY DEBUG OUTPUT */
1003            fprintf(stderr,"WriteVop:   %d - %d \n",
 /*              fprintf(stderr,"WriteVop:   %d - %d \n",  
1004                          ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));                          ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));
1005                  fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",                  fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",
1006                          pCur->coding_type, pCur->stamp, pRef->stamp, time_base);                          pCur->coding_type, pCur->stamp, pRef->stamp, time_base);
1007                  fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",                  fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",
1008                          pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);                          pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);
1009    #endif
1010    }
1011    
1012  */  static void
1013    simplify_par(int *par_width, int *par_height)
1014    {
1015    
1016            int _par_width  = (!*par_width)  ? 1 : (*par_width<0)  ? -*par_width:  *par_width;
1017            int _par_height = (!*par_height) ? 1 : (*par_height<0) ? -*par_height: *par_height;
1018            int divisor = gcd(_par_width, _par_height);
1019    
1020            _par_width  /= divisor;
1021            _par_height /= divisor;
1022    
1023            /* 2^8 precision maximum */
1024            if (_par_width>255 || _par_height>255) {
1025                    float div;
1026                    emms();
1027                    if (_par_width>_par_height)
1028                            div = (float)_par_width/255;
1029                    else
1030                            div = (float)_par_height/255;
1031    
1032                    _par_width  = (int)((float)_par_width/div);
1033                    _par_height = (int)((float)_par_height/div);
1034  }  }
1035    
1036            *par_width = _par_width;
1037            *par_height = _par_height;
1038    
1039            return;
1040    }
1041    
1042  /*****************************************************************************  /*****************************************************************************
1043   * IPB frame encoder entry point   * IPB frame encoder entry point
# Line 865  Line 1061 
1061          int type;          int type;
1062          Bitstream bs;          Bitstream bs;
1063    
1064          if (XVID_MAJOR(xFrame->version) != 1 || (stats && XVID_MAJOR(stats->version) != 1))     /* v1.x.x */          if (XVID_VERSION_MAJOR(xFrame->version) != 1 || (stats && XVID_VERSION_MAJOR(stats->version) != 1))     /* v1.x.x */
1065                  return XVID_ERR_VERSION;                  return XVID_ERR_VERSION;
1066    
1067          xFrame->out_flags = 0;          xFrame->out_flags = 0;
# Line 902  Line 1098 
1098    
1099                  if (xFrame->quant_intra_matrix)                  if (xFrame->quant_intra_matrix)
1100                  {                  {
1101                          memcpy(q->quant_intra_matrix, xFrame->quant_intra_matrix, sizeof(xFrame->quant_intra_matrix));                          memcpy(q->quant_intra_matrix, xFrame->quant_intra_matrix, 64*sizeof(unsigned char));
1102                          q->frame.quant_intra_matrix = q->quant_intra_matrix;                          q->frame.quant_intra_matrix = q->quant_intra_matrix;
1103                  }                  }
1104    
1105                  if (xFrame->quant_inter_matrix)                  if (xFrame->quant_inter_matrix)
1106                  {                  {
1107                          memcpy(q->quant_inter_matrix, xFrame->quant_inter_matrix, sizeof(xFrame->quant_inter_matrix));                          memcpy(q->quant_inter_matrix, xFrame->quant_inter_matrix, 64*sizeof(unsigned char));
1108                          q->frame.quant_inter_matrix = q->quant_inter_matrix;                          q->frame.quant_inter_matrix = q->quant_inter_matrix;
1109                  }                  }
1110    
# Line 937  Line 1133 
1133                          }                          }
1134    
1135                          FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs);                          FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs);
1136              call_plugins(pEnc, pEnc->bframes[pEnc->bframenum_head], &pEnc->sOriginal2, XVID_PLG_AFTER, 0, 0, stats);                          call_plugins(pEnc, pEnc->bframes[pEnc->bframenum_head], &pEnc->sOriginal2, XVID_PLG_AFTER, NULL, NULL, stats);
1137                          pEnc->bframenum_head++;                          pEnc->bframenum_head++;
1138    
1139                          goto done;                          goto done;
# Line 963  Line 1159 
1159                          tmp = pEnc->current->seconds;                          tmp = pEnc->current->seconds;
1160                          pEnc->current->seconds = 0; /* force time_base = 0 */                          pEnc->current->seconds = 0; /* force time_base = 0 */
1161    
1162                          BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0);                          BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0, pEnc->current->quant);
1163                          BitstreamPad(&bs);                          BitstreamPad(&bs);
1164                          pEnc->current->seconds = tmp;                          pEnc->current->seconds = tmp;
1165    
1166                          /* add the not-coded length to the reference frame size */                          /* add the not-coded length to the reference frame size */
1167                          pEnc->current->length += (BitstreamPos(&bs) - bits) / 8;                          pEnc->current->length += (BitstreamPos(&bs) - bits) / 8;
1168              call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, 0, 0, stats);                          call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1169    
1170              /* flush complete: reset counters */              /* flush complete: reset counters */
1171                  pEnc->flush_bframes = 0;                  pEnc->flush_bframes = 0;
# Line 997  Line 1193 
1193                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1194    
1195              if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0) {              if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0) {
1196                  call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, 0, 0, stats);                                  call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1197              }              }
1198    
1199              /* if the very last frame is to be b-vop, we must change it to a p-vop */              /* if the very last frame is to be b-vop, we must change it to a p-vop */
# Line 1008  Line 1204 
1204                                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);                                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1205    
1206                                  /* convert B-VOP to P-VOP */                                  /* convert B-VOP to P-VOP */
1207                  pEnc->current->quant = ((pEnc->current->quant*100) - pEnc->mbParam.bquant_offset) / pEnc->mbParam.bquant_ratio;                                  pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1208                                    pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1209                                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1210    
1211                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1212                              image_copy(&pEnc->sOriginal, &pEnc->current->image,                              image_copy(&pEnc->sOriginal, &pEnc->current->image,
# Line 1018  Line 1216 
1216                  DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",                  DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1217                                  pEnc->bframenum_head, pEnc->bframenum_tail,                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1218                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1219                                    pEnc->mbParam.frame_drop_ratio = -1; /* it must be a coded vop */
1220    
1221                  FrameCodeP(pEnc, &bs, 1, 0);                                  FrameCodeP(pEnc, &bs);
1222    
1223    
1224                  if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail==0) {                  if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail==0) {
1225                      call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, 0, 0, stats);                                          call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1226                  }else{                  }else{
1227                      pEnc->flush_bframes = 1;                      pEnc->flush_bframes = 1;
1228                      goto done;                      goto done;
# Line 1053  Line 1252 
1252    
1253      pEnc->current->fincr = pEnc->mbParam.fincr>0 ? pEnc->mbParam.fincr : frame->fincr;      pEnc->current->fincr = pEnc->mbParam.fincr>0 ? pEnc->mbParam.fincr : frame->fincr;
1254      inc_frame_num(pEnc);      inc_frame_num(pEnc);
1255      pEnc->current->vol_flags = pEnc->mbParam.vol_flags;          pEnc->current->vol_flags = frame->vol_flags;
1256      pEnc->current->vop_flags = frame->vop_flags;      pEnc->current->vop_flags = frame->vop_flags;
1257          pEnc->current->motion_flags = frame->motion;          pEnc->current->motion_flags = frame->motion;
1258          pEnc->current->fcode = pEnc->mbParam.m_fcode;          pEnc->current->fcode = pEnc->mbParam.m_fcode;
# Line 1072  Line 1271 
1271          type = frame->type;          type = frame->type;
1272          pEnc->current->quant = frame->quant;          pEnc->current->quant = frame->quant;
1273    
1274      call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_BEFORE, &type, &pEnc->current->quant, stats);          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_BEFORE, &type, (int*)&pEnc->current->quant, stats);
1275    
1276      if (type > 0){      /* XVID_TYPE_?VOP */      if (type > 0){      /* XVID_TYPE_?VOP */
1277                  type = type2coding(type);       /* convert XVID_TYPE_?VOP to bitstream coding type */                  type = type2coding(type);       /* convert XVID_TYPE_?VOP to bitstream coding type */
# Line 1083  Line 1282 
1282                  }else{                  }else{
1283                          type = MEanalysis(&pEnc->reference->image, pEnc->current,                          type = MEanalysis(&pEnc->reference->image, pEnc->current,
1284                                          &pEnc->mbParam, pEnc->mbParam.iMaxKeyInterval,                                          &pEnc->mbParam, pEnc->mbParam.iMaxKeyInterval,
1285                                          pEnc->iFrameNum, pEnc->bframenum_tail, xFrame->bframe_threshold);                                                            pEnc->iFrameNum, pEnc->bframenum_tail, xFrame->bframe_threshold,
1286                                                              (pEnc->bframes) ? pEnc->bframes[pEnc->bframenum_head]->mbs: NULL);
1287                  }                  }
1288          }          }
1289    
1290            if (type != I_VOP)
1291                    pEnc->current->vol_flags = pEnc->mbParam.vol_flags; /* don't allow VOL changes here */
1292    
1293      /* bframes buffer overflow check */      /* bframes buffer overflow check */
1294      if (type == B_VOP && pEnc->bframenum_tail >= pEnc->mbParam.max_bframes) {      if (type == B_VOP && pEnc->bframenum_tail >= pEnc->mbParam.max_bframes) {
1295          type = P_VOP;          type = P_VOP;
# Line 1096  Line 1299 
1299    
1300          if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {          if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1301                  image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,                  image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,
1302                          "%i  st:%i  if:%i", pEnc->current->frame_num, pEnc->current->stamp, pEnc->iFrameNum);                          "%d  st:%lld  if:%d", pEnc->current->frame_num, pEnc->current->stamp, pEnc->iFrameNum);
1303          }          }
1304    
1305          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
# Line 1143  Line 1346 
1346      if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0)      if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0)
1347      {      {
1348          if (pEnc->current->stamp > 0) {          if (pEnc->current->stamp > 0) {
1349              call_plugins(pEnc, pEnc->reference, &pEnc->sOriginal, XVID_PLG_AFTER, 0, 0, stats);                          call_plugins(pEnc, pEnc->reference, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1350          }          }
1351                  else          else if (stats) {
1352                          stats->type = XVID_TYPE_NOTHING;                          stats->type = XVID_TYPE_NOTHING;
1353      }      }
1354            }
1355    
1356          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1357           * closed-gop           * closed-gop
# Line 1171  Line 1375 
1375                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1376    
1377                  if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {                  if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1378                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "DX50 BVOP->PVOP");                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "CLOSED GOP BVOP->PVOP");
1379                  }                  }
1380    
1381                  /* convert B-VOP quant to P-VOP */                  /* convert B-VOP quant to P-VOP */
1382                  pEnc->current->quant = ((pEnc->current->quant*100) - pEnc->mbParam.bquant_offset) / pEnc->mbParam.bquant_ratio;                  pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1383                    pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1384                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1385          type = P_VOP;          type = P_VOP;
1386      }      }
1387    
# Line 1194  Line 1400 
1400                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");
1401                  }                  }
1402    
1403                    pEnc->iFrameNum = 1;
1404    
1405                  /* ---- update vol flags at IVOP ----------- */                  /* ---- update vol flags at IVOP ----------- */
1406                  pEnc->current->vol_flags = pEnc->mbParam.vol_flags = frame->vol_flags;                  pEnc->mbParam.vol_flags = pEnc->current->vol_flags;
1407    
1408                    /* Aspect ratio */
1409                    switch(frame->par) {
1410                    case XVID_PAR_11_VGA:
1411                    case XVID_PAR_43_PAL:
1412                    case XVID_PAR_43_NTSC:
1413                    case XVID_PAR_169_PAL:
1414                    case XVID_PAR_169_NTSC:
1415                    case XVID_PAR_EXT:
1416                            pEnc->mbParam.par = frame->par;
1417                            break;
1418                    default:
1419                            pEnc->mbParam.par = XVID_PAR_11_VGA;
1420                            break;
1421                    }
1422    
1423                    /* For extended PAR only, we try to sanityse/simplify par values */
1424                    if (pEnc->mbParam.par == XVID_PAR_EXT) {
1425                            pEnc->mbParam.par_width  = frame->par_width;
1426                            pEnc->mbParam.par_height = frame->par_height;
1427                            simplify_par(&pEnc->mbParam.par_width, &pEnc->mbParam.par_height);
1428                    }
1429    
1430          if ((pEnc->mbParam.vol_flags & XVID_VOL_MPEGQUANT)) {          if ((pEnc->mbParam.vol_flags & XVID_VOL_MPEGQUANT)) {
1431                          if (frame->quant_intra_matrix != NULL)                          if (frame->quant_intra_matrix != NULL)
1432                                  set_intra_matrix(frame->quant_intra_matrix);                                  set_intra_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_intra_matrix);
1433                          if (frame->quant_inter_matrix != NULL)                          if (frame->quant_inter_matrix != NULL)
1434                                  set_inter_matrix(frame->quant_inter_matrix);                                  set_inter_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_inter_matrix);
1435                  }                  }
1436    
1437          /* prevent vol/vop misuse */          /* prevent vol/vop misuse */
1438    
         if (!(pEnc->current->vol_flags & XVID_VOL_REDUCED_ENABLE))  
             pEnc->current->vop_flags &= ~XVID_VOP_REDUCED;  
   
1439          if (!(pEnc->current->vol_flags & XVID_VOL_INTERLACING))          if (!(pEnc->current->vol_flags & XVID_VOL_INTERLACING))
1440              pEnc->current->vop_flags &= ~(XVID_VOP_TOPFIELDFIRST|XVID_VOP_ALTERNATESCAN);              pEnc->current->vop_flags &= ~(XVID_VOP_TOPFIELDFIRST|XVID_VOP_ALTERNATESCAN);
1441    
# Line 1242  Line 1468 
1468                             pEnc->mbParam.edged_width, pEnc->mbParam.height);                             pEnc->mbParam.edged_width, pEnc->mbParam.height);
1469          }          }
1470    
1471                  FrameCodeP(pEnc, &bs, 1, 0);                  if ( FrameCodeP(pEnc, &bs) == 0 ) {
1472                            /* N-VOP, we mustn't code b-frames yet */
1473                            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) ||
1474                                     pEnc->mbParam.max_bframes == 0)
1475                                    call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1476                            goto done;
1477                    }
1478      }      }
1479    
1480    
# Line 1250  Line 1482 
1482           * on next enc_encode call we must flush bframes           * on next enc_encode call we must flush bframes
1483           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1484    
1485  done_flush:  /*done_flush:*/
1486    
1487      pEnc->flush_bframes = 1;      pEnc->flush_bframes = 1;
1488    
# Line 1261  Line 1493 
1493    
1494      /* packed or no-bframes or no-bframes-queued: output stats */      /* packed or no-bframes or no-bframes-queued: output stats */
1495      if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) || pEnc->mbParam.max_bframes == 0 ) {      if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) || pEnc->mbParam.max_bframes == 0 ) {
1496          call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, 0, 0, stats);                  call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1497          }          }
1498    
1499          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
# Line 1280  Line 1512 
1512    
1513  static void SetMacroblockQuants(MBParam * const pParam, FRAMEINFO * frame)  static void SetMacroblockQuants(MBParam * const pParam, FRAMEINFO * frame)
1514  {  {
1515      unsigned int i,j;          unsigned int i;
1516      int quant = frame->quant;          MACROBLOCK * pMB = frame->mbs;
1517            int quant = frame->mbs[0].quant; /* set by XVID_PLG_FRAME */
1518            if (quant > 31)
1519                    frame->quant = quant = 31;
1520            else if (quant < 1)
1521                    frame->quant = quant = 1;
1522    
1523      for (j=0; j<pParam->mb_height; j++)          for (i = 0; i < pParam->mb_height * pParam->mb_width; i++) {
     for (i=0; i<pParam->mb_width; i++) {  
         MACROBLOCK * pMB = &frame->mbs[j*pParam->mb_width + i];  
1524          quant += pMB->dquant;          quant += pMB->dquant;
1525          if (quant > 31)          if (quant > 31)
1526                          quant = 31;                          quant = 31;
1527                  if (quant < 1)                  else if (quant < 1)
1528                          quant = 1;                          quant = 1;
1529          pMB->quant = quant;          pMB->quant = quant;
1530                    pMB++;
1531      }      }
1532  }  }
1533    
1534    
1535  static __inline void  static __inline void
1536  CodeIntraMB(Encoder * pEnc,  CodeIntraMB(MACROBLOCK * pMB)
                         MACROBLOCK * pMB)  
1537  {  {
   
1538          pMB->mode = MODE_INTRA;          pMB->mode = MODE_INTRA;
1539    
1540          /* zero mv statistics */          /* zero mv statistics */
# Line 1314  Line 1548 
1548      }      }
1549  }  }
1550    
1551    static void
1552    SliceCodeI(SMPData *data)
 static int  
 FrameCodeI(Encoder * pEnc,  
                    Bitstream * bs)  
1553  {  {
1554      int bits = BitstreamPos(bs);          Encoder *pEnc = (Encoder *) data->pEnc;
1555            Bitstream *bs = (Bitstream *) data->bs;
1556    
1557            uint16_t x, y;
1558          int mb_width = pEnc->mbParam.mb_width;          int mb_width = pEnc->mbParam.mb_width;
1559          int mb_height = pEnc->mbParam.mb_height;          int mb_height = pEnc->mbParam.mb_height;
1560    
1561            int bound = 0, num_slices = pEnc->num_slices;
1562            FRAMEINFO *const current = pEnc->current;
1563    
1564          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1565          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1566    
1567          uint16_t x, y;          if (data->start_y > 0) { /* write resync marker */
1568                    bound = data->start_y*mb_width;
1569          if ((pEnc->current->vol_flags & XVID_VOL_REDUCED_ENABLE))                  write_video_packet_header(bs, &pEnc->mbParam, current, bound);
         {  
                 mb_width = (pEnc->mbParam.width + 31) / 32;  
                 mb_height = (pEnc->mbParam.height + 31) / 32;  
   
                 /* 16x16->8x8 downsample requires 1 additional edge pixel*/  
                 /* XXX: setedges is overkill */  
                 start_timer();  
                 image_setedges(&pEnc->current->image,  
                         pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,  
                         pEnc->mbParam.width, pEnc->mbParam.height);  
                 stop_edges_timer();  
1570          }          }
1571    
1572          pEnc->mbParam.m_rounding_type = 1;          for (y = data->start_y; y < data->stop_y; y++) {
1573          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;                  int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
         pEnc->current->coding_type = I_VOP;  
   
     SetMacroblockQuants(&pEnc->mbParam, pEnc->current);  
   
         BitstreamWriteVolHeader(bs, &pEnc->mbParam);  
   
         set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);  
1574    
1575                    if (new_bound > bound) {
1576                            bound = new_bound;
1577          BitstreamPadAlways(bs);          BitstreamPadAlways(bs);
1578          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);                          write_video_packet_header(bs, &pEnc->mbParam, current, bound);
1579                    }
         pEnc->current->sStat.iTextBits = 0;  
         pEnc->current->sStat.kblks = mb_width * mb_height;  
         pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;  
1580    
         for (y = 0; y < mb_height; y++)  
1581                  for (x = 0; x < mb_width; x++) {                  for (x = 0; x < mb_width; x++) {
1582                          MACROBLOCK *pMB =                          MACROBLOCK *pMB = &current->mbs[x + y * mb_width];
                                 &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
1583    
1584                          CodeIntraMB(pEnc, pMB);                          CodeIntraMB(pMB);
1585    
1586                          MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,                          MBTransQuantIntra(&pEnc->mbParam, current, pMB, x, y,
1587                                                            dct_codes, qcoeff);                                                            dct_codes, qcoeff);
1588    
1589                          start_timer();                          start_timer();
1590                          MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);                          MBPrediction(current, x, y, mb_width, qcoeff, bound);
1591                          stop_prediction_timer();                          stop_prediction_timer();
1592    
1593                          start_timer();                          start_timer();
1594                          if (pEnc->current->vop_flags & XVID_VOP_GREYSCALE)                          MBCoding(current, pMB, qcoeff, bs, data->sStat);
                         {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */  
                                 qcoeff[4*64+0]=0;               /* zero, because for INTRA MBs DC value is saved */  
                                 qcoeff[5*64+0]=0;  
                         }  
                         MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);  
1595                          stop_coding_timer();                          stop_coding_timer();
                 }  
1596    
         if ((pEnc->current->vop_flags & XVID_VOP_REDUCED))  
         {  
                 image_deblock_rrv(&pEnc->current->image, pEnc->mbParam.edged_width,  
                         pEnc->current->mbs, mb_width, mb_height, pEnc->mbParam.mb_width,  
                         16, 0);  
1597          }          }
1598          emms();          }
1599    
1600  /* XXX: Remove the two #if 0 blocks when we are sure we must always pad the stream */          emms();
 #if 0  
         /* for divx5 compatibility, we must always pad between the packed p and b frames */  
         if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0)  
 #endif  
1601                  BitstreamPadAlways(bs);                  BitstreamPadAlways(bs);
 #if 0  
         else  
                 BitstreamPad(bs);  
 #endif  
     pEnc->current->length = (BitstreamPos(bs) - bits) / 8;  
   
         pEnc->fMvPrevSigma = -1;  
         pEnc->mbParam.m_fcode = 2;  
   
         return 1;                                       /* intra */  
1602  }  }
1603    
1604    static __inline void
1605    SerializeBitstreams(Encoder *pEnc, FRAMEINFO *current, Bitstream *bs, int num_threads)
1606    {
1607            int k;
1608            uint32_t pos = BitstreamLength(bs);
1609    
1610  #define INTRA_THRESHOLD 0.5          for (k = 1; k < num_threads; k++) {
1611  #define BFRAME_SKIP_THRESHHOLD 30                  uint32_t len = BitstreamLength(pEnc->smpData[k].bs);
1612    
1613                    memcpy((void *)((ptr_t)bs->start + pos),
1614                               (void *)((ptr_t)pEnc->smpData[k].bs->start), len);
1615    
1616                    current->length += len;
1617                    pos += len;
1618    
1619                    /* collect stats */
1620                    current->sStat.iTextBits += pEnc->smpData[k].sStat->iTextBits;
1621                    current->sStat.kblks += pEnc->smpData[k].sStat->kblks;
1622                    current->sStat.mblks += pEnc->smpData[k].sStat->mblks;
1623                    current->sStat.ublks += pEnc->smpData[k].sStat->ublks;
1624                    current->sStat.iMVBits += pEnc->smpData[k].sStat->iMVBits;
1625            }
1626    
1627            if (num_threads > 1) {
1628                    uint32_t pos32 = pos>>2;
1629                    bs->tail = bs->start + pos32;
1630                    bs->pos = 8*(pos - (pos32<<2));
1631                    bs->buf = 0;
1632    
1633                    if (bs->pos > 0) {
1634                            uint32_t pos8 = bs->pos/8;
1635                            memset((void *)((ptr_t)bs->tail+pos8), 0, (4-pos8));
1636                            pos = *bs->tail;
1637    #ifndef ARCH_IS_BIG_ENDIAN
1638                            BSWAP(pos);
1639    #endif
1640                            bs->buf = pos;
1641                    }
1642            }
1643    }
1644    
 /* FrameCodeP also handles S(GMC)-VOPs */  
1645  static int  static int
1646  FrameCodeP(Encoder * pEnc,  FrameCodeI(Encoder * pEnc,
1647                     Bitstream * bs,                     Bitstream * bs)
                    bool force_inter,  
                    bool vol_header)  
1648  {  {
         float fSigma;  
1649      int bits = BitstreamPos(bs);      int bits = BitstreamPos(bs);
1650            int bound = 0, num_slices = pEnc->num_slices;
1651            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1652            int slices_per_thread = (num_slices*1024 / num_threads);
1653            int mb_height = pEnc->mbParam.mb_height;
1654    #ifdef HAVE_PTHREAD
1655            void * status = NULL;
1656    #endif
1657            uint16_t k;
1658    
1659          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          pEnc->mbParam.m_rounding_type = 1;
1660          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
1661            pEnc->current->coding_type = I_VOP;
1662    
1663          int mb_width = pEnc->mbParam.mb_width;          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
         int mb_height = pEnc->mbParam.mb_height;  
1664    
1665          int iLimit;          SetMacroblockQuants(&pEnc->mbParam, pEnc->current);
         int x, y, k;  
         int iSearchRange;  
         int bIntra, skip_possible;  
1666    
1667          /* IMAGE *pCurrent = &pEnc->current->image; */          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current, num_slices);
         IMAGE *pRef = &pEnc->reference->image;  
1668    
1669          if ((pEnc->current->vop_flags & XVID_VOP_REDUCED))          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
         {  
                 mb_width = (pEnc->mbParam.width + 31) / 32;  
                 mb_height = (pEnc->mbParam.height + 31) / 32;  
         }  
1670    
1671            BitstreamPad(bs);
1672    
1673          start_timer();          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1, pEnc->current->mbs[0].quant);
         image_setedges(pRef, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,  
                                    pEnc->mbParam.width, pEnc->mbParam.height);  
         stop_edges_timer();  
1674    
1675          pEnc->mbParam.m_rounding_type = 1 - pEnc->mbParam.m_rounding_type;          pEnc->current->sStat.iTextBits = 0;
         pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;  
         pEnc->current->fcode = pEnc->mbParam.m_fcode;  
1676    
1677          if (!force_inter)          /* multithreaded intra coding - dispatch threads */
1678                  iLimit = (int)(mb_width * mb_height *  INTRA_THRESHOLD);          for (k = 0; k < num_threads; k++) {
1679          else                  int add = ((slices_per_thread + 512) >> 10);
                 iLimit = mb_width * mb_height + 1;  
1680    
1681          if ((pEnc->current->vop_flags & XVID_VOP_HALFPEL)) {                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
1682                  start_timer();  
1683                  image_interpolate(pRef, &pEnc->vInterH, &pEnc->vInterV,                  pEnc->smpData[k].pEnc = (void *) pEnc;
1684                                                    &pEnc->vInterHV, pEnc->mbParam.edged_width,                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
1685                                                    pEnc->mbParam.edged_height,                  pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
1686                                                    (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL),  
1687                                                    pEnc->current->rounding_type);                  bound += add;
1688                  stop_inter_timer();  
1689                    if (k > 0) {
1690                            BitstreamReset(pEnc->smpData[k].bs);
1691                            pEnc->smpData[k].sStat->iTextBits = 0;
1692          }          }
1693            }
1694            pEnc->smpData[0].bs = bs;
1695            pEnc->smpData[0].sStat = &pEnc->current->sStat;
1696    
1697          pEnc->current->coding_type = P_VOP;  #ifdef HAVE_PTHREAD
1698            /* create threads */
1699            for (k = 1; k < num_threads; k++) {
1700                    pthread_create(&pEnc->smpData[k].handle, NULL,
1701                                   (void*)SliceCodeI, (void*)&pEnc->smpData[k]);
1702            }
1703    #endif
1704    
1705            SliceCodeI(&pEnc->smpData[0]);
1706    
1707      SetMacroblockQuants(&pEnc->mbParam, pEnc->current);  #ifdef HAVE_PTHREAD
1708            /* wait until all threads are finished */
1709            for (k = 1; k < num_threads; k++) {
1710                    pthread_join(pEnc->smpData[k].handle, &status);
1711            }
1712    #endif
1713    
1714          start_timer();          pEnc->current->length = BitstreamLength(bs) - (bits/8);
         bIntra = MotionEstimation(&pEnc->mbParam, pEnc->current, pEnc->reference,  
                          &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,  
                          iLimit);  
1715    
1716          stop_motion_timer();          /* reassemble the pieces together */
1717            SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
1718    
1719          if (bIntra == 1) return FrameCodeI(pEnc, bs);          pEnc->current->sStat.iMVBits = 0;
1720            pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1721            pEnc->current->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
1722    
1723          if ( ( pEnc->current->vol_flags & XVID_VOL_GMC )          pEnc->fMvPrevSigma = -1;
1724                  && ( (pEnc->current->warp.duv[1].x != 0) || (pEnc->current->warp.duv[1].y != 0) ) )          pEnc->mbParam.m_fcode = 2;
         {  
                 pEnc->current->coding_type = S_VOP;  
1725    
1726                  generate_GMCparameters( 2, 16, &pEnc->current->warp,          pEnc->current->is_edged = 0; /* not edged */
1727                                          pEnc->mbParam.width, pEnc->mbParam.height,          pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
                                         &pEnc->current->gmc_data);  
   
                 generate_GMCimage(&pEnc->current->gmc_data, &pEnc->reference->image,  
                                 pEnc->mbParam.mb_width, pEnc->mbParam.mb_height,  
                                 pEnc->mbParam.edged_width, pEnc->mbParam.edged_width/2,  
                                 pEnc->mbParam.m_fcode, (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0,  
                                 pEnc->current->rounding_type, pEnc->current->mbs, &pEnc->vGMC);  
1728    
1729            return 1;                                       /* intra */
1730          }          }
1731    
1732          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);  static __inline void
1733          if (vol_header)  updateFcode(Statistics * sStat, Encoder * pEnc)
1734          {       BitstreamWriteVolHeader(bs, &pEnc->mbParam);  {
1735                  BitstreamPadAlways(bs);          float fSigma;
1736          }          int iSearchRange;
1737    
1738          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);          if (sStat->iMvCount == 0)
1739                    sStat->iMvCount = 1;
1740    
1741          pEnc->current->sStat.iTextBits = pEnc->current->sStat.iMvSum = pEnc->current->sStat.iMvCount =          fSigma = (float) sqrt((float) sStat->iMvSum / sStat->iMvCount);
                 pEnc->current->sStat.kblks = pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;  
1742    
1743            iSearchRange = 16 << pEnc->mbParam.m_fcode;
1744    
1745          for (y = 0; y < mb_height; y++) {          if ((3.0 * fSigma > iSearchRange) && (pEnc->mbParam.m_fcode <= 5) )
1746                  for (x = 0; x < mb_width; x++) {                  pEnc->mbParam.m_fcode++;
                         MACROBLOCK *pMB =  
                                 &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
1747    
1748  /* Mode decision: Check, if the block should be INTRA / INTER or GMC-coded */          else if ((5.0 * fSigma < iSearchRange)
1749  /* For a start, leave INTRA decision as is, only choose only between INTER/GMC  - gruel, 9.1.2002 */                             && (4.0 * pEnc->fMvPrevSigma < iSearchRange)
1750                               && (pEnc->mbParam.m_fcode >= 2) )
1751                    pEnc->mbParam.m_fcode--;
1752    
1753                          bIntra = (pMB->mode == MODE_INTRA) || (pMB->mode == MODE_INTRA_Q);          pEnc->fMvPrevSigma = fSigma;
1754    }
1755    
1756                          if (bIntra) {  #define BFRAME_SKIP_THRESHHOLD 30
                                 CodeIntraMB(pEnc, pMB);  
                                 MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,  
                                                                   dct_codes, qcoeff);  
1757    
1758                                  start_timer();  static void
1759                                  MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);  SliceCodeP(SMPData *data)
1760                                  stop_prediction_timer();  {
1761            Encoder *pEnc = (Encoder *) data->pEnc;
1762            Bitstream *bs = (Bitstream *) data->bs;
1763    
1764                                  pEnc->current->sStat.kblks++;          int x, y, k;
1765            FRAMEINFO *const current = pEnc->current;
1766            FRAMEINFO *const reference = pEnc->reference;
1767            MBParam * const pParam = &pEnc->mbParam;
1768            int mb_width = pParam->mb_width;
1769            int mb_height = pParam->mb_height;
1770    
1771                                  MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1772                                  stop_coding_timer();          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
                                 continue;  
                         }  
1773    
1774                          if (pEnc->current->coding_type == S_VOP) {          int bound = 0, num_slices = pEnc->num_slices;
1775    
1776                                  int32_t iSAD = sad16(pEnc->current->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,          if (data->start_y > 0) { /* write resync marker */
1777                                          pEnc->vGMC.y + 16*y*pEnc->mbParam.edged_width + 16*x,                  bound = data->start_y*mb_width;
1778                                          pEnc->mbParam.edged_width, 65536);                  write_video_packet_header(bs, pParam, current, bound);
1779            }
1780    
1781                                  if (pEnc->current->motion_flags & XVID_ME_CHROMA16) {          for (y = data->start_y; y < data->stop_y; y++) {
1782                                          iSAD += sad8(pEnc->current->image.u + 8*y*(pEnc->mbParam.edged_width/2) + 8*x,                  int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
                                         pEnc->vGMC.u + 8*y*(pEnc->mbParam.edged_width/2) + 8*x, pEnc->mbParam.edged_width/2);  
1783    
1784                                          iSAD += sad8(pEnc->current->image.v + 8*y*(pEnc->mbParam.edged_width/2) + 8*x,                  if (new_bound > bound) {
1785                                          pEnc->vGMC.v + 8*y*(pEnc->mbParam.edged_width/2) + 8*x, pEnc->mbParam.edged_width/2);                          bound = new_bound;
1786                            BitstreamPadAlways(bs);
1787                            write_video_packet_header(bs, pParam, current, bound);
1788                                  }                                  }
1789    
1790                                  if (iSAD <= pMB->sad16) {               /* mode decision GMC */                  for (x = 0; x < mb_width; x++) {
1791                            MACROBLOCK *pMB = &current->mbs[x + y * pParam->mb_width];
1792                            int skip_possible;
1793    
1794                                          if ((pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL))                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {
1795                                                  pMB->qmvs[0] = pMB->qmvs[1] = pMB->qmvs[2] = pMB->qmvs[3] = pMB->amv;                                  CodeIntraMB(pMB);
1796                                          else                                  MBTransQuantIntra(pParam, current, pMB, x, y,
1797                                                  pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = pMB->amv;                                                                    dct_codes, qcoeff);
1798    
1799                                          pMB->mode = MODE_INTER;                                  start_timer();
1800                                          pMB->mcsel = 1;                                  MBPrediction(current, x, y, pParam->mb_width, qcoeff, bound);
1801                                          pMB->sad16 = iSAD;                                  stop_prediction_timer();
1802                                  } else {  
1803                                          pMB->mcsel = 0;                                  data->sStat->kblks++;
1804                                  }  
1805                          } else {                                  MBCoding(current, pMB, qcoeff, bs, data->sStat);
1806                                  pMB->mcsel = 0; /* just a precaution */                                  stop_coding_timer();
1807                                    continue;
1808                          }                          }
1809    
1810                          start_timer();                          start_timer();
1811                          MBMotionCompensation(pMB, x, y, &pEnc->reference->image,                          MBMotionCompensation(pMB, x, y, &reference->image,
1812                                                                   &pEnc->vInterH, &pEnc->vInterV,                                                                   &pEnc->vInterH, &pEnc->vInterV,
1813                                                                   &pEnc->vInterHV, &pEnc->vGMC,                                                                   &pEnc->vInterHV, &pEnc->vGMC,
1814                                                                   &pEnc->current->image,                                                                   &current->image,
1815                                                                   dct_codes, pEnc->mbParam.width,                                                                   dct_codes, pParam->width,
1816                                                                   pEnc->mbParam.height,                                                                   pParam->height,
1817                                                                   pEnc->mbParam.edged_width,                                                                   pParam->edged_width,
1818                                                                   (pEnc->current->vol_flags & XVID_VOL_QUARTERPEL),                                                                   (current->vol_flags & XVID_VOL_QUARTERPEL),
1819                                                                   (pEnc->current->vop_flags & XVID_VOP_REDUCED),                                                                   current->rounding_type,
1820                                                                   pEnc->current->rounding_type);                                                                   data->RefQ);
1821    
1822                          stop_comp_timer();                          stop_comp_timer();
1823    
                         if (pMB->dquant != 0) {  
                 pMB->mode = MODE_INTER_Q;  
                         }  
   
1824                          pMB->field_pred = 0;                          pMB->field_pred = 0;
1825    
1826                          if (pMB->mode != MODE_NOT_CODED)                          if (pMB->cbp != 0) {
1827                          {       pMB->cbp =                                  pMB->cbp = MBTransQuantInter(pParam, current, pMB, x, y,
                                         MBTransQuantInter(&pEnc->mbParam, pEnc->current, pMB, x, y,  
1828                                                                            dct_codes, qcoeff);                                                                            dct_codes, qcoeff);
1829                          }                          }
1830    
1831                            if (pMB->dquant != 0)
1832                                    MBSetDquant(pMB, x, y, pParam);
1833    
1834    
1835                          if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||                          if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||
1836                                     pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||                                     pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||
1837                                     pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {                                     pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {
1838                                  pEnc->current->sStat.mblks++;                                  data->sStat->mblks++;
1839                          }  else {                          }  else {
1840                                  pEnc->current->sStat.ublks++;                                  data->sStat->ublks++;
1841                          }                          }
1842    
1843                          start_timer();                          start_timer();
1844    
1845                          /* Finished processing the MB, now check if to CODE or SKIP */                          /* Finished processing the MB, now check if to CODE or SKIP */
1846    
1847                          skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER) &&                          skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER);
                                                         (pMB->dquant == 0);  
1848    
1849                          if (pEnc->current->coding_type == S_VOP)                          if (current->coding_type == S_VOP)
1850                                  skip_possible &= (pMB->mcsel == 1);                                  skip_possible &= (pMB->mcsel == 1);
1851                          else if (pEnc->current->coding_type == P_VOP) {                          else { /* PVOP */
1852                                  if ((pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL))                                  const VECTOR * const mv = (pParam->vol_flags & XVID_VOL_QUARTERPEL) ?
1853                                          skip_possible &= ( (pMB->qmvs[0].x == 0) && (pMB->qmvs[0].y == 0) );                                                                                  pMB->qmvs : pMB->mvs;
1854                                  else                                  skip_possible &= ((mv->x|mv->y) == 0);
                                         skip_possible &= ( (pMB->mvs[0].x == 0) && (pMB->mvs[0].y == 0) );  
1855                          }                          }
1856    
1857                          if ( (pMB->mode == MODE_NOT_CODED) || (skip_possible)) {                          if ( (pMB->mode == MODE_NOT_CODED) || (skip_possible)) {
   
1858  /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */  /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */
   
                                 if (pEnc->current->coding_type == P_VOP)        /* special rule for P-VOP's SKIP */  
                                 {  
1859                                          int bSkip = 1;                                          int bSkip = 1;
1860    
1861                                          for (k=pEnc->bframenum_head; k< pEnc->bframenum_tail; k++)                                  if (current->coding_type == P_VOP) {    /* special rule for P-VOP's SKIP */
1862                                          {                                          for (k = pEnc->bframenum_head; k < pEnc->bframenum_tail; k++) {
1863                                                  int iSAD;                                                  int iSAD;
1864                                                  iSAD = sad16(pEnc->reference->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,                                                  iSAD = sad16(reference->image.y + 16*y*pParam->edged_width + 16*x,
1865                                                                          pEnc->bframes[k]->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,                                                                                  pEnc->bframes[k]->image.y + 16*y*pParam->edged_width + 16*x,
1866                                                                  pEnc->mbParam.edged_width,BFRAME_SKIP_THRESHHOLD);                                                                                  pParam->edged_width, BFRAME_SKIP_THRESHHOLD * pMB->quant);
1867                                                  if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant)                                                  if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant || ((bound > 1) &&
1868                                                  {       bSkip = 0;                                                          ((y*mb_width+x == bound) || (y*mb_width+x == bound+1)))) { /* Some third-party decoders have problems with coloc skip MB before or after
1869                                                          break;                                                                                                                                                                             resync marker in BVOP. We avoid any ambiguity and force no skip at slice boundary */
1870                                                  }                                                          bSkip = 0; /* could not SKIP */
1871                                          }                                                          if (pParam->vol_flags & XVID_VOL_QUARTERPEL) {
1872                                                                    VECTOR predMV = get_qpmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
                                         if (!bSkip) {   /* no SKIP, but trivial block */  
                                                 if((pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL)) {  
                                                         VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);  
1873                                                          pMB->pmvs[0].x = - predMV.x;                                                          pMB->pmvs[0].x = - predMV.x;
1874                                                          pMB->pmvs[0].y = - predMV.y;                                                          pMB->pmvs[0].y = - predMV.y;
1875                                                  }                                                          } else {
1876                                                  else {                                                                  VECTOR predMV = get_pmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
                                                         VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);  
1877                                                          pMB->pmvs[0].x = - predMV.x;                                                          pMB->pmvs[0].x = - predMV.x;
1878                                                          pMB->pmvs[0].y = - predMV.y;                                                          pMB->pmvs[0].y = - predMV.y;
1879                                                  }                                                  }
1880                                                  pMB->mode = MODE_INTER;                                                  pMB->mode = MODE_INTER;
1881                                                  pMB->cbp = 0;                                                  pMB->cbp = 0;
1882                                                  MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);                                                          break;
1883                                                  stop_coding_timer();                                                  }
   
                                                 continue;       /* next MB */  
1884                                          }                                          }
1885                                  }                                  }
                                 /* do SKIP */  
1886    
1887                                    if (bSkip) {
1888                                            /* do SKIP */
1889                                  pMB->mode = MODE_NOT_CODED;                                  pMB->mode = MODE_NOT_CODED;
1890                                  MBSkip(bs);                                  MBSkip(bs);
1891                                  stop_coding_timer();                                  stop_coding_timer();
1892                                  continue;       /* next MB */                                  continue;       /* next MB */
1893                          }                          }
1894                            }
1895    
1896                          /* ordinary case: normal coded INTER/INTER4V block */                          /* ordinary case: normal coded INTER/INTER4V block */
1897                            MBCoding(current, pMB, qcoeff, bs, data->sStat);
1898                            stop_coding_timer();
1899                    }
1900            }
1901    
1902                          if ((pEnc->current->vop_flags & XVID_VOP_GREYSCALE))          BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
1903                          {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */          emms();
                                 qcoeff[4*64+0]=0;               /* zero, because DC for INTRA MBs DC value is saved */  
                                 qcoeff[5*64+0]=0;  
1904                          }                          }
1905    
1906                          if((pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL)) {  /* FrameCodeP also handles S(GMC)-VOPs */
1907                                  VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);  static int
1908                                  pMB->pmvs[0].x = pMB->qmvs[0].x - predMV.x;  FrameCodeP(Encoder * pEnc, Bitstream * bs)
1909                                  pMB->pmvs[0].y = pMB->qmvs[0].y - predMV.y;  {
1910                                  DPRINTF(XVID_DEBUG_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)\n", pMB->pmvs[0].x, pMB->pmvs[0].y, predMV.x, predMV.y, pMB->mvs[0].x, pMB->mvs[0].y);          int bits = BitstreamPos(bs);
1911                          } else {  
1912                                  VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);          FRAMEINFO *const current = pEnc->current;
1913                                  pMB->pmvs[0].x = pMB->mvs[0].x - predMV.x;          FRAMEINFO *const reference = pEnc->reference;
1914                                  pMB->pmvs[0].y = pMB->mvs[0].y - predMV.y;          MBParam * const pParam = &pEnc->mbParam;
1915                                  DPRINTF(XVID_DEBUG_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)\n", pMB->pmvs[0].x, pMB->pmvs[0].y, predMV.x, predMV.y, pMB->mvs[0].x, pMB->mvs[0].y);          int mb_width = pParam->mb_width;
1916            int mb_height = pParam->mb_height;
1917            int coded = 1;
1918    
1919            int k = 0, bound = 0, num_slices = pEnc->num_slices;
1920            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1921    #ifdef HAVE_PTHREAD
1922            void * status = NULL;
1923            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
1924    #endif
1925            int slices_per_thread = (num_slices*1024 / num_threads);
1926    
1927            IMAGE *pRef = &reference->image;
1928    
1929            if (!reference->is_edged) {
1930                    start_timer();
1931                    image_setedges(pRef, pParam->edged_width, pParam->edged_height,
1932                                               pParam->width, pParam->height, XVID_BS_VERSION);
1933                    stop_edges_timer();
1934                    reference->is_edged = 1;
1935            }
1936    
1937            pParam->m_rounding_type = 1 - pParam->m_rounding_type;
1938            current->rounding_type = pParam->m_rounding_type;
1939            current->fcode = pParam->m_fcode;
1940    
1941            if ((current->vop_flags & XVID_VOP_HALFPEL)) {
1942                    if (reference->is_interpolated != current->rounding_type) {
1943                            start_timer();
1944                            image_interpolate(pRef->y, pEnc->vInterH.y, pEnc->vInterV.y,
1945                                                              pEnc->vInterHV.y, pParam->edged_width,
1946                                                              pParam->edged_height,
1947                                                              (pParam->vol_flags & XVID_VOL_QUARTERPEL),
1948                                                              current->rounding_type);
1949                            stop_inter_timer();
1950                            reference->is_interpolated = current->rounding_type;
1951                    }
1952            }
1953    
1954            current->sStat.iTextBits = current->sStat.iMvSum = current->sStat.iMvCount =
1955                    current->sStat.kblks = current->sStat.mblks = current->sStat.ublks =
1956                    current->sStat.iMVBits = 0;
1957    
1958            current->coding_type = P_VOP;
1959    
1960            if (current->vop_flags & XVID_VOP_RD_PSNRHVSM) {
1961                    image_block_variance(&current->image, pParam->edged_width, current->mbs,
1962                                         pParam->mb_width, pParam->mb_height);
1963                          }                          }
1964    
1965            call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
1966    
1967            SetMacroblockQuants(&pEnc->mbParam, current);
1968    
1969            start_timer();
1970            if (current->vol_flags & XVID_VOL_GMC)  /* GMC only for S(GMC)-VOPs */
1971            {       int gmcval;
1972                    current->warp = GlobalMotionEst( current->mbs, pParam, current, reference,
1973                                                                     &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV, num_slices);
1974    
1975                    if (current->motion_flags & XVID_ME_GME_REFINE) {
1976                            gmcval = GlobalMotionEstRefine(&current->warp,
1977                                                                                       current->mbs, pParam,
1978                                                                                       current, reference,
1979                                                                                       &current->image,
1980                                                                                       &reference->image,
1981                                                                                       &pEnc->vInterH,
1982                                                                                       &pEnc->vInterV,
1983                                                                                       &pEnc->vInterHV);
1984                    } else {
1985                            gmcval = globalSAD(&current->warp, pParam, current->mbs,
1986                                                               current,
1987                                                               &reference->image,
1988                                                               &current->image,
1989                                                               pEnc->vGMC.y);
1990                    }
1991    
1992                    gmcval += /*current->quant*/ 2 * (int)(pParam->mb_width*pParam->mb_height);
1993    
1994                    /* 1st '3': 3 warpoints, 2nd '3': 16th pel res (2<<3) */
1995                    generate_GMCparameters( 3, 3, &current->warp,
1996                                    pParam->width, pParam->height,
1997                                    &current->new_gmc_data);
1998    
1999                    if ( (gmcval<0) && ( (current->warp.duv[1].x != 0) || (current->warp.duv[1].y != 0) ||
2000                             (current->warp.duv[2].x != 0) || (current->warp.duv[2].y != 0) ) )
2001                    {
2002                            current->coding_type = S_VOP;
2003    
2004                            generate_GMCimage(&current->new_gmc_data, &reference->image,
2005                                    pParam->mb_width, pParam->mb_height,
2006                                    pParam->edged_width, pParam->edged_width/2,
2007                                    pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
2008                                    current->rounding_type, current->mbs, &pEnc->vGMC);
2009    
                         if (pMB->mode == MODE_INTER4V)  
                         {       int k;  
                                 for (k=1;k<4;k++)  
                                 {  
                                         if((pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL)) {  
                                                 VECTOR predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, k);  
                                                 pMB->pmvs[k].x = pMB->qmvs[k].x - predMV.x;  
                                                 pMB->pmvs[k].y = pMB->qmvs[k].y - predMV.y;  
                                 DPRINTF(XVID_DEBUG_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)\n", pMB->pmvs[k].x, pMB->pmvs[k].y, predMV.x, predMV.y, pMB->mvs[k].x, pMB->mvs[k].y);  
2010                                          } else {                                          } else {
2011                                                  VECTOR predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, k);  
2012                                                  pMB->pmvs[k].x = pMB->mvs[k].x - predMV.x;                          generate_GMCimage(&current->new_gmc_data, &reference->image,
2013                                                  pMB->pmvs[k].y = pMB->mvs[k].y - predMV.y;                                  pParam->mb_width, pParam->mb_height,
2014                                  DPRINTF(XVID_DEBUG_MV,"mv_diff (%i,%i) pred (%i,%i) result (%i,%i)\n", pMB->pmvs[k].x, pMB->pmvs[k].y, predMV.x, predMV.y, pMB->mvs[k].x, pMB->mvs[k].y);                                  pParam->edged_width, pParam->edged_width/2,
2015                                    pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
2016                                    current->rounding_type, current->mbs, NULL);    /* no warping, just AMV */
2017                    }
2018                                          }                                          }
2019    
2020    #ifdef HAVE_PTHREAD
2021            if (pEnc->num_threads > 0) {
2022    
2023                    /* multithreaded motion estimation - dispatch threads */
2024                    while (k < pEnc->num_threads) {
2025                            int i, add_s = (slices_per_thread + 512) >> 10;
2026                            int add_t = (threads_per_slice + 512) >> 10;
2027    
2028                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2029                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2030                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2031    
2032                            slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2033                            threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
2034    
2035                            for (i = 0; i < add_t; i++) {
2036                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2037    
2038                                    pEnc->smpData[k+i].pEnc = (void *) pEnc;
2039                                    pEnc->smpData[k+i].y_row = i;
2040                                    pEnc->smpData[k+i].y_step = add_t;
2041                                    pEnc->smpData[k+i].stop_y = stop_y;
2042                                    pEnc->smpData[k+i].start_y = start_y;
2043    
2044                                    /* todo: sort out temp space once and for all */
2045                                    pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2046                                                                                            16*((k+i)>>1)*pParam->edged_width;
2047                                  }                                  }
2048    
2049                            pEnc->smpData[k].complete_count_above =
2050                                    pEnc->smpData[k+add_t-1].complete_count_self - 1;
2051    
2052                            bound += add_s;
2053                            k += add_t;
2054                          }                          }
2055    
2056                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);                  for (k = 1; k < pEnc->num_threads; k++) {
2057                          stop_coding_timer();                          pthread_create(&pEnc->smpData[k].handle, NULL,
2058                                    (void*)MotionEstimateSMP, (void*)&pEnc->smpData[k]);
2059                    }
2060    
2061                    MotionEstimateSMP(&pEnc->smpData[0]);
2062    
2063                    for (k = 1; k < pEnc->num_threads; k++) {
2064                            pthread_join(pEnc->smpData[k].handle, &status);
2065                  }                  }
2066    
2067                    current->fcode = 0;
2068                    for (k = 0; k < pEnc->num_threads; k++) {
2069                            current->sStat.iMvSum += pEnc->smpData[k].mvSum;
2070                            current->sStat.iMvCount += pEnc->smpData[k].mvCount;
2071                            if (pEnc->smpData[k].minfcode > current->fcode)
2072                                    current->fcode = pEnc->smpData[k].minfcode;
2073          }          }
2074    
2075          if ((pEnc->current->vop_flags & XVID_VOP_REDUCED))          } else
2076    #endif
2077          {          {
2078                  image_deblock_rrv(&pEnc->current->image, pEnc->mbParam.edged_width,  
2079                          pEnc->current->mbs, mb_width, mb_height, pEnc->mbParam.mb_width,                  /* regular ME */
2080                          16, 0);  
2081                    MotionEstimation(&pEnc->mbParam, current, reference,
2082                                                     &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
2083                                                     &pEnc->vGMC, 256*4096, num_slices);
2084    
2085          }          }
2086    
2087          emms();          stop_motion_timer();
2088    
2089          if (pEnc->current->sStat.iMvCount == 0)          set_timecodes(current,reference,pParam->fbase);
                 pEnc->current->sStat.iMvCount = 1;  
2090    
2091          fSigma = (float) sqrt((float) pEnc->current->sStat.iMvSum / pEnc->current->sStat.iMvCount);          BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 1, current->mbs[0].quant);
2092    
2093          iSearchRange = 1 << (3 + pEnc->mbParam.m_fcode);          /* multithreaded inter coding - dispatch threads */
2094    
2095          if ((fSigma > iSearchRange / 3)          bound = 0;
2096          && (pEnc->mbParam.m_fcode <= (3 +  (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL?1:0)  )))     /* maximum search range 128 */          slices_per_thread = (num_slices*1024 / num_threads);
2097          {  
2098                  pEnc->mbParam.m_fcode++;          for (k = 0; k < num_threads; k++) {
2099                  iSearchRange *= 2;                  int add = ((slices_per_thread + 512) >> 10);
2100          } else if ((fSigma < iSearchRange / 6)  
2101                             && (pEnc->fMvPrevSigma >= 0)                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
2102                             && (pEnc->fMvPrevSigma < iSearchRange / 6)  
2103                             && (pEnc->mbParam.m_fcode >= (2 + (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL?1:0) )))    /* minimum search range 16 */                  pEnc->smpData[k].pEnc = (void *) pEnc;
2104          {                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2105                  pEnc->mbParam.m_fcode--;                  pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2106                  iSearchRange /= 2;                  pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2107    
2108                    bound += add;
2109    
2110                    if (k > 0) {
2111                            pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2112                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks =
2113                            pEnc->smpData[k].sStat->iMVBits = 0;
2114    
2115                            BitstreamReset(pEnc->smpData[k].bs);
2116                    }
2117          }          }
2118            pEnc->smpData[0].bs = bs;
2119            pEnc->smpData[0].sStat = &current->sStat;
2120    
2121          pEnc->fMvPrevSigma = fSigma;  #ifdef HAVE_PTHREAD
2122            /* create threads */
2123            for (k = 1; k < num_threads; k++) {
2124                    pthread_create(&pEnc->smpData[k].handle, NULL,
2125                            (void*)SliceCodeP, (void*)&pEnc->smpData[k]);
2126            }
2127    #endif
2128    
2129            SliceCodeP(&pEnc->smpData[0]);
2130    
2131    #ifdef HAVE_PTHREAD
2132            /* wait until all threads are finished */
2133            for (k = 1; k < num_threads; k++) {
2134                    pthread_join(pEnc->smpData[k].handle, &status);
2135            }
2136    #endif
2137    
2138            current->length = BitstreamLength(bs) - (bits/8);
2139    
2140            /* reassemble the pieces together */
2141            SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
2142    
2143            updateFcode(&current->sStat, pEnc);
2144    
2145          /* frame drop code */          /* frame drop code */
2146  #if 0  #if 0
2147          DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", pEnc->current->sStat.kblks, pEnc->current->sStat.mblks, pEnc->current->sStat.ublks);          DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", current->sStat.kblks, current->sStat.mblks, current->sStat.ublks);
2148  #endif  #endif
2149          if (pEnc->current->sStat.kblks + pEnc->current->sStat.mblks <  
2150                  (pEnc->mbParam.frame_drop_ratio * mb_width * mb_height) / 100)          if (current->sStat.kblks + current->sStat.mblks <
2151                    (pParam->frame_drop_ratio * mb_width * mb_height) / 100 &&
2152                    ( (pEnc->bframenum_head >= pEnc->bframenum_tail) || !(pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP)) &&
2153                    (current->coding_type == P_VOP) )
2154          {          {
2155                  pEnc->current->sStat.kblks = pEnc->current->sStat.mblks = 0;                  current->sStat.kblks = current->sStat.mblks = current->sStat.iTextBits = 0;
2156                  pEnc->current->sStat.ublks = mb_width * mb_height;                  current->sStat.ublks = mb_width * mb_height;
2157    
2158                  BitstreamReset(bs);                  BitstreamReset(bs);
2159    
2160                  set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);                  set_timecodes(current,reference,pParam->fbase);
2161                  BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 0);                  BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 0, current->mbs[0].quant);
2162    
2163                  /* copy reference frame details into the current frame */                  /* copy reference frame details into the current frame */
2164                  pEnc->current->quant = pEnc->reference->quant;                  current->quant = reference->quant;
2165                  pEnc->current->motion_flags = pEnc->reference->motion_flags;                  current->motion_flags = reference->motion_flags;
2166                  pEnc->current->rounding_type = pEnc->reference->rounding_type;                  current->rounding_type = reference->rounding_type;
2167                  pEnc->current->fcode = pEnc->reference->fcode;                  current->fcode = reference->fcode;
2168                  pEnc->current->bcode = pEnc->reference->bcode;                  current->bcode = reference->bcode;
2169                  image_copy(&pEnc->current->image, &pEnc->reference->image, pEnc->mbParam.edged_width, pEnc->mbParam.height);                  current->stamp = reference->stamp;
2170                  memcpy(pEnc->current->mbs, pEnc->reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);                  image_copy(&current->image, &reference->image, pParam->edged_width, pParam->height);
2171                    memcpy(current->mbs, reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);
2172                    coded = 0;
2173    
2174                    BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2175    
2176                    current->length = (BitstreamPos(bs) - bits) / 8;
2177    
2178            } else {
2179    
2180                    pEnc->current->is_edged = 0; /* not edged */
2181                    pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
2182    
2183                    /* what was this frame's interpolated reference will become
2184                            forward (past) reference in b-frame coding */
2185    
2186                    image_swap(&pEnc->vInterH, &pEnc->f_refh);
2187                    image_swap(&pEnc->vInterV, &pEnc->f_refv);
2188                    image_swap(&pEnc->vInterHV, &pEnc->f_refhv);
2189          }          }
2190    
2191          /* XXX: debug          /* XXX: debug
2192          {          {
2193                  char s[100];                  char s[100];
2194                  sprintf(s, "\\%05i_cur.pgm", pEnc->m_framenum);                  sprintf(s, "\\%05i_cur.pgm", pEnc->m_framenum);
2195                  image_dump_yuvpgm(&pEnc->current->image,                  image_dump_yuvpgm(&current->image,
2196                          pEnc->mbParam.edged_width,                          pParam->edged_width,
2197                          pEnc->mbParam.width, pEnc->mbParam.height, s);                          pParam->width, pParam->height, s);
2198    
2199                  sprintf(s, "\\%05i_ref.pgm", pEnc->m_framenum);                  sprintf(s, "\\%05i_ref.pgm", pEnc->m_framenum);
2200                  image_dump_yuvpgm(&pEnc->reference->image,                  image_dump_yuvpgm(&reference->image,
2201                          pEnc->mbParam.edged_width,                          pParam->edged_width,
2202                          pEnc->mbParam.width, pEnc->mbParam.height, s);                          pParam->width, pParam->height, s);
2203          }          }
2204          */          */
2205    
2206  /* XXX: Remove the two #if 0 blocks when we are sure we must always pad the stream */          return coded;
2207  #if 0  }
2208          /* for divx5 compatibility, we must always pad between the packed p and b frames */  
2209          if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0)  static void
2210  #endif  SliceCodeB(SMPData *data)
2211    {
2212            Encoder *pEnc = (Encoder *) data->pEnc;
2213            Bitstream *bs = (Bitstream *) data->bs;
2214    
2215            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
2216            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
2217    
2218            int x, y;
2219            FRAMEINFO * const frame = (FRAMEINFO * const) data->current;
2220            MBParam * const pParam = &pEnc->mbParam;
2221            int mb_width = pParam->mb_width;
2222            int mb_height = pParam->mb_height;
2223            IMAGE *f_ref = &pEnc->reference->image;
2224            IMAGE *b_ref = &pEnc->current->image;
2225    
2226            int bound = data->start_y*mb_width;
2227            int num_slices = pEnc->num_slices;
2228    
2229            if (data->start_y > 0) { /* write resync marker */
2230                    write_video_packet_header(bs, pParam, frame, bound+1);
2231            }
2232    
2233            for (y = data->start_y; y < MIN(data->stop_y+1, mb_height); y++) {
2234                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
2235                    int stop_x = (y == data->stop_y) ? 1 : mb_width;
2236                    int start_x = (y == data->start_y && y > 0) ? 1 : 0;
2237    
2238                    for (x = start_x; x < stop_x; x++) {
2239                            MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];
2240    
2241                            /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */
2242                            if (mb->mode == MODE_NOT_CODED) {
2243                                    if (pParam->plugin_flags & XVID_REQORIGINAL) {
2244                                            MBMotionCompensation(mb, x, y, f_ref, NULL, f_ref, NULL, NULL, &frame->image,
2245                                                                                     NULL, 0, 0, pParam->edged_width, 0, 0, data->RefQ);
2246                                    }
2247                                    continue;
2248                            }
2249    
2250                            if (new_bound > bound && x > 0) {
2251                                    bound = new_bound;
2252                  BitstreamPadAlways(bs);                  BitstreamPadAlways(bs);
2253  #if 0                                  write_video_packet_header(bs, pParam, frame, y*mb_width+x);
2254          else                          }
2255                  BitstreamPad(bs);  
2256  #endif                          mb->quant = frame->quant;
2257    
2258      pEnc->current->length = (BitstreamPos(bs) - bits) / 8;                          if (mb->cbp != 0 || pParam->plugin_flags & XVID_REQORIGINAL) {
2259                                    /* we have to motion-compensate, transfer etc,
2260                                            because there might be blocks to code */
2261    
2262          return 0;                                       /* inter */                                  MBMotionCompensationBVOP(pParam, mb, x, y, &frame->image,
2263                                                                                     f_ref, &pEnc->f_refh, &pEnc->f_refv,
2264                                                                                     &pEnc->f_refhv, b_ref, &pEnc->vInterH,
2265                                                                                     &pEnc->vInterV, &pEnc->vInterHV, dct_codes,
2266                                                                                     data->RefQ);
2267    
2268                                    mb->cbp = MBTransQuantInterBVOP(pParam, frame, mb, x, y,  dct_codes, qcoeff);
2269                            }
2270    
2271                            if (mb->mode == MODE_DIRECT_NO4V)
2272                                    mb->mode = MODE_DIRECT;
2273    
2274                            if (mb->mode == MODE_DIRECT && (mb->cbp | mb->pmvs[3].x | mb->pmvs[3].y) == 0)
2275                                    mb->mode = MODE_DIRECT_NONE_MV; /* skipped */
2276                            else
2277                                    if (frame->vop_flags & XVID_VOP_GREYSCALE)
2278                                            /* keep only bits 5-2 -- Chroma blocks will just be skipped by MBCodingBVOP */
2279                                            mb->cbp &= 0x3C;
2280    
2281                            start_timer();
2282                            MBCodingBVOP(frame, mb, qcoeff, frame->fcode, frame->bcode, bs, data->sStat);
2283                            stop_coding_timer();
2284                    }
2285  }  }
2286    
2287            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2288            emms();
2289    }
2290    
2291  static void  static void
2292  FrameCodeB(Encoder * pEnc,  FrameCodeB(Encoder * pEnc,
# Line 1807  Line 2294 
2294                     Bitstream * bs)                     Bitstream * bs)
2295  {  {
2296      int bits = BitstreamPos(bs);      int bits = BitstreamPos(bs);
2297          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          int k = 0, bound = 0, num_slices = pEnc->num_slices;
2298          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
2299          uint32_t x, y;  #ifdef HAVE_PTHREAD
2300            void * status = NULL;
2301            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
2302    #endif
2303            int slices_per_thread = (num_slices*1024 / num_threads);
2304    
2305          IMAGE *f_ref = &pEnc->reference->image;          IMAGE *f_ref = &pEnc->reference->image;
2306          IMAGE *b_ref = &pEnc->current->image;          IMAGE *b_ref = &pEnc->current->image;
2307    
2308            MBParam * const pParam = &pEnc->mbParam;
2309            int mb_height = pParam->mb_height;
2310    
2311      #ifdef BFRAMES_DEC_DEBUG      #ifdef BFRAMES_DEC_DEBUG
2312          FILE *fp;          FILE *fp;
2313          static char first=0;          static char first=0;
# Line 1821  Line 2315 
2315                  fprintf(fp,"Y=%3d   X=%3d   MB=%2d   CBP=%02X\n",y,x,mb->mode,mb->cbp); \                  fprintf(fp,"Y=%3d   X=%3d   MB=%2d   CBP=%02X\n",y,x,mb->mode,mb->cbp); \
2316          }          }
2317    
         /* XXX: pEnc->current->global_flags &= ~XVID_VOP_REDUCED;  reduced resoltion not yet supported */  
   
2318          if (!first){          if (!first){
2319                  fp=fopen("C:\\XVIDDBGE.TXT","w");                  fp=fopen("C:\\XVIDDBGE.TXT","w");
2320          }          }
2321  #endif  #endif
2322    
2323          /* forward  */          /* forward  */
2324            if (!pEnc->reference->is_edged) {
2325          image_setedges(f_ref, pEnc->mbParam.edged_width,          image_setedges(f_ref, pEnc->mbParam.edged_width,
2326                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,
2327                                     pEnc->mbParam.height);                                             pEnc->mbParam.height, XVID_BS_VERSION);
2328                    pEnc->reference->is_edged = 1;
2329            }
2330    
2331            if (pEnc->reference->is_interpolated != 0) {
2332          start_timer();          start_timer();
2333          image_interpolate(f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,                  image_interpolate(f_ref->y, pEnc->f_refh.y, pEnc->f_refv.y, pEnc->f_refhv.y,
2334                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2335                                            (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);                                            (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2336          stop_inter_timer();          stop_inter_timer();
2337                    pEnc->reference->is_interpolated = 0;
2338            }
2339    
2340          /* backward */          /* backward */
2341            if (!pEnc->current->is_edged) {
2342          image_setedges(b_ref, pEnc->mbParam.edged_width,          image_setedges(b_ref, pEnc->mbParam.edged_width,
2343                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,
2344                                     pEnc->mbParam.height);                                             pEnc->mbParam.height, XVID_BS_VERSION);
2345                    pEnc->current->is_edged = 1;
2346            }
2347    
2348            if (pEnc->current->is_interpolated != 0) {
2349          start_timer();          start_timer();
2350          image_interpolate(b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                  image_interpolate(b_ref->y, pEnc->vInterH.y, pEnc->vInterV.y, pEnc->vInterHV.y,
2351                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2352                                            (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);                                            (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2353          stop_inter_timer();          stop_inter_timer();
2354                    pEnc->current->is_interpolated = 0;
2355            }
2356    
2357            frame->coding_type = B_VOP;
2358    
2359            if ((frame->vop_flags & XVID_VOP_RD_PSNRHVSM) && (frame->vop_flags & XVID_VOP_RD_BVOP)) {
2360                    image_block_variance(&frame->image, pEnc->mbParam.edged_width, frame->mbs,
2361                                         pEnc->mbParam.mb_width, pEnc->mbParam.mb_height);
2362            }
2363    
2364            call_plugins(pEnc, frame, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
2365    
2366            frame->fcode = frame->bcode = pEnc->current->fcode;
2367    
2368          start_timer();          start_timer();
2369    
2370    #ifdef HAVE_PTHREAD
2371            if (pEnc->num_threads > 0) {
2372    
2373                    /* multithreaded motion estimation - dispatch threads */
2374                    while (k < pEnc->num_threads) {
2375                            int i, add_s = (slices_per_thread + 512) >> 10;
2376                            int add_t = (threads_per_slice + 512) >> 10;
2377    
2378                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2379                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2380                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2381    
2382                            slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2383                            threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
2384    
2385                            for (i = 0; i < add_t; i++) {
2386                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2387    
2388                                    pEnc->smpData[k+i].pEnc = (void *) pEnc;
2389                                    pEnc->smpData[k+i].current = frame;
2390    
2391                                    pEnc->smpData[k+i].y_row = i;
2392                                    pEnc->smpData[k+i].y_step = add_t;
2393                                    pEnc->smpData[k+i].stop_y = stop_y;
2394                                    pEnc->smpData[k+i].start_y = start_y;
2395    
2396                                    /* todo: sort out temp space once and for all */
2397                                    pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2398                                                                                            16*((k+i)>>1)*pParam->edged_width;
2399                            }
2400    
2401                            pEnc->smpData[k].complete_count_above =
2402                                    pEnc->smpData[k+add_t-1].complete_count_self - 1;
2403    
2404                            bound += add_s;
2405                            k += add_t;
2406                    }
2407    
2408                    for (k = 1; k < pEnc->num_threads; k++) {
2409                            pthread_create(&pEnc->smpData[k].handle, NULL,
2410                                    (void*)SMPMotionEstimationBVOP, (void*)&pEnc->smpData[k]);
2411                    }
2412    
2413                    SMPMotionEstimationBVOP(&pEnc->smpData[0]);
2414    
2415                    for (k = 1; k < pEnc->num_threads; k++) {
2416                            pthread_join(pEnc->smpData[k].handle, &status);
2417                    }
2418    
2419                    frame->fcode = frame->bcode = 0;
2420                    for (k = 0; k < pEnc->num_threads; k++) {
2421                            if (pEnc->smpData[k].minfcode > frame->fcode)
2422                                    frame->fcode = pEnc->smpData[k].minfcode;
2423                            if (pEnc->smpData[k].minbcode > frame->bcode)
2424                                    frame->bcode = pEnc->smpData[k].minbcode;
2425                    }
2426            } else
2427    #endif
2428            {
2429    
2430          MotionEstimationBVOP(&pEnc->mbParam, frame,          MotionEstimationBVOP(&pEnc->mbParam, frame,
2431                                                   ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */                                                   ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */
2432                                                   ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */                                                   ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */
2433                                                   pEnc->reference->mbs, f_ref,                                                   pEnc->reference->mbs, f_ref,
2434                                                   &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,                                                   &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,
2435                                                   pEnc->current, b_ref, &pEnc->vInterH,                                                   pEnc->current, b_ref, &pEnc->vInterH,
2436                                                   &pEnc->vInterV, &pEnc->vInterHV);                                                           &pEnc->vInterV, &pEnc->vInterHV,
2437                                                             pEnc->num_slices);
2438            }
2439          stop_motion_timer();          stop_motion_timer();
2440    
         frame->coding_type = B_VOP;  
   
2441          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);
2442          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1);          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1, frame->quant);
2443    
2444            /* reset stats */
2445          frame->sStat.iTextBits = 0;          frame->sStat.iTextBits = 0;
2446            frame->sStat.iMVBits = 0;
2447          frame->sStat.iMvSum = 0;          frame->sStat.iMvSum = 0;
2448          frame->sStat.iMvCount = 0;          frame->sStat.iMvCount = 0;
2449          frame->sStat.kblks = frame->sStat.mblks = frame->sStat.ublks = 0;          frame->sStat.kblks = frame->sStat.mblks = frame->sStat.ublks = 0;
2450          frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;          frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
2451          frame->sStat.kblks = frame->sStat.ublks = 0;          frame->sStat.kblks = frame->sStat.ublks = 0;
2452    
2453          for (y = 0; y < pEnc->mbParam.mb_height; y++) {          /* multithreaded inter coding - dispatch threads */
2454                  for (x = 0; x < pEnc->mbParam.mb_width; x++) {          bound = 0;
2455                          MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];          slices_per_thread = (num_slices*1024 / num_threads);
                         int direction = frame->vop_flags & XVID_VOP_ALTERNATESCAN ? 2 : 0;  
2456    
2457                          /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */          for (k = 0; k < num_threads; k++) {
2458                          if (mb->mode == MODE_NOT_CODED) {                  int add = ((slices_per_thread + 512) >> 10);
                                 /* mb->mvs[0].x = mb->mvs[0].y = mb->cbp = 0; */  
                                 continue;  
                         }  
2459    
2460                          if (mb->mode != MODE_DIRECT_NONE_MV || pEnc->mbParam.plugin_flags & XVID_REQORIGINAL) {                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
                                 MBMotionCompensationBVOP(&pEnc->mbParam, mb, x, y, &frame->image,  
                                                                          f_ref, &pEnc->f_refh, &pEnc->f_refv,  
                                                                          &pEnc->f_refhv, b_ref, &pEnc->vInterH,  
                                                                          &pEnc->vInterV, &pEnc->vInterHV,  
                                                                          dct_codes);  
2461    
2462                                  if (mb->mode == MODE_DIRECT_NO4V) mb->mode = MODE_DIRECT;                  pEnc->smpData[k].pEnc = (void *) pEnc;
2463                                  mb->quant = frame->quant;                  pEnc->smpData[k].current = frame;
2464                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2465                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2466                    bound += add;
2467    
2468                                  if (mb->mode != MODE_DIRECT_NONE_MV)                  /* todo: sort out temp space once and for all */
2469                                          mb->cbp = MBTransQuantInterBVOP(&pEnc->mbParam, frame, mb, x, y,  dct_codes, qcoeff);                  pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2470    
2471                                  if ( (mb->mode == MODE_DIRECT) && (mb->cbp == 0)                  if (k > 0) {
2472                                          && (mb->pmvs[3].x == 0) && (mb->pmvs[3].y == 0) ) {                          BitstreamReset(pEnc->smpData[k].bs);
2473                                          mb->mode = MODE_DIRECT_NONE_MV; /* skipped */                          pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2474                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks = pEnc->smpData[k].sStat->iMVBits = 0;
2475                                  }                                  }
2476                          }                          }
2477    
2478  #ifdef BFRAMES_DEC_DEBUG  #ifdef HAVE_PTHREAD
2479          BFRAME_DEBUG          for (k = 1; k < num_threads; k++) {
2480  #endif                  pthread_create(&pEnc->smpData[k].handle, NULL,
2481                          start_timer();                          (void*)SliceCodeB, (void*)&pEnc->smpData[k]);
                         MBCodingBVOP(mb, qcoeff, frame->fcode, frame->bcode, bs,  
                                                  &frame->sStat, direction);  
                         stop_coding_timer();  
                 }  
2482          }          }
2483    #endif
2484    
2485          emms();          pEnc->smpData[0].bs = bs;
2486            pEnc->smpData[0].sStat = &frame->sStat;
2487            SliceCodeB(&pEnc->smpData[0]);
2488    
2489    #ifdef HAVE_PTHREAD
2490            for (k = 1; k < num_threads; k++) {
2491                    pthread_join(pEnc->smpData[k].handle, &status);
2492            }
2493    #endif
2494    
2495          /* TODO: dynamic fcode/bcode ??? */          frame->length = BitstreamLength(bs) - (bits/8);
2496    
2497      BitstreamPadAlways(bs);          /* reassemble the pieces together */
2498          frame->length = (BitstreamPos(bs) - bits) / 8;          SerializeBitstreams(pEnc, frame, bs, num_threads);
2499    
2500  #ifdef BFRAMES_DEC_DEBUG  #ifdef BFRAMES_DEC_DEBUG
2501          if (!first){          if (!first){

Legend:
Removed from v.1.95.2.30  
changed lines
  Added in v.1.135.2.6

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4