[cvs] / xvidcore / src / encoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/encoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.76.2.20, Tue Nov 19 13:21:25 2002 UTC revision 1.135.2.3, Fri Dec 31 10:20:22 2010 UTC
# Line 3  Line 3 
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  -  Encoder main module  -   *  -  Encoder main module  -
5   *   *
6   *  This program is an implementation of a part of one or more MPEG-4   *  Copyright(C) 2002-2010 Michael Militzer <isibaar@xvid.org>
7   *  Video tools as specified in ISO/IEC 14496-2 standard.  Those intending   *               2002-2003 Peter Ross <pross@xvid.org>
8   *  to use this software module in hardware or software products are   *               2002      Daniel Smith <danielsmith@astroboymail.com>
  *  advised that its use may infringe existing patents or copyrights, and  
  *  any such use would be at such party's own risk.  The original  
  *  developer of this software module and his/her company, and subsequent  
  *  editors and their companies, will have no liability for use of this  
  *  software or modifications or derivatives thereof.  
9   *   *
10   *  This program is free software; you can redistribute it and/or modify   *  This program is free software; you can redistribute it and/or modify
11   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 26  Line 21 
21   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
22   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
23   *   *
  ****************************************************************************/  
   
 /*****************************************************************************  
  *  
  *  History  
  *  
  *  10.07.2002  added BFRAMES_DEC_DEBUG support  
  *              MinChen <chenm001@163.com>  
  *  20.06.2002 bframe patch  
  *  08.05.2002 fix some problem in DEBUG mode;  
  *             MinChen <chenm001@163.com>  
  *  14.04.2002 added FrameCodeB()  
  *  
24   *  $Id$   *  $Id$
25   *   *
26   ****************************************************************************/   ****************************************************************************/
27    
   
28  #include <stdlib.h>  #include <stdlib.h>
29  #include <stdio.h>  #include <stdio.h>
30  #include <math.h>  #include <math.h>
# Line 57  Line 38 
38  #include "image/font.h"  #include "image/font.h"
39  #include "motion/sad.h"  #include "motion/sad.h"
40  #include "motion/motion.h"  #include "motion/motion.h"
41    #include "motion/gmc.h"
42    
43  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
44  #include "utils/mbfunctions.h"  #include "utils/mbfunctions.h"
45  #include "bitstream/bitstream.h"  #include "bitstream/bitstream.h"
46  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
 #include "utils/ratecontrol.h"  
47  #include "utils/emms.h"  #include "utils/emms.h"
48  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
 #include "quant/adapt_quant.h"  
49  #include "quant/quant_matrix.h"  #include "quant/quant_matrix.h"
50  #include "utils/mem_align.h"  #include "utils/mem_align.h"
51    
52  /*****************************************************************************  # include "motion/motion_smp.h"
  * Local macros  
  ****************************************************************************/  
53    
 #define ENC_CHECK(X) if(!(X)) return XVID_ERR_FORMAT  
 #define SWAP(A,B)    { void * tmp = A; A = B; B = tmp; }  
54    
55  /*****************************************************************************  /*****************************************************************************
56   * Local function prototypes   * Local function prototypes
57   ****************************************************************************/   ****************************************************************************/
58    
59  static int FrameCodeI(Encoder * pEnc,  static int FrameCodeI(Encoder * pEnc,
60                                            Bitstream * bs,                                            Bitstream * bs);
                                           uint32_t * pBits);  
61    
62  static int FrameCodeP(Encoder * pEnc,  static int FrameCodeP(Encoder * pEnc,
63                                            Bitstream * bs,                                            Bitstream * bs);
                                           uint32_t * pBits,  
                                           bool force_inter,  
                                           bool vol_header);  
64    
65  static void FrameCodeB(Encoder * pEnc,  static void FrameCodeB(Encoder * pEnc,
66                                             FRAMEINFO * frame,                                             FRAMEINFO * frame,
67                                             Bitstream * bs,                                             Bitstream * bs);
                                            uint32_t * pBits);  
   
 /*****************************************************************************  
  * Local data  
  ****************************************************************************/  
   
 static int DQtab[4] = {  
         -1, -2, 1, 2  
 };  
   
 static int iDQtab[5] = {  
         1, 0, NO_CHANGE, 2, 3  
 };  
68    
69    
70  /*****************************************************************************  /*****************************************************************************
# Line 118  Line 78 
78   * and cleaning code.   * and cleaning code.
79   *   *
80   * Returned values :   * Returned values :
81   *    - XVID_ERR_OK     - no errors   *      - 0                             - no errors
82   *    - XVID_ERR_MEMORY - the libc could not allocate memory, the function   *    - XVID_ERR_MEMORY - the libc could not allocate memory, the function
83   *                        cleans the structure before exiting.   *                        cleans the structure before exiting.
84   *                        pParam->handle is also set to NULL.   *                        pParam->handle is also set to NULL.
85   *   *
86   ****************************************************************************/   ****************************************************************************/
87    
 int  
 encoder_create(XVID_ENC_PARAM * pParam)  
 {  
         Encoder *pEnc;  
         int i;  
   
         pParam->handle = NULL;  
   
         ENC_CHECK(pParam);  
   
         ENC_CHECK(pParam->width > 0 && pParam->width <= 1920);  
         ENC_CHECK(pParam->height > 0 && pParam->height <= 1280);  
         ENC_CHECK(!(pParam->width % 2));  
         ENC_CHECK(!(pParam->height % 2));  
   
         /* Fps */  
   
         if (pParam->fincr <= 0 || pParam->fbase <= 0) {  
                 pParam->fincr = 1;  
                 pParam->fbase = 25;  
         }  
   
88          /*          /*
89           * Simplify the "fincr/fbase" fraction           * Simplify the "fincr/fbase" fraction
          * (neccessary, since windows supplies us with huge numbers)  
90           */           */
91    static int
92    gcd(int a, int b)
93    {
94            int r ;
95    
96          i = pParam->fincr;          if (b > a) {
97          while (i > 1) {                  r = a;
98                  if (pParam->fincr % i == 0 && pParam->fbase % i == 0) {                  a = b;
99                          pParam->fincr /= i;                  b = r;
                         pParam->fbase /= i;  
                         i = pParam->fincr;  
                         continue;  
100                  }                  }
                 i--;  
         }  
   
         if (pParam->fbase > 65535) {  
                 float div = (float) pParam->fbase / 65535;  
101    
102                  pParam->fbase = (int) (pParam->fbase / div);          while ((r = a % b)) {
103                  pParam->fincr = (int) (pParam->fincr / div);                  a = b;
104                    b = r;
105            }
106            return b;
107          }          }
108    
109          /* Bitrate allocator defaults */  static void
110    simplify_time(int *inc, int *base)
111          if (pParam->rc_bitrate <= 0)  {
112                  pParam->rc_bitrate = 900000;          /* common factor */
113            const int s = gcd(*inc, *base);
114      *inc  /= s;
115      *base /= s;
116    
117          if (pParam->rc_reaction_delay_factor <= 0)          if (*base > 65535 || *inc > 65535) {
118                  pParam->rc_reaction_delay_factor = 16;                  int *biggest;
119                    int *other;
120                    float div;
121    
122          if (pParam->rc_averaging_period <= 0)                  if (*base > *inc) {
123                  pParam->rc_averaging_period = 100;                          biggest = base;
124                            other = inc;
125                    } else {
126                            biggest = inc;
127                            other = base;
128                    }
129    
130          if (pParam->rc_buffer <= 0)                  div = ((float)*biggest)/((float)65535);
131                  pParam->rc_buffer = 100;                  *biggest = (unsigned int)(((float)*biggest)/div);
132                    *other = (unsigned int)(((float)*other)/div);
133            }
134    }
135    
         /* Max and min quantizers */  
136    
137          if ((pParam->min_quantizer <= 0) || (pParam->min_quantizer > 31))  int
138                  pParam->min_quantizer = 1;  enc_create(xvid_enc_create_t * create)
139    {
140            Encoder *pEnc;
141            int n;
142    
143          if ((pParam->max_quantizer <= 0) || (pParam->max_quantizer > 31))          if (XVID_VERSION_MAJOR(create->version) != 1) /* v1.x.x */
144                  pParam->max_quantizer = 31;                  return XVID_ERR_VERSION;
145    
146          if (pParam->max_quantizer < pParam->min_quantizer)          if (create->width%2 || create->height%2)
147                  pParam->max_quantizer = pParam->min_quantizer;                  return XVID_ERR_FAIL;
148    
149          /* 1 keyframe each 10 seconds */          if (create->width<=0 || create->height<=0)
150                    return XVID_ERR_FAIL;
151    
152          if (pParam->max_key_interval <= 0)          /* allocate encoder struct */
                 pParam->max_key_interval = 10 * pParam->fincr / pParam->fbase;  
153    
154          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);
155          if (pEnc == NULL)          if (pEnc == NULL)
156                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
   
         /* Zero the Encoder Structure */  
   
157          memset(pEnc, 0, sizeof(Encoder));          memset(pEnc, 0, sizeof(Encoder));
158    
159          /* Fill members of Encoder structure */          pEnc->mbParam.profile = create->profile;
   
         pEnc->mbParam.width = pParam->width;  
         pEnc->mbParam.height = pParam->height;  
160    
161            /* global flags */
162            pEnc->mbParam.global_flags = create->global;
163      if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED))
164        pEnc->mbParam.global_flags |= XVID_GLOBAL_DIVX5_USERDATA;
165    
166            /* width, height */
167            pEnc->mbParam.width = create->width;
168            pEnc->mbParam.height = create->height;
169          pEnc->mbParam.mb_width = (pEnc->mbParam.width + 15) / 16;          pEnc->mbParam.mb_width = (pEnc->mbParam.width + 15) / 16;
170          pEnc->mbParam.mb_height = (pEnc->mbParam.height + 15) / 16;          pEnc->mbParam.mb_height = (pEnc->mbParam.height + 15) / 16;
   
171          pEnc->mbParam.edged_width = 16 * pEnc->mbParam.mb_width + 2 * EDGE_SIZE;          pEnc->mbParam.edged_width = 16 * pEnc->mbParam.mb_width + 2 * EDGE_SIZE;
172          pEnc->mbParam.edged_height = 16 * pEnc->mbParam.mb_height + 2 * EDGE_SIZE;          pEnc->mbParam.edged_height = 16 * pEnc->mbParam.mb_height + 2 * EDGE_SIZE;
173    
174          pEnc->mbParam.fbase = pParam->fbase;          /* framerate */
175          pEnc->mbParam.fincr = pParam->fincr;          pEnc->mbParam.fincr = MAX(create->fincr, 0);
176            pEnc->mbParam.fbase = create->fincr <= 0 ? 25 : create->fbase;
177            if (pEnc->mbParam.fincr>0)
178                    simplify_time((int*)&pEnc->mbParam.fincr, (int*)&pEnc->mbParam.fbase);
179    
180            /* zones */
181            if(create->num_zones > 0) {
182                    pEnc->num_zones = create->num_zones;
183                    pEnc->zones = xvid_malloc(sizeof(xvid_enc_zone_t) * pEnc->num_zones, CACHE_LINE);
184                    if (pEnc->zones == NULL)
185                            goto xvid_err_memory0;
186                    memcpy(pEnc->zones, create->zones, sizeof(xvid_enc_zone_t) * pEnc->num_zones);
187            } else {
188                    pEnc->num_zones = 0;
189                    pEnc->zones = NULL;
190            }
191    
192            /* plugins */
193            if(create->num_plugins > 0) {
194                    pEnc->num_plugins = create->num_plugins;
195                    pEnc->plugins = xvid_malloc(sizeof(xvid_enc_plugin_t) * pEnc->num_plugins, CACHE_LINE);
196                    if (pEnc->plugins == NULL)
197                            goto xvid_err_memory0;
198            } else {
199                    pEnc->num_plugins = 0;
200                    pEnc->plugins = NULL;
201            }
202    
203          pEnc->mbParam.m_quant_type = H263_QUANT;          for (n=0; n<pEnc->num_plugins;n++) {
204                    xvid_plg_create_t pcreate;
205                    xvid_plg_info_t pinfo;
206    
207                    memset(&pinfo, 0, sizeof(xvid_plg_info_t));
208                    pinfo.version = XVID_VERSION;
209                    if (create->plugins[n].func(NULL, XVID_PLG_INFO, &pinfo, NULL) >= 0) {
210                            pEnc->mbParam.plugin_flags |= pinfo.flags;
211                    }
212    
213          pEnc->sStat.fMvPrevSigma = -1;                  memset(&pcreate, 0, sizeof(xvid_plg_create_t));
214                    pcreate.version = XVID_VERSION;
215                    pcreate.num_zones = pEnc->num_zones;
216                    pcreate.zones = pEnc->zones;
217                    pcreate.width = pEnc->mbParam.width;
218                    pcreate.height = pEnc->mbParam.height;
219                    pcreate.mb_width = pEnc->mbParam.mb_width;
220                    pcreate.mb_height = pEnc->mbParam.mb_height;
221                    pcreate.fincr = pEnc->mbParam.fincr;
222                    pcreate.fbase = pEnc->mbParam.fbase;
223                    pcreate.param = create->plugins[n].param;
224    
225          /* Fill rate control parameters */                  pEnc->plugins[n].func = NULL;   /* disable plugins that fail */
226                    if (create->plugins[n].func(NULL, XVID_PLG_CREATE, &pcreate, &pEnc->plugins[n].param) >= 0) {
227                            pEnc->plugins[n].func = create->plugins[n].func;
228                    }
229            }
230    
231          pEnc->bitrate = pParam->rc_bitrate;          if ((pEnc->mbParam.global_flags & XVID_GLOBAL_EXTRASTATS_ENABLE) ||
232                    (pEnc->mbParam.plugin_flags & XVID_REQPSNR)) {
233                    pEnc->mbParam.plugin_flags |= XVID_REQORIGINAL; /* psnr calculation requires the original */
234            }
235    
236          pEnc->iFrameNum = 0;          /* temp dquants */
237          pEnc->iMaxKeyInterval = pParam->max_key_interval;          if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
238                    pEnc->temp_dquants = (int *) xvid_malloc(pEnc->mbParam.mb_width *
239                                                    pEnc->mbParam.mb_height * sizeof(int), CACHE_LINE);
240                    if (pEnc->temp_dquants==NULL)
241                            goto xvid_err_memory1a;
242            }
243    
244            /* temp lambdas */
245            if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
246                    pEnc->temp_lambda = (float *) xvid_malloc(pEnc->mbParam.mb_width *
247                                                    pEnc->mbParam.mb_height * 6 * sizeof(float), CACHE_LINE);
248                    if (pEnc->temp_lambda == NULL)
249                            goto xvid_err_memory1a;
250            }
251    
252            /* bframes */
253            pEnc->mbParam.max_bframes = MAX(create->max_bframes, 0);
254            pEnc->mbParam.bquant_ratio = MAX(create->bquant_ratio, 0);
255            pEnc->mbParam.bquant_offset = create->bquant_offset;
256    
257            /* min/max quant */
258            for (n=0; n<3; n++) {
259                    pEnc->mbParam.min_quant[n] = create->min_quant[n] > 0 ? create->min_quant[n] : 2;
260                    pEnc->mbParam.max_quant[n] = create->max_quant[n] > 0 ? create->max_quant[n] : 31;
261            }
262    
263            /* frame drop ratio */
264            pEnc->mbParam.frame_drop_ratio = MAX(create->frame_drop_ratio, 0);
265    
266            /* max keyframe interval */
267            pEnc->mbParam.iMaxKeyInterval = create->max_key_interval <= 0 ? (10 * (int)pEnc->mbParam.fbase) / (int)pEnc->mbParam.fincr : create->max_key_interval;
268    
269          /* try to allocate frame memory */          /* allocate working frame-image memory */
270    
271          pEnc->current = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);          pEnc->current = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
272          pEnc->reference = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);          pEnc->reference = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
# Line 241  Line 274 
274          if (pEnc->current == NULL || pEnc->reference == NULL)          if (pEnc->current == NULL || pEnc->reference == NULL)
275                  goto xvid_err_memory1;                  goto xvid_err_memory1;
276    
277          /* try to allocate mb memory */          /* allocate macroblock memory */
278    
279          pEnc->current->mbs =          pEnc->current->mbs =
280                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
# Line 253  Line 286 
286          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)
287                  goto xvid_err_memory2;                  goto xvid_err_memory2;
288    
289          /* try to allocate image memory */          /* allocate quant matrix memory */
290    
291  #ifdef _DEBUG_PSNR          pEnc->mbParam.mpeg_quant_matrices =
292                    xvid_malloc(sizeof(uint16_t) * 64 * 8, CACHE_LINE);
293    
294            if (pEnc->mbParam.mpeg_quant_matrices == NULL)
295                    goto xvid_err_memory2a;
296    
297            /* allocate interpolation image memory */
298    
299            if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
300          image_null(&pEnc->sOriginal);          image_null(&pEnc->sOriginal);
301  #endif                  image_null(&pEnc->sOriginal2);
302            }
303    
304          image_null(&pEnc->f_refh);          image_null(&pEnc->f_refh);
305          image_null(&pEnc->f_refv);          image_null(&pEnc->f_refv);
# Line 267  Line 309 
309          image_null(&pEnc->reference->image);          image_null(&pEnc->reference->image);
310          image_null(&pEnc->vInterH);          image_null(&pEnc->vInterH);
311          image_null(&pEnc->vInterV);          image_null(&pEnc->vInterV);
         image_null(&pEnc->vInterVf);  
312          image_null(&pEnc->vInterHV);          image_null(&pEnc->vInterHV);
         image_null(&pEnc->vInterHVf);  
313    
314  #ifdef _DEBUG_PSNR          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
315          if (image_create          if (image_create
316                  (&pEnc->sOriginal, pEnc->mbParam.edged_width,                  (&pEnc->sOriginal, pEnc->mbParam.edged_width,
317                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
318                  goto xvid_err_memory3;                  goto xvid_err_memory3;
319  #endif  
320                    if (image_create
321                            (&pEnc->sOriginal2, pEnc->mbParam.edged_width,
322                             pEnc->mbParam.edged_height) < 0)
323                            goto xvid_err_memory3;
324            }
325    
326          if (image_create          if (image_create
327                  (&pEnc->f_refh, pEnc->mbParam.edged_width,                  (&pEnc->f_refh, pEnc->mbParam.edged_width,
# Line 308  Line 353 
353                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
354                  goto xvid_err_memory3;                  goto xvid_err_memory3;
355          if (image_create          if (image_create
                 (&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                  pEnc->mbParam.edged_height) < 0)  
                 goto xvid_err_memory3;  
         if (image_create  
356                  (&pEnc->vInterHV, pEnc->mbParam.edged_width,                  (&pEnc->vInterHV, pEnc->mbParam.edged_width,
357                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
358                  goto xvid_err_memory3;                  goto xvid_err_memory3;
359    
360    /* Create full bitplane for GMC, this might be wasteful */
361          if (image_create          if (image_create
362                  (&pEnc->vInterHVf, pEnc->mbParam.edged_width,                  (&pEnc->vGMC, pEnc->mbParam.edged_width,
363                   pEnc->mbParam.edged_height) < 0)                   pEnc->mbParam.edged_height) < 0)
364                  goto xvid_err_memory3;                  goto xvid_err_memory3;
365    
366            /* init bframe image buffers */
367    
368            pEnc->bframenum_head = 0;
369            pEnc->bframenum_tail = 0;
370            pEnc->flush_bframes = 0;
371            pEnc->closed_bframenum = -1;
372    
373          /* B Frames specific init */          /* B Frames specific init */
   
         pEnc->global = pParam->global;  
         pEnc->mbParam.max_bframes = pParam->max_bframes;  
         pEnc->bquant_ratio = pParam->bquant_ratio;  
         pEnc->bquant_offset = pParam->bquant_offset;  
         pEnc->frame_drop_ratio = pParam->frame_drop_ratio;  
374          pEnc->bframes = NULL;          pEnc->bframes = NULL;
375    
376          if (pEnc->mbParam.max_bframes > 0) {          if (pEnc->mbParam.max_bframes > 0) {
                 int n;  
377    
378                  pEnc->bframes =                  pEnc->bframes =
379                          xvid_malloc(pEnc->mbParam.max_bframes * sizeof(FRAMEINFO *),                          xvid_malloc(pEnc->mbParam.max_bframes * sizeof(FRAMEINFO *),
# Line 368  Line 409 
409                  }                  }
410          }          }
411    
412          pEnc->bframenum_head = 0;          /* init incoming frame queue */
413          pEnc->bframenum_tail = 0;          pEnc->queue_head = 0;
414          pEnc->flush_bframes = 0;          pEnc->queue_tail = 0;
415          pEnc->bframenum_dx50bvop = -1;          pEnc->queue_size = 0;
   
         pEnc->queue = NULL;  
   
   
         if (pEnc->mbParam.max_bframes > 0) {  
                 int n;  
416    
417                  pEnc->queue =                  pEnc->queue =
418                          xvid_malloc(pEnc->mbParam.max_bframes * sizeof(IMAGE),                  xvid_malloc((pEnc->mbParam.max_bframes+1) * sizeof(QUEUEINFO),
419                                                  CACHE_LINE);                                                  CACHE_LINE);
420    
421                  if (pEnc->queue == NULL)                  if (pEnc->queue == NULL)
422                          goto xvid_err_memory4;                          goto xvid_err_memory4;
423    
424                  for (n = 0; n < pEnc->mbParam.max_bframes; n++)          for (n = 0; n < pEnc->mbParam.max_bframes+1; n++)
425                          image_null(&pEnc->queue[n]);                  image_null(&pEnc->queue[n].image);
426    
427                  for (n = 0; n < pEnc->mbParam.max_bframes; n++) {  
428            for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
429                          if (image_create                          if (image_create
430                                  (&pEnc->queue[n], pEnc->mbParam.edged_width,                          (&pEnc->queue[n].image, pEnc->mbParam.edged_width,
431                                   pEnc->mbParam.edged_height) < 0)                                   pEnc->mbParam.edged_height) < 0)
432                                  goto xvid_err_memory5;                                  goto xvid_err_memory5;
   
                 }  
433          }          }
434    
435          pEnc->queue_head = 0;          /* timestamp stuff */
         pEnc->queue_tail = 0;  
         pEnc->queue_size = 0;  
436    
437          pEnc->mbParam.m_stamp = 0;          pEnc->mbParam.m_stamp = 0;
438            pEnc->m_framenum = create->start_frame_num;
         pEnc->m_framenum = 0;  
439          pEnc->current->stamp = 0;          pEnc->current->stamp = 0;
440          pEnc->reference->stamp = 0;          pEnc->reference->stamp = 0;
441    
442          pParam->handle = (void *) pEnc;          /* other stuff */
443    
444            pEnc->iFrameNum = 0;
445            pEnc->fMvPrevSigma = -1;
446    
447            /* slices */
448            pEnc->num_slices = MIN(MAX(1, create->num_slices), (int) pEnc->mbParam.mb_height);
449    
450            /* multithreaded stuff */
451            if (create->num_threads > 0) {
452                    int t = MIN(create->num_threads, (int) (pEnc->mbParam.mb_height>>1)); /* at least two rows per thread */
453                    int threads_per_slice = MAX(1, (t / pEnc->num_slices));
454                    int rows_per_thread = (pEnc->mbParam.mb_height + threads_per_slice - 1) / threads_per_slice;
455    
456                    pEnc->num_threads = t;
457                    pEnc->smpData = xvid_malloc(t*sizeof(SMPData), CACHE_LINE);
458                    if (!pEnc->smpData)
459                            goto xvid_err_nosmp;
460    
461                    /* tmp bitstream buffer for slice coding */
462                    pEnc->smpData[0].tmp_buffer = xvid_malloc(16*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height*sizeof(uint8_t), CACHE_LINE);
463                    if (! pEnc->smpData[0].tmp_buffer) goto xvid_err_nosmp;
464    
465                    for (n = 0; n < t; n++) {
466                            int s = MIN(pEnc->num_threads, pEnc->num_slices);
467    
468                            pEnc->smpData[n].complete_count_self =
469                                    xvid_malloc(rows_per_thread * sizeof(int), CACHE_LINE);
470    
471          if (pParam->rc_bitrate) {                          if (!pEnc->smpData[n].complete_count_self)
472                  RateControlInit(&pEnc->rate_control, pParam->rc_bitrate,                                  goto xvid_err_nosmp;
473                                                  pParam->rc_reaction_delay_factor,  
474                                                  pParam->rc_averaging_period, pParam->rc_buffer,                          if (n > 0 && n < s) {
475                                                  pParam->fbase * 1000 / pParam->fincr,                                  pEnc->smpData[n].bs = (Bitstream *) xvid_malloc(sizeof(Bitstream), CACHE_LINE);
476                                                  pParam->max_quantizer, pParam->min_quantizer);                                  if (!pEnc->smpData[n].bs)
477                                            goto xvid_err_nosmp;
478    
479                                    pEnc->smpData[n].sStat = (Statistics *) xvid_malloc(sizeof(Statistics), CACHE_LINE);
480                                    if (!pEnc->smpData[n].sStat)
481                                            goto xvid_err_nosmp;
482    
483                                    pEnc->smpData[n].tmp_buffer = pEnc->smpData[0].tmp_buffer + 16*(((n-1)*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height)/s);
484                                    BitstreamInit(pEnc->smpData[n].bs, pEnc->smpData[n].tmp_buffer, 0);
485                            }
486    
487                            if (n != 0)
488                                    pEnc->smpData[n].complete_count_above =
489                                            pEnc->smpData[n-1].complete_count_self;
490                    }
491                    pEnc->smpData[0].complete_count_above =
492                            pEnc->smpData[t-1].complete_count_self - 1;
493    
494            } else {
495      xvid_err_nosmp:
496                    /* no SMP */
497                    if (pEnc->smpData) {
498                            if (pEnc->smpData[0].tmp_buffer)
499                                    xvid_free(pEnc->smpData[0].tmp_buffer);
500          }          }
501                    else {
502                            pEnc->smpData = xvid_malloc(1*sizeof(SMPData), CACHE_LINE);
503                            if (pEnc->smpData == NULL)
504                                    goto xvid_err_memory5;
505                    }
506    
507                    create->num_threads = 0;
508            }
509    
510            create->handle = (void *) pEnc;
511    
512          init_timer();          init_timer();
513            init_mpeg_matrix(pEnc->mbParam.mpeg_quant_matrices);
514    
515          return XVID_ERR_OK;          return 0;   /* ok */
516    
517          /*          /*
518           * We handle all XVID_ERR_MEMORY here, this makes the code lighter           * We handle all XVID_ERR_MEMORY here, this makes the code lighter
# Line 428  Line 520 
520    
521    xvid_err_memory5:    xvid_err_memory5:
522    
523            for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
524          if (pEnc->mbParam.max_bframes > 0) {                          image_destroy(&pEnc->queue[n].image, pEnc->mbParam.edged_width,
   
                 for (i = 0; i < pEnc->mbParam.max_bframes; i++) {  
                         image_destroy(&pEnc->queue[i], pEnc->mbParam.edged_width,  
525                                                    pEnc->mbParam.edged_height);                                                    pEnc->mbParam.edged_height);
526                  }                  }
527    
528                  xvid_free(pEnc->queue);                  xvid_free(pEnc->queue);
         }  
529    
530    xvid_err_memory4:    xvid_err_memory4:
531    
532          if (pEnc->mbParam.max_bframes > 0) {          if (pEnc->mbParam.max_bframes > 0) {
533                    int i;
534    
535                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
536    
# Line 449  Line 539 
539    
540                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
541                                                    pEnc->mbParam.edged_height);                                                    pEnc->mbParam.edged_height);
   
542                          xvid_free(pEnc->bframes[i]->mbs);                          xvid_free(pEnc->bframes[i]->mbs);
   
543                          xvid_free(pEnc->bframes[i]);                          xvid_free(pEnc->bframes[i]);
   
544                  }                  }
545    
546                  xvid_free(pEnc->bframes);                  xvid_free(pEnc->bframes);
547          }          }
548    
549    xvid_err_memory3:    xvid_err_memory3:
550  #ifdef _DEBUG_PSNR  
551            if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
552          image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,          image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
553                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
554  #endif                  image_destroy(&pEnc->sOriginal2, pEnc->mbParam.edged_width,
555                                              pEnc->mbParam.edged_height);
556            }
557    
558          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
559                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
# Line 480  Line 570 
570                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
571          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
572                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
573          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
574                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
575          image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,  
576    /* destroy GMC image */
577            image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
578                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
579    
580      xvid_err_memory2a:
581            xvid_free(pEnc->mbParam.mpeg_quant_matrices);
582    
583    xvid_err_memory2:    xvid_err_memory2:
584          xvid_free(pEnc->current->mbs);          xvid_free(pEnc->current->mbs);
585          xvid_free(pEnc->reference->mbs);          xvid_free(pEnc->reference->mbs);
# Line 494  Line 587 
587    xvid_err_memory1:    xvid_err_memory1:
588          xvid_free(pEnc->current);          xvid_free(pEnc->current);
589          xvid_free(pEnc->reference);          xvid_free(pEnc->reference);
590    
591      xvid_err_memory1a:
592            if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
593                    xvid_free(pEnc->temp_dquants);
594            }
595    
596            if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
597                    xvid_free(pEnc->temp_lambda);
598            }
599    
600      xvid_err_memory0:
601            for (n=0; n<pEnc->num_plugins;n++) {
602                    if (pEnc->plugins[n].func) {
603                            pEnc->plugins[n].func(pEnc->plugins[n].param, XVID_PLG_DESTROY, NULL, NULL);
604                    }
605            }
606            xvid_free(pEnc->plugins);
607    
608            xvid_free(pEnc->zones);
609    
610          xvid_free(pEnc);          xvid_free(pEnc);
611    
612          pParam->handle = NULL;          create->handle = NULL;
613    
614          return XVID_ERR_MEMORY;          return XVID_ERR_MEMORY;
615  }  }
# Line 505  Line 618 
618   * Encoder destruction   * Encoder destruction
619   *   *
620   * This function destroy the entire encoder structure created by a previous   * This function destroy the entire encoder structure created by a previous
621   * successful encoder_create call.   * successful enc_create call.
622   *   *
623   * Returned values (for now only one returned value) :   * Returned values (for now only one returned value) :
624   *    - XVID_ERR_OK     - no errors   *      - 0      - no errors
625   *   *
626   ****************************************************************************/   ****************************************************************************/
627    
628  int  int
629  encoder_destroy(Encoder * pEnc)  enc_destroy(Encoder * pEnc)
630  {  {
631          int i;          int i;
632    
         ENC_CHECK(pEnc);  
   
633          /* B Frames specific */          /* B Frames specific */
634          if (pEnc->mbParam.max_bframes > 0) {          for (i = 0; i < pEnc->mbParam.max_bframes+1; i++) {
635                    image_destroy(&pEnc->queue[i].image, pEnc->mbParam.edged_width,
                 for (i = 0; i < pEnc->mbParam.max_bframes; i++) {  
   
                         image_destroy(&pEnc->queue[i], pEnc->mbParam.edged_width,  
636                                            pEnc->mbParam.edged_height);                                            pEnc->mbParam.edged_height);
637                  }                  }
                 xvid_free(pEnc->queue);  
         }  
638    
639            xvid_free(pEnc->queue);
640    
641          if (pEnc->mbParam.max_bframes > 0) {          if (pEnc->mbParam.max_bframes > 0) {
642    
# Line 540  Line 647 
647    
648                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,                          image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
649                                            pEnc->mbParam.edged_height);                                            pEnc->mbParam.edged_height);
   
650                          xvid_free(pEnc->bframes[i]->mbs);                          xvid_free(pEnc->bframes[i]->mbs);
   
651                          xvid_free(pEnc->bframes[i]);                          xvid_free(pEnc->bframes[i]);
652                  }                  }
653    
# Line 560  Line 665 
665                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
666          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
667                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
668          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
669                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
         image_destroy(&pEnc->vInterHVf, pEnc->mbParam.edged_width,  
                                   pEnc->mbParam.edged_height);  
   
670          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
671                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
672          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
673                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
674          image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,          image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,
675                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
676            image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
677                                      pEnc->mbParam.edged_height);
678    
679  #ifdef _DEBUG_PSNR          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
680          image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,          image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
681                                    pEnc->mbParam.edged_height);                                    pEnc->mbParam.edged_height);
682  #endif                  image_destroy(&pEnc->sOriginal2, pEnc->mbParam.edged_width,
683                                              pEnc->mbParam.edged_height);
684            }
685    
686          /* Encoder structure */          /* Encoder structure */
687    
# Line 587  Line 691 
691          xvid_free(pEnc->reference->mbs);          xvid_free(pEnc->reference->mbs);
692          xvid_free(pEnc->reference);          xvid_free(pEnc->reference);
693    
694          xvid_free(pEnc);          if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
695                    xvid_free(pEnc->temp_dquants);
         return XVID_ERR_OK;  
696  }  }
697    
698            if ((pEnc->mbParam.plugin_flags & XVID_REQLAMBDA)) {
699  static __inline void inc_frame_num(Encoder * pEnc)                  xvid_free(pEnc->temp_lambda);
 {  
         pEnc->current->stamp = pEnc->mbParam.m_stamp;   // first frame is zero  
         pEnc->mbParam.m_stamp += pEnc->mbParam.fincr;  
700  }  }
701    
702            if (pEnc->num_plugins>0) {
703                    xvid_plg_destroy_t pdestroy;
704                    memset(&pdestroy, 0, sizeof(xvid_plg_destroy_t));
705    
706  static __inline void                  pdestroy.version = XVID_VERSION;
707  queue_image(Encoder * pEnc, XVID_ENC_FRAME * pFrame)                  pdestroy.num_frames = pEnc->m_framenum;
 {  
         if (pEnc->queue_size >= pEnc->mbParam.max_bframes)  
         {  
                 DPRINTF(DPRINTF_DEBUG,"FATAL: QUEUE FULL");  
                 return;  
         }  
708    
709          DPRINTF(DPRINTF_DEBUG,"*** QUEUE bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",                  for (i=0; i<pEnc->num_plugins;i++) {
710                                  pEnc->bframenum_head, pEnc->bframenum_tail,                          if (pEnc->plugins[i].func) {
711                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->plugins[i].func(pEnc->plugins[i].param, XVID_PLG_DESTROY, &pdestroy, NULL);
712                            }
713                    }
714                    xvid_free(pEnc->plugins);
715            }
716    
717            xvid_free(pEnc->mbParam.mpeg_quant_matrices);
718    
719          start_timer();          if (pEnc->num_zones > 0)
720          if (image_input                  xvid_free(pEnc->zones);
                 (&pEnc->queue[pEnc->queue_tail], pEnc->mbParam.width, pEnc->mbParam.height,  
                  pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING))  
                 return;  
         stop_conv_timer();  
721    
722          pEnc->queue_size++;          if (pEnc->num_threads > 0) {
723          pEnc->queue_tail =  (pEnc->queue_tail + 1) % pEnc->mbParam.max_bframes;                  for (i = 1; i < MAX(1, MIN(pEnc->num_threads, pEnc->num_slices)); i++) {
724                            xvid_free(pEnc->smpData[i].bs);
725                            xvid_free(pEnc->smpData[i].sStat);
726  }  }
727                    if (pEnc->smpData[0].tmp_buffer) xvid_free(pEnc->smpData[0].tmp_buffer);
728    
729  static __inline void                  for (i = 0; i < pEnc->num_threads; i++)
730  set_timecodes(FRAMEINFO* pCur,FRAMEINFO *pRef, int32_t time_base)                          xvid_free(pEnc->smpData[i].complete_count_self);
731  {          }
732            xvid_free(pEnc->smpData);
                 pCur->ticks = (int32_t)pCur->stamp % time_base;  
                 pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;  
   
                 //HEAVY DEBUG OUTPUT    remove when timecodes prove to be stable  
733    
734  /*              fprintf(stderr,"WriteVop:   %d - %d \n",          xvid_free(pEnc);
                         ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));  
                 fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",  
                         pCur->coding_type, pCur->stamp, pRef->stamp, time_base);  
                 fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",  
                         pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);  
735    
736  */          return 0;  /* ok */
737  }  }
738    
739    
740    /*
741      call the plugins
742      */
743    
744    static void call_plugins(Encoder * pEnc, FRAMEINFO * frame, IMAGE * original,
745                                                     int opt, int * type, int * quant, xvid_enc_stats_t * stats)
746    {
747            unsigned int i, j, k;
748            xvid_plg_data_t data;
749    
750            /* set data struct */
751    
752  /*****************************************************************************          memset(&data, 0, sizeof(xvid_plg_data_t));
753   * IPB frame encoder entry point          data.version = XVID_VERSION;
754   *  
755   * Returned values :          /* find zone */
756   *    - XVID_ERR_OK     - no errors          for(i=0; i<pEnc->num_zones && pEnc->zones[i].frame<=frame->frame_num; i++) ;
757   *    - XVID_ERR_FORMAT - the image subsystem reported the image had a wrong          data.zone = i>0 ? &pEnc->zones[i-1] : NULL;
758   *                        format  
759   ****************************************************************************/          data.width = pEnc->mbParam.width;
760            data.height = pEnc->mbParam.height;
761  int          data.mb_width = pEnc->mbParam.mb_width;
762  encoder_encode_bframes(Encoder * pEnc,          data.mb_height = pEnc->mbParam.mb_height;
763                             XVID_ENC_FRAME * pFrame,          data.fincr = frame->fincr;
764                             XVID_ENC_STATS * pResult)          data.fbase = pEnc->mbParam.fbase;
765  {          data.bquant_ratio = pEnc->mbParam.bquant_ratio;
766          uint16_t x, y;          data.bquant_offset = pEnc->mbParam.bquant_offset;
767          Bitstream bs;  
768          uint32_t bits, mode;          for (i=0; i<3; i++) {
769                    data.min_quant[i] = pEnc->mbParam.min_quant[i];
770                    data.max_quant[i] = pEnc->mbParam.max_quant[i];
771            }
772    
773            data.reference.csp = XVID_CSP_PLANAR;
774            data.reference.plane[0] = pEnc->reference->image.y;
775            data.reference.plane[1] = pEnc->reference->image.u;
776            data.reference.plane[2] = pEnc->reference->image.v;
777            data.reference.stride[0] = pEnc->mbParam.edged_width;
778            data.reference.stride[1] = pEnc->mbParam.edged_width/2;
779            data.reference.stride[2] = pEnc->mbParam.edged_width/2;
780    
781            data.current.csp = XVID_CSP_PLANAR;
782            data.current.plane[0] = frame->image.y;
783            data.current.plane[1] = frame->image.u;
784            data.current.plane[2] = frame->image.v;
785            data.current.stride[0] = pEnc->mbParam.edged_width;
786            data.current.stride[1] = pEnc->mbParam.edged_width/2;
787            data.current.stride[2] = pEnc->mbParam.edged_width/2;
788    
789            data.frame_num = frame->frame_num;
790    
791            if (opt == XVID_PLG_BEFORE) {
792                    data.type = *type;
793                    data.quant = *quant;
794    
795                    data.vol_flags = frame->vol_flags;
796                    data.vop_flags = frame->vop_flags;
797                    data.motion_flags = frame->motion_flags;
798    
799            } else if (opt == XVID_PLG_FRAME) {
800                    data.type = coding2type(frame->coding_type);
801                    data.quant = frame->quant;
802    
803                    if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
804                            data.dquant = pEnc->temp_dquants;
805                            data.dquant_stride = pEnc->mbParam.mb_width;
806                            memset(data.dquant, 0, data.mb_width*data.mb_height*sizeof(int));
807                    }
808    
809          int input_valid = 1;                  if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
810          int bframes_count = 0;                          int block = 0;
811                            emms();
812                            data.lambda = pEnc->temp_lambda;
813                            for(i = 0;i < pEnc->mbParam.mb_height; i++)
814                                    for(j = 0;j < pEnc->mbParam.mb_width; j++)
815                                            for (k = 0; k < 6; k++)
816                                                    data.lambda[block++] = 1.0f;
817                    }
818    
819            } else { /* XVID_PLG_AFTER */
820                    if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
821                            data.original.csp = XVID_CSP_PLANAR;
822                            data.original.plane[0] = original->y;
823                            data.original.plane[1] = original->u;
824                            data.original.plane[2] = original->v;
825                            data.original.stride[0] = pEnc->mbParam.edged_width;
826                            data.original.stride[1] = pEnc->mbParam.edged_width/2;
827                            data.original.stride[2] = pEnc->mbParam.edged_width/2;
828                    }
829    
830  #ifdef _DEBUG_PSNR                  if ((frame->vol_flags & XVID_VOL_EXTRASTATS) ||
831          float psnr;                          (pEnc->mbParam.plugin_flags & XVID_REQPSNR)) {
         char temp[128];  
 #endif  
832    
833          ENC_CHECK(pEnc);                          data.sse_y =
834          ENC_CHECK(pFrame);                                  plane_sse( original->y, frame->image.y,
835          ENC_CHECK(pFrame->image);                                                     pEnc->mbParam.edged_width, pEnc->mbParam.width,
836                                                       pEnc->mbParam.height);
837    
838          start_global_timer();                          data.sse_u =
839                                    plane_sse( original->u, frame->image.u,
840                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
841                                                       pEnc->mbParam.height/2);
842    
843                            data.sse_v =
844                                    plane_sse( original->v, frame->image.v,
845                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
846                                                       pEnc->mbParam.height/2);
847                    }
848    
849                    data.type = coding2type(frame->coding_type);
850                    data.quant = frame->quant;
851    
852                    if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
853                            data.dquant = pEnc->temp_dquants;
854                            data.dquant_stride = pEnc->mbParam.mb_width;
855    
856                            for (j=0; j<pEnc->mbParam.mb_height; j++)
857                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
858                                    data.dquant[j*data.dquant_stride + i] = frame->mbs[j*pEnc->mbParam.mb_width + i].dquant;
859                            }
860                    }
861    
862          BitstreamInit(&bs, pFrame->bitstream, 0);                  data.vol_flags = frame->vol_flags;
863                    data.vop_flags = frame->vop_flags;
864                    data.motion_flags = frame->motion_flags;
865    
866                    data.length = frame->length;
867                    data.kblks = frame->sStat.kblks;
868                    data.mblks = frame->sStat.mblks;
869                    data.ublks = frame->sStat.ublks;
870    
871                    /* New code */
872                    data.stats.type      = coding2type(frame->coding_type);
873                    data.stats.quant     = frame->quant;
874                    data.stats.vol_flags = frame->vol_flags;
875                    data.stats.vop_flags = frame->vop_flags;
876                    data.stats.length    = frame->length;
877                    data.stats.hlength   = frame->length - (frame->sStat.iTextBits / 8);
878                    data.stats.kblks     = frame->sStat.kblks;
879                    data.stats.mblks     = frame->sStat.mblks;
880                    data.stats.ublks     = frame->sStat.ublks;
881                    data.stats.sse_y     = data.sse_y;
882                    data.stats.sse_u     = data.sse_u;
883                    data.stats.sse_v     = data.sse_v;
884    
885  ipvop_loop:                  if (stats)
886                            *stats = data.stats;
887            }
888    
889          /*          /* call plugins */
890           * bframe "flush" code          for (i=0; i<(unsigned int)pEnc->num_plugins;i++) {
891           */                  emms();
892                    if (pEnc->plugins[i].func) {
893                            if (pEnc->plugins[i].func(pEnc->plugins[i].param, opt, &data, NULL) < 0) {
894                                    continue;
895                            }
896                    }
897            }
898            emms();
899    
900          if ((pFrame->image == NULL || pEnc->flush_bframes)          /* copy modified values back into frame*/
901                  && (pEnc->bframenum_head < pEnc->bframenum_tail)) {          if (opt == XVID_PLG_BEFORE) {
902                    *type = data.type;
903                    *quant = data.quant > 0 ? data.quant : 2;   /* default */
904    
905                    frame->vol_flags = data.vol_flags;
906                    frame->vop_flags = data.vop_flags;
907                    frame->motion_flags = data.motion_flags;
908    
909            } else if (opt == XVID_PLG_FRAME) {
910    
911                    if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
912                            for (j=0; j<pEnc->mbParam.mb_height; j++)
913                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
914                                    frame->mbs[j*pEnc->mbParam.mb_width + i].dquant = data.dquant[j*data.mb_width + i];
915                            }
916                    } else {
917                            for (j=0; j<pEnc->mbParam.mb_height; j++)
918                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
919                                    frame->mbs[j*pEnc->mbParam.mb_width + i].dquant = 0;
920                            }
921                    }
922    
923                  if (pEnc->flush_bframes == 0) {                  if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
924                          /*                          for (j = 0; j < pEnc->mbParam.mb_height; j++)
925                           * we have reached the end of stream without getting                                  for (i = 0; i < pEnc->mbParam.mb_width; i++)
926                           * a future reference frame... so encode last final                                          for (k = 0; k < 6; k++) {
927                           * frame as a pframe                                                  frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] =
928                           */                                                          (int) ((float)(1<<LAMBDA_EXP) * data.lambda[6 * (j * data.mb_width + i) + k]);
929                                            }
930                    } else {
931                            for (j = 0; j<pEnc->mbParam.mb_height; j++)
932                                    for (i = 0; i<pEnc->mbParam.mb_width; i++)
933                                            for (k = 0; k < 6; k++) {
934                                                    frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] = 1<<LAMBDA_EXP;
935                                            }
936                    }
937    
                         DPRINTF(DPRINTF_DEBUG,"*** BFRAME (final frame) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",  
                                 pEnc->bframenum_head, pEnc->bframenum_tail,  
                                 pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);  
938    
939                          pEnc->bframenum_tail--;                  frame->mbs[0].quant = data.quant; /* FRAME will not affect the quant in stats */
940                          SWAP(pEnc->current, pEnc->reference);          }
941    
                         SWAP(pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);  
942    
943                          FrameCodeP(pEnc, &bs, &bits, 1, 0);  }
                         bframes_count = 0;  
944    
                         BitstreamPad(&bs);  
                         pFrame->length = BitstreamLength(&bs);  
                         pFrame->intra = 0;  
945    
946                          emms();  static __inline void inc_frame_num(Encoder * pEnc)
947    {
948            pEnc->current->frame_num = pEnc->m_framenum;
949            pEnc->current->stamp = pEnc->mbParam.m_stamp;   /* first frame is zero */
950    
951                          return XVID_ERR_OK;          pEnc->mbParam.m_stamp += pEnc->current->fincr;
952            pEnc->m_framenum++;     /* debug ticker */
953                  }                  }
954    
955    static __inline void dec_frame_num(Encoder * pEnc)
956    {
957            pEnc->mbParam.m_stamp -= pEnc->mbParam.fincr;
958            pEnc->m_framenum--;     /* debug ticker */
959    }
960    
961                  DPRINTF(DPRINTF_DEBUG,"*** BFRAME (flush) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",  static __inline void
962                                  pEnc->bframenum_head, pEnc->bframenum_tail,  MBSetDquant(MACROBLOCK * pMB, int x, int y, MBParam * mbParam)
963                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);  {
964            if (pMB->cbp == 0) {
965                  FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs, &bits);                  /* we want to code dquant but the quantizer value will not be used yet
966                  pEnc->bframenum_head++;                          let's find out if we can postpone dquant to next MB
967                    */
968                  BitstreamPad(&bs);                  if (x == mbParam->mb_width-1 && y == mbParam->mb_height-1) {
969                  pFrame->length = BitstreamLength(&bs);                          pMB->dquant = 0; /* it's the last MB of all, the easiest case */
970                  pFrame->intra = 2;                          return;
971                    } else {
972                  if (input_valid)                          MACROBLOCK * next = pMB + 1;
973                          queue_image(pEnc, pFrame);                          const MACROBLOCK * prev = pMB - 1;
974                            if (next->mode != MODE_INTER4V && next->mode != MODE_NOT_CODED)
975                  emms();                                  /* mode allows dquant change in the future */
976                                    if (abs(next->quant - prev->quant) <= 2) {
977                  return XVID_ERR_OK;                                          /* quant change is not out of range */
978                                            pMB->quant = prev->quant;
979                                            pMB->dquant = 0;
980                                            next->dquant = next->quant - prev->quant;
981                                            return;
982                                    }
983                    }
984            }
985            /* couldn't skip this dquant */
986            pMB->mode = MODE_INTER_Q;
987          }          }
988    
         if (pEnc->bframenum_head > 0) {  
                 pEnc->bframenum_head = pEnc->bframenum_tail = 0;  
989    
                 /* write an empty marker to the bitstream.  
990    
991                     for divx5 decoder compatibility, this marker must consist  static __inline void
992                     of a not-coded p-vop, with a time_base of zero, and time_increment  set_timecodes(FRAMEINFO* pCur,FRAMEINFO *pRef, int32_t time_base)
993                     indentical to the future-referece frame.  {
                 */  
   
                 if ((pEnc->global & XVID_GLOBAL_PACKED)) {  
                         int tmp;  
994    
995                          DPRINTF(DPRINTF_DEBUG,"*** EMPTY bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",          pCur->ticks = (int32_t)pCur->stamp % time_base;
996                                  pEnc->bframenum_head, pEnc->bframenum_tail,          pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;
                                 pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);  
997    
998                          BitstreamPad(&bs);  #if 0   /* HEAVY DEBUG OUTPUT */
999            fprintf(stderr,"WriteVop:   %d - %d \n",
1000                            ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));
1001            fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",
1002                            pCur->coding_type, pCur->stamp, pRef->stamp, time_base);
1003            fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",
1004                            pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);
1005    #endif
1006    }
1007    
1008                          tmp = pEnc->current->seconds;  static void
1009                          pEnc->current->seconds = 0; /* force time_base = 0 */  simplify_par(int *par_width, int *par_height)
1010                          BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0);  {
                         pEnc->current->seconds = tmp;  
1011    
1012                          pFrame->length = BitstreamLength(&bs);          int _par_width  = (!*par_width)  ? 1 : (*par_width<0)  ? -*par_width:  *par_width;
1013                          pFrame->intra = 4;          int _par_height = (!*par_height) ? 1 : (*par_height<0) ? -*par_height: *par_height;
1014            int divisor = gcd(_par_width, _par_height);
1015    
1016                          if (input_valid)          _par_width  /= divisor;
1017                                  queue_image(pEnc, pFrame);          _par_height /= divisor;
1018    
1019            /* 2^8 precision maximum */
1020            if (_par_width>255 || _par_height>255) {
1021                    float div;
1022                          emms();                          emms();
1023                    if (_par_width>_par_height)
1024                            div = (float)_par_width/255;
1025                    else
1026                            div = (float)_par_height/255;
1027    
1028                          return XVID_ERR_OK;                  _par_width  = (int)((float)_par_width/div);
1029                    _par_height = (int)((float)_par_height/div);
1030                  }                  }
1031    
1032            *par_width = _par_width;
1033            *par_height = _par_height;
1034    
1035            return;
1036          }          }
1037    
1038    /*****************************************************************************
1039     * IPB frame encoder entry point
1040     *
1041     * Returned values :
1042     *      - >0                       - output bytes
1043     *      - 0                             - no output
1044     *      - XVID_ERR_VERSION - wrong version passed to core
1045     *      - XVID_ERR_END   - End of stream reached before end of coding
1046     *      - XVID_ERR_FORMAT  - the image subsystem reported the image had a wrong
1047     *                                               format
1048     ****************************************************************************/
1049    
 bvop_loop:  
1050    
1051          if (pEnc->bframenum_dx50bvop != -1)  int
1052    enc_encode(Encoder * pEnc,
1053                               xvid_enc_frame_t * xFrame,
1054                               xvid_enc_stats_t * stats)
1055          {          {
1056            xvid_enc_frame_t * frame;
1057            int type;
1058            Bitstream bs;
1059    
1060                  SWAP(pEnc->current, pEnc->reference);          if (XVID_VERSION_MAJOR(xFrame->version) != 1 || (stats && XVID_VERSION_MAJOR(stats->version) != 1))     /* v1.x.x */
1061                  SWAP(pEnc->current, pEnc->bframes[pEnc->bframenum_dx50bvop]);                  return XVID_ERR_VERSION;
1062    
1063                  if ((pEnc->global & XVID_GLOBAL_DEBUG)) {          xFrame->out_flags = 0;
1064                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "DX50 IVOP");  
1065                  }          start_global_timer();
1066            BitstreamInit(&bs, xFrame->bitstream, 0);
1067    
                 if (input_valid)  
                 {  
                         queue_image(pEnc, pFrame);  
                         input_valid = 0;  
                 }  
1068    
1069          } else if (input_valid) {          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1070             * enqueue image to the encoding-queue
1071             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1072    
1073                  SWAP(pEnc->current, pEnc->reference);          if (xFrame->input.csp != XVID_CSP_NULL)
1074            {
1075                    QUEUEINFO * q = &pEnc->queue[pEnc->queue_tail];
1076    
1077                  start_timer();                  start_timer();
1078                  if (image_input                  if (image_input
1079                          (&pEnc->current->image, pEnc->mbParam.width, pEnc->mbParam.height,                          (&q->image, pEnc->mbParam.width, pEnc->mbParam.height,
1080                          pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING))                          pEnc->mbParam.edged_width, (uint8_t**)xFrame->input.plane, xFrame->input.stride,
1081                            xFrame->input.csp, xFrame->vol_flags & XVID_VOL_INTERLACING))
1082                  {                  {
1083                          emms();                          emms();
1084                          return XVID_ERR_FORMAT;                          return XVID_ERR_FORMAT;
1085                  }                  }
1086                  stop_conv_timer();                  stop_conv_timer();
1087    
1088                  // queue input frame, and dequue next image                  if ((xFrame->vop_flags & XVID_VOP_CHROMAOPT)) {
1089                  if (pEnc->queue_size > 0)                          image_chroma_optimize(&q->image,
1090                                    pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
1091                    }
1092    
1093                    q->frame = *xFrame;
1094    
1095                    if (xFrame->quant_intra_matrix)
1096                  {                  {
1097                          image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_tail]);                          memcpy(q->quant_intra_matrix, xFrame->quant_intra_matrix, 64*sizeof(unsigned char));
1098                          if (pEnc->queue_head != pEnc->queue_tail)                          q->frame.quant_intra_matrix = q->quant_intra_matrix;
1099                    }
1100    
1101                    if (xFrame->quant_inter_matrix)
1102                          {                          {
1103                                  image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head]);                          memcpy(q->quant_inter_matrix, xFrame->quant_inter_matrix, 64*sizeof(unsigned char));
1104                            q->frame.quant_inter_matrix = q->quant_inter_matrix;
1105                          }                          }
1106                          pEnc->queue_head =  (pEnc->queue_head + 1) % pEnc->mbParam.max_bframes;  
1107                          pEnc->queue_tail =  (pEnc->queue_tail + 1) % pEnc->mbParam.max_bframes;                  pEnc->queue_tail = (pEnc->queue_tail + 1) % (pEnc->mbParam.max_bframes+1);
1108                    pEnc->queue_size++;
1109                  }                  }
1110    
         } else if (pEnc->queue_size > 0) {  
1111    
1112                  SWAP(pEnc->current, pEnc->reference);          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1113             * bframe flush code
1114             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1115    
1116                  image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head]);  repeat:
                 pEnc->queue_head =  (pEnc->queue_head + 1) % pEnc->mbParam.max_bframes;  
                 pEnc->queue_size--;  
1117    
1118          } else {          if (pEnc->flush_bframes)
1119            {
1120                    if (pEnc->bframenum_head < pEnc->bframenum_tail) {
1121    
1122                            DPRINTF(XVID_DEBUG_DEBUG,"*** BFRAME (flush) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1123                                            pEnc->bframenum_head, pEnc->bframenum_tail,
1124                                            pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1125    
1126                            if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1127                                    image_copy(&pEnc->sOriginal2, &pEnc->bframes[pEnc->bframenum_head]->image,
1128                                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1129                            }
1130    
1131                            FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs);
1132                            call_plugins(pEnc, pEnc->bframes[pEnc->bframenum_head], &pEnc->sOriginal2, XVID_PLG_AFTER, NULL, NULL, stats);
1133                            pEnc->bframenum_head++;
1134    
1135                            goto done;
1136                    }
1137    
1138                    /* write an empty marker to the bitstream.
1139    
1140                  /* if nothing was encoded, write an 'ignore this frame' flag                     for divx5 decoder compatibility, this marker must consist
1141                     to the bitstream */                     of a not-coded p-vop, with a time_base of zero, and time_increment
1142                       indentical to the future-referece frame.
1143                    */
1144    
1145                  if (BitstreamPos(&bs) == 0) {                  if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED && pEnc->bframenum_tail > 0)) {
1146                            int tmp;
1147                            int bits;
1148    
1149                          DPRINTF(DPRINTF_DEBUG,"*** SKIP bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",                          DPRINTF(XVID_DEBUG_DEBUG,"*** EMPTY bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1150                                  pEnc->bframenum_head, pEnc->bframenum_tail,                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1151                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1152    
1153                          BitstreamPutBits(&bs, 0x7f, 8);                          bits = BitstreamPos(&bs);
1154                          pFrame->intra = 5;  
1155                  }                          tmp = pEnc->current->seconds;
1156                            pEnc->current->seconds = 0; /* force time_base = 0 */
1157    
1158                            BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0, pEnc->current->quant);
1159                            BitstreamPad(&bs);
1160                            pEnc->current->seconds = tmp;
1161    
1162                            /* add the not-coded length to the reference frame size */
1163                            pEnc->current->length += (BitstreamPos(&bs) - bits) / 8;
1164                            call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1165    
1166                            /* flush complete: reset counters */
1167                            pEnc->flush_bframes = 0;
1168                            pEnc->bframenum_head = pEnc->bframenum_tail = 0;
1169                            goto done;
1170    
                 pFrame->length = BitstreamLength(&bs);  
                 emms();  
                 return XVID_ERR_OK;  
1171          }          }
1172    
1173                    /* flush complete: reset counters */
1174          pEnc->flush_bframes = 0;          pEnc->flush_bframes = 0;
1175                    pEnc->bframenum_head = pEnc->bframenum_tail = 0;
1176            }
1177    
1178          emms();          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1179             * dequeue frame from the encoding queue
1180             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1181    
1182          // only inc frame num, adapt quant, etc. if we havent seen it before          if (pEnc->queue_size == 0)              /* empty */
1183          if (pEnc->bframenum_dx50bvop < 0 )          {
1184                    if (xFrame->input.csp == XVID_CSP_NULL) /* no futher input */
1185          {          {
                 if (pFrame->quant == 0)  
                         pEnc->current->quant = RateControlGetQ(&pEnc->rate_control, 0);  
                 else  
                         pEnc->current->quant = pFrame->quant;  
1186    
1187  /*              if (pEnc->current->quant < 1)                          DPRINTF(XVID_DEBUG_DEBUG,"*** FINISH bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1188                          pEnc->current->quant = 1;                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1189                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1190    
1191                  if (pEnc->current->quant > 31)                          if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0) {
1192                          pEnc->current->quant = 31;                                  call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1193  */                          }
                 pEnc->current->global_flags = pFrame->general;  
                 pEnc->current->motion_flags = pFrame->motion;  
1194    
1195                  /* ToDo : dynamic fcode (in both directions) */                          /* if the very last frame is to be b-vop, we must change it to a p-vop */
1196                  pEnc->current->fcode = pEnc->mbParam.m_fcode;                          if (pEnc->bframenum_tail > 0) {
                 pEnc->current->bcode = pEnc->mbParam.m_fcode;  
1197    
1198                  inc_frame_num(pEnc);                                  SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
1199                                    pEnc->bframenum_tail--;
1200                                    SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1201    
1202                                    /* convert B-VOP to P-VOP */
1203                                    pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1204                                    pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1205                                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1206    
1207  #ifdef _DEBUG_PSNR                                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1208                  image_copy(&pEnc->sOriginal, &pEnc->current->image,                  image_copy(&pEnc->sOriginal, &pEnc->current->image,
1209                             pEnc->mbParam.edged_width, pEnc->mbParam.height);                             pEnc->mbParam.edged_width, pEnc->mbParam.height);
1210  #endif                                  }
1211    
1212                  emms();                                  DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1213                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1214                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1215                                    pEnc->mbParam.frame_drop_ratio = -1; /* it must be a coded vop */
1216    
1217                  if ((pEnc->global & XVID_GLOBAL_DEBUG)) {                                  FrameCodeP(pEnc, &bs);
1218                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,  
1219                                  "%i  if:%i  st:%i", pEnc->m_framenum++, pEnc->iFrameNum, pEnc->current->stamp);  
1220                                    if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail==0) {
1221                                            call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1222                                    }else{
1223                                            pEnc->flush_bframes = 1;
1224                                            goto done;
1225                                    }
1226                            }
1227                            DPRINTF(XVID_DEBUG_DEBUG, "*** END\n");
1228    
1229                            emms();
1230                            return XVID_ERR_END;    /* end of stream reached */
1231                    }
1232                    goto done;      /* nothing to encode yet; encoder lag */
1233                  }                  }
1234    
1235            /* the current FRAME becomes the reference */
1236            SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
1237    
1238            /* remove frame from encoding-queue (head), and move it into the current */
1239            image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head].image);
1240            frame = &pEnc->queue[pEnc->queue_head].frame;
1241            pEnc->queue_head = (pEnc->queue_head + 1) % (pEnc->mbParam.max_bframes+1);
1242            pEnc->queue_size--;
1243    
1244    
1245          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1246           * Luminance masking           * init pEnc->current fields
1247           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1248    
1249                  if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {          pEnc->current->fincr = pEnc->mbParam.fincr>0 ? pEnc->mbParam.fincr : frame->fincr;
1250                          int *temp_dquants =          inc_frame_num(pEnc);
1251                                  (int *) xvid_malloc(pEnc->mbParam.mb_width *          pEnc->current->vol_flags = frame->vol_flags;
1252                                                                  pEnc->mbParam.mb_height * sizeof(int),          pEnc->current->vop_flags = frame->vop_flags;
1253                                                                  CACHE_LINE);          pEnc->current->motion_flags = frame->motion;
1254            pEnc->current->fcode = pEnc->mbParam.m_fcode;
1255            pEnc->current->bcode = pEnc->mbParam.m_fcode;
1256    
1257    
1258                          pEnc->current->quant =          if ((xFrame->vop_flags & XVID_VOP_CHROMAOPT)) {
1259                                  adaptive_quantization(pEnc->current->image.y,                  image_chroma_optimize(&pEnc->current->image,
1260                                                                    pEnc->mbParam.edged_width, temp_dquants,                          pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
1261                                                                    pEnc->current->quant, pEnc->current->quant,          }
                                                                   2 * pEnc->current->quant,  
                                                                   pEnc->mbParam.mb_width,  
                                                                   pEnc->mbParam.mb_height);  
1262    
1263                          for (y = 0; y < pEnc->mbParam.mb_height; y++) {          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1264             * frame type & quant selection
1265             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1266    
1267  #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)          type = frame->type;
1268            pEnc->current->quant = frame->quant;
1269    
1270                                  for (x = 0; x < pEnc->mbParam.mb_width; x++) {          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_BEFORE, &type, (int*)&pEnc->current->quant, stats);
                                         MACROBLOCK *pMB = &pEnc->current->mbs[OFFSET(x, y)];  
1271    
1272                                          pMB->dquant = iDQtab[temp_dquants[OFFSET(x, y)] + 2];          if (type > 0){  /* XVID_TYPE_?VOP */
1273                    type = type2coding(type);       /* convert XVID_TYPE_?VOP to bitstream coding type */
1274            } else{         /* XVID_TYPE_AUTO */
1275                    if (pEnc->iFrameNum == 0 || (pEnc->mbParam.iMaxKeyInterval > 0 && pEnc->iFrameNum >= pEnc->mbParam.iMaxKeyInterval)){
1276                            pEnc->iFrameNum = 0;
1277                            type = I_VOP;
1278                    }else{
1279                            type = MEanalysis(&pEnc->reference->image, pEnc->current,
1280                                                              &pEnc->mbParam, pEnc->mbParam.iMaxKeyInterval,
1281                                                              pEnc->iFrameNum, pEnc->bframenum_tail, xFrame->bframe_threshold,
1282                                                              (pEnc->bframes) ? pEnc->bframes[pEnc->bframenum_head]->mbs: NULL);
1283                                  }                                  }
   
 #undef OFFSET  
1284                          }                          }
1285    
1286                          xvid_free(temp_dquants);          if (type != I_VOP)
1287                    pEnc->current->vol_flags = pEnc->mbParam.vol_flags; /* don't allow VOL changes here */
1288    
1289            /* bframes buffer overflow check */
1290            if (type == B_VOP && pEnc->bframenum_tail >= pEnc->mbParam.max_bframes) {
1291                    type = P_VOP;
1292                  }                  }
1293    
1294            pEnc->iFrameNum++;
1295    
1296            if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1297                    image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,
1298                            "%d  st:%lld  if:%d", pEnc->current->frame_num, pEnc->current->stamp, pEnc->iFrameNum);
1299          }          }
1300    
1301          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1302           * ivop/pvop/bvop selection           * encode this frame as a b-vop
1303             * (we dont encode here, rather we store the frame in the bframes queue, to be encoded later)
1304           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1305            if (type == B_VOP) {
1306                    if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1307                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "BVOP");
1308                    }
1309    
1310          if (pEnc->iFrameNum == 0 || pFrame->intra == 1 || pEnc->bframenum_dx50bvop >= 0 ||                  if (frame->quant < 1) {
1311                  (pFrame->intra < 0 && pEnc->iMaxKeyInterval > 0 &&                          pEnc->current->quant = ((((pEnc->reference->quant + pEnc->current->quant) *
1312                   pEnc->iFrameNum >= pEnc->iMaxKeyInterval)                                  pEnc->mbParam.bquant_ratio) / 2) + pEnc->mbParam.bquant_offset)/100;
                 || 2 == (mode = MEanalysis(&pEnc->reference->image, pEnc->current,  
                                                                         &pEnc->mbParam, pEnc->iMaxKeyInterval,  
                                                                         (pFrame->intra < 0) ? pEnc->iFrameNum : 0,  
                                                                         bframes_count++))) {  
1313    
1314                  /*                  } else {
1315                   * This will be coded as an Intra Frame                          pEnc->current->quant = frame->quant;
1316                   */                  }
                 if ((pEnc->current->global_flags & XVID_QUARTERPEL))  
                         pEnc->mbParam.m_quarterpel = 1;  
                 else  
                         pEnc->mbParam.m_quarterpel = 0;  
1317    
1318                  DPRINTF(DPRINTF_DEBUG,"*** IFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",                  if (pEnc->current->quant < 1)
1319                            pEnc->current->quant = 1;
1320                    else if (pEnc->current->quant > 31)
1321                            pEnc->current->quant = 31;
1322    
1323                    DPRINTF(XVID_DEBUG_DEBUG,"*** BFRAME (store) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i  quant=%i\n",
1324                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1325                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size,pEnc->current->quant);
1326    
1327                    /* store frame into bframe buffer & swap ref back to current */
1328                    SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1329                    SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
1330    
1331                    pEnc->bframenum_tail++;
1332    
1333                    goto repeat;
1334            }
1335    
1336    
1337                    DPRINTF(XVID_DEBUG_DEBUG,"*** XXXXXX bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1338                                  pEnc->bframenum_head, pEnc->bframenum_tail,                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1339                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1340    
1341                  if ((pEnc->global & XVID_GLOBAL_DEBUG)) {          /* for unpacked bframes, output the stats for the last encoded frame */
1342                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");          if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0)
1343            {
1344                    if (pEnc->current->stamp > 0) {
1345                            call_plugins(pEnc, pEnc->reference, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1346                    }
1347            else if (stats) {
1348                stats->type = XVID_TYPE_NOTHING;
1349            }
1350                  }                  }
1351    
1352                  // when we reach an iframe in DX50BVOP mode, encode the last bframe as a pframe          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1353             * closed-gop
1354             * if the frame prior to an iframe is scheduled as a bframe, we must change it to a pframe
1355             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1356    
1357                  if ((pEnc->global & XVID_GLOBAL_DX50BVOP) && pEnc->bframenum_tail > 0) {          if (type == I_VOP && (pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP) && pEnc->bframenum_tail > 0) {
1358    
1359                          pEnc->bframenum_tail--;                  /* place this frame back on the encoding-queue (head) */
1360                          pEnc->bframenum_dx50bvop = pEnc->bframenum_tail;                  /* we will deal with it next time */
1361                    dec_frame_num(pEnc);
1362                    pEnc->iFrameNum--;
1363    
1364                          SWAP(pEnc->current, pEnc->bframes[pEnc->bframenum_dx50bvop]);                  pEnc->queue_head = (pEnc->queue_head + (pEnc->mbParam.max_bframes+1) - 1) % (pEnc->mbParam.max_bframes+1);
1365                          if ((pEnc->global & XVID_GLOBAL_DEBUG)) {                  pEnc->queue_size++;
1366                                  image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "DX50 BVOP->PVOP");                  image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head].image);
                         }  
                         FrameCodeP(pEnc, &bs, &bits, 1, 0);  
                         bframes_count = 0;  
1367    
1368                          pFrame->intra = 0;                  /* grab the last frame from the bframe-queue */
1369    
1370                  } else {                  pEnc->bframenum_tail--;
1371                    SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1372    
1373                          FrameCodeI(pEnc, &bs, &bits);                  if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1374                          bframes_count = 0;                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "CLOSED GOP BVOP->PVOP");
1375                          pFrame->intra = 1;                  }
1376    
1377                          pEnc->bframenum_dx50bvop = -1;                  /* convert B-VOP quant to P-VOP */
1378                    pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1379                    pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1380                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1381                    type = P_VOP;
1382                  }                  }
1383    
                 pEnc->flush_bframes = 1;  
1384    
1385                  if ((pEnc->global & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0) {          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1386                          BitstreamPadAlways(&bs);           * encode this frame as an i-vop
1387                          input_valid = 0;           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
                         goto ipvop_loop;  
                 }  
1388    
1389                  /*          if (type == I_VOP) {
                  * NB : sequences like "IIBB" decode fine with msfdam but,  
                  *      go screwy with divx 5.00  
                  */  
         } else if (pEnc->bframenum_tail >= pEnc->mbParam.max_bframes || mode != 0) {  
 //      } else if (pFrame->intra == 0 || pEnc->bframenum_tail >= pEnc->mbParam.max_bframes || mode != 0) {  
                 /*  
                  * This will be coded as a Predicted Frame  
                  */  
1390    
1391                  DPRINTF(DPRINTF_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i",                  DPRINTF(XVID_DEBUG_DEBUG,"*** IFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1392                                  pEnc->bframenum_head, pEnc->bframenum_tail,                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1393                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1394    
1395                  if ((pEnc->global & XVID_GLOBAL_DEBUG)) {                  if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1396                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "PVOP");                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");
1397                  }                  }
1398    
1399                  FrameCodeP(pEnc, &bs, &bits, 1, 0);                  pEnc->iFrameNum = 1;
                 bframes_count = 0;  
                 pFrame->intra = 0;  
                 pEnc->flush_bframes = 1;  
1400    
1401                  if ((pEnc->global & XVID_GLOBAL_PACKED) && (pEnc->bframenum_tail > 0)) {                  /* ---- update vol flags at IVOP ----------- */
1402                          BitstreamPadAlways(&bs);                  pEnc->mbParam.vol_flags = pEnc->current->vol_flags;
1403                          input_valid = 0;  
1404                          goto ipvop_loop;                  /* Aspect ratio */
1405                    switch(frame->par) {
1406                    case XVID_PAR_11_VGA:
1407                    case XVID_PAR_43_PAL:
1408                    case XVID_PAR_43_NTSC:
1409                    case XVID_PAR_169_PAL:
1410                    case XVID_PAR_169_NTSC:
1411                    case XVID_PAR_EXT:
1412                            pEnc->mbParam.par = frame->par;
1413                            break;
1414                    default:
1415                            pEnc->mbParam.par = XVID_PAR_11_VGA;
1416                            break;
1417                  }                  }
1418    
1419          } else {                  /* For extended PAR only, we try to sanityse/simplify par values */
1420                  /*                  if (pEnc->mbParam.par == XVID_PAR_EXT) {
1421                   * This will be coded as a Bidirectional Frame                          pEnc->mbParam.par_width  = frame->par_width;
1422                   */                          pEnc->mbParam.par_height = frame->par_height;
1423                            simplify_par(&pEnc->mbParam.par_width, &pEnc->mbParam.par_height);
1424                    }
1425    
1426                  if ((pEnc->global & XVID_GLOBAL_DEBUG)) {                  if ((pEnc->mbParam.vol_flags & XVID_VOL_MPEGQUANT)) {
1427                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "BVOP");                          if (frame->quant_intra_matrix != NULL)
1428                                    set_intra_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_intra_matrix);
1429                            if (frame->quant_inter_matrix != NULL)
1430                                    set_inter_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_inter_matrix);
1431                  }                  }
1432    
1433                  if (pFrame->bquant < 1) {                  /* prevent vol/vop misuse */
                         pEnc->current->quant = ((((pEnc->reference->quant + pEnc->current->quant) *  
                                 pEnc->bquant_ratio) / 2) + pEnc->bquant_offset)/100;  
1434    
1435                  } else {                  if (!(pEnc->current->vol_flags & XVID_VOL_INTERLACING))
1436                          pEnc->current->quant = pFrame->bquant;                          pEnc->current->vop_flags &= ~(XVID_VOP_TOPFIELDFIRST|XVID_VOP_ALTERNATESCAN);
1437    
1438                    /* ^^^------------------------ */
1439    
1440                    if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1441                            image_copy(&pEnc->sOriginal, &pEnc->current->image,
1442                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1443                  }                  }
1444    
1445                  if (pEnc->current->quant < 1)                  FrameCodeI(pEnc, &bs);
1446                          pEnc->current->quant = 1;                  xFrame->out_flags |= XVID_KEYFRAME;
                 else if (pEnc->current->quant > 31)  
             pEnc->current->quant = 31;  
1447    
1448                  DPRINTF(DPRINTF_DEBUG,"*** BFRAME (store) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i  quant=%i\n",          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1449                                  pEnc->bframenum_head, pEnc->bframenum_tail,           * encode this frame as an p-vop
1450                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size,pEnc->current->quant);           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1451    
1452                  /* store frame into bframe buffer & swap ref back to current */          } else { /* (type == P_VOP || type == S_VOP) */
                 SWAP(pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);  
                 SWAP(pEnc->current, pEnc->reference);  
1453    
1454                  pEnc->bframenum_tail++;                  DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1455                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1456                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1457    
1458  // bframe report by koepi                  if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1459                  pFrame->intra = 2;                          image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "PVOP");
1460                  pFrame->length = 0;                  }
1461    
1462                  input_valid = 0;                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1463                  goto bvop_loop;                          image_copy(&pEnc->sOriginal, &pEnc->current->image,
1464                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1465          }          }
1466    
1467          pEnc->iFrameNum++;                  if ( FrameCodeP(pEnc, &bs) == 0 ) {
1468                            /* N-VOP, we mustn't code b-frames yet */
1469                            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) ||
1470                                     pEnc->mbParam.max_bframes == 0)
1471                                    call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1472                            goto done;
1473                    }
1474            }
1475    
         BitstreamPad(&bs);  
         pFrame->length = BitstreamLength(&bs);  
1476    
1477          if (pResult) {          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1478                  pResult->quant = pEnc->current->quant;           * on next enc_encode call we must flush bframes
1479                  pResult->hlength = pFrame->length - (pEnc->sStat.iTextBits / 8);           * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
                 pResult->kblks = pEnc->sStat.kblks;  
                 pResult->mblks = pEnc->sStat.mblks;  
                 pResult->ublks = pEnc->sStat.ublks;  
         }  
1480    
1481          emms();  /*done_flush:*/
1482    
1483  #ifdef _DEBUG_PSNR          pEnc->flush_bframes = 1;
         psnr =  
                 image_psnr(&pEnc->sOriginal, &pEnc->current->image,  
                                    pEnc->mbParam.edged_width, pEnc->mbParam.width,  
                                    pEnc->mbParam.height);  
1484    
1485          snprintf(temp, 127, "PSNR: %f\n", psnr);          /* packed & queued_bframes: dont bother outputting stats here, we do so after the flush */
1486          DEBUG(temp);          if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0) {
1487  #endif                  goto repeat;
1488            }
1489    
1490          if (pFrame->quant == 0) {          /* packed or no-bframes or no-bframes-queued: output stats */
1491                  RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,          if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) || pEnc->mbParam.max_bframes == 0 ) {
1492                                                    pFrame->length, pFrame->intra);                  call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1493          }          }
1494    
1495            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1496             * done; return number of bytes consumed
1497             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1498    
1499    done:
1500    
1501          stop_global_timer();          stop_global_timer();
1502          write_timer();          write_timer();
1503    
1504          emms();          emms();
1505          return XVID_ERR_OK;          return BitstreamLength(&bs);
1506  }  }
1507    
1508    
1509    static void SetMacroblockQuants(MBParam * const pParam, FRAMEINFO * frame)
1510    {
1511            unsigned int i;
1512            MACROBLOCK * pMB = frame->mbs;
1513            int quant = frame->mbs[0].quant; /* set by XVID_PLG_FRAME */
1514            if (quant > 31)
1515                    frame->quant = quant = 31;
1516            else if (quant < 1)
1517                    frame->quant = quant = 1;
1518    
1519            for (i = 0; i < pParam->mb_height * pParam->mb_width; i++) {
1520                    quant += pMB->dquant;
1521                    if (quant > 31)
1522                            quant = 31;
1523                    else if (quant < 1)
1524                            quant = 1;
1525                    pMB->quant = quant;
1526                    pMB++;
1527            }
1528    }
1529    
 /*****************************************************************************  
  * "original" IP frame encoder entry point  
  *  
  * Returned values :  
  *    - XVID_ERR_OK     - no errors  
  *    - XVID_ERR_FORMAT - the image subsystem reported the image had a wrong  
  *                        format  
  ****************************************************************************/  
1530    
1531  int  static __inline void
1532  encoder_encode(Encoder * pEnc,  CodeIntraMB(MACROBLOCK * pMB)
                            XVID_ENC_FRAME * pFrame,  
                            XVID_ENC_STATS * pResult)  
1533  {  {
1534            pMB->mode = MODE_INTRA;
1535    
1536            /* zero mv statistics */
1537            pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;
1538            pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;
1539            pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;
1540            pMB->sad16 = 0;
1541    
1542            if (pMB->dquant != 0) {
1543                    pMB->mode = MODE_INTRA_Q;
1544            }
1545    }
1546    
1547    static void
1548    SliceCodeI(SMPData *data)
1549    {
1550            Encoder *pEnc = (Encoder *) data->pEnc;
1551            Bitstream *bs = (Bitstream *) data->bs;
1552    
1553          uint16_t x, y;          uint16_t x, y;
1554          Bitstream bs;          int mb_width = pEnc->mbParam.mb_width;
1555          uint32_t bits;          int mb_height = pEnc->mbParam.mb_height;
         uint16_t write_vol_header = 0;  
1556    
1557  #ifdef _DEBUG_PSNR          int bound = 0, num_slices = pEnc->num_slices;
1558          float psnr;          FRAMEINFO *const current = pEnc->current;
         uint8_t temp[128];  
 #endif  
1559    
1560          start_global_timer();          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1561            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1562    
1563          ENC_CHECK(pEnc);          if (data->start_y > 0) { /* write resync marker */
1564          ENC_CHECK(pFrame);                  bound = data->start_y*mb_width;
1565          ENC_CHECK(pFrame->bitstream);                  write_video_packet_header(bs, &pEnc->mbParam, current, bound);
1566          ENC_CHECK(pFrame->image);          }
   
         SWAP(pEnc->current, pEnc->reference);  
   
         pEnc->current->global_flags = pFrame->general;  
         pEnc->current->motion_flags = pFrame->motion;  
         pEnc->mbParam.hint = &pFrame->hint;  
1567    
1568          inc_frame_num(pEnc);          for (y = data->start_y; y < data->stop_y; y++) {
1569                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1570    
1571          /* disable alternate scan flag if interlacing is not enabled */                  if (new_bound > bound) {
1572          if ((pEnc->current->global_flags & XVID_ALTERNATESCAN) &&                          bound = new_bound;
1573                  !(pEnc->current->global_flags & XVID_INTERLACING))                          BitstreamPadAlways(bs);
1574          {                          write_video_packet_header(bs, &pEnc->mbParam, current, bound);
                 pEnc->current->global_flags -= XVID_ALTERNATESCAN;  
1575          }          }
1576    
1577          start_timer();                  for (x = 0; x < mb_width; x++) {
1578          if (image_input                          MACROBLOCK *pMB = &current->mbs[x + y * mb_width];
                 (&pEnc->current->image, pEnc->mbParam.width, pEnc->mbParam.height,  
                  pEnc->mbParam.edged_width, pFrame->image, pFrame->stride, pFrame->colorspace, pFrame->general & XVID_INTERLACING) < 0)  
                 return XVID_ERR_FORMAT;  
         stop_conv_timer();  
1579    
1580  #ifdef _DEBUG_PSNR                          CodeIntraMB(pMB);
         image_copy(&pEnc->sOriginal, &pEnc->current->image,  
                            pEnc->mbParam.edged_width, pEnc->mbParam.height);  
 #endif  
1581    
1582          emms();                          MBTransQuantIntra(&pEnc->mbParam, current, pMB, x, y,
1583                                                              dct_codes, qcoeff);
1584    
1585                            start_timer();
1586                            MBPrediction(current, x, y, mb_width, qcoeff, bound);
1587                            stop_prediction_timer();
1588    
1589          BitstreamInit(&bs, pFrame->bitstream, 0);                          start_timer();
1590                            MBCoding(current, pMB, qcoeff, bs, data->sStat);
1591                            stop_coding_timer();
1592    
1593          if (pFrame->quant == 0) {                  }
                 pEnc->current->quant = RateControlGetQ(&pEnc->rate_control, 0);  
         } else {  
                 pEnc->current->quant = pFrame->quant;  
1594          }          }
1595    
1596          if ((pEnc->current->global_flags & XVID_QUARTERPEL))          emms();
1597                  pEnc->mbParam.m_quarterpel = 1;          BitstreamPadAlways(bs);
1598          else  }
                 pEnc->mbParam.m_quarterpel = 0;  
1599    
1600          if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {  static __inline void
1601                  int *temp_dquants =  SerializeBitstreams(Encoder *pEnc, FRAMEINFO *current, Bitstream *bs, int num_threads)
1602                          (int *) xvid_malloc(pEnc->mbParam.mb_width *  {
1603                                                                  pEnc->mbParam.mb_height * sizeof(int),          int k;
1604                                                                  CACHE_LINE);          uint32_t pos = BitstreamLength(bs);
1605    
1606                  pEnc->current->quant =          for (k = 1; k < num_threads; k++) {
1607                          adaptive_quantization(pEnc->current->image.y,                  uint32_t len = BitstreamLength(pEnc->smpData[k].bs);
                                                                   pEnc->mbParam.edged_width, temp_dquants,  
                                                                   pEnc->current->quant, pEnc->current->quant,  
                                                                   2 * pEnc->current->quant,  
                                                                   pEnc->mbParam.mb_width,  
                                                                   pEnc->mbParam.mb_height);  
1608    
1609                  for (y = 0; y < pEnc->mbParam.mb_height; y++) {                  memcpy((void *)((ptr_t)bs->start + pos),
1610                               (void *)((ptr_t)pEnc->smpData[k].bs->start), len);
1611    
1612                    current->length += len;
1613                    pos += len;
1614    
1615                    /* collect stats */
1616                    current->sStat.iTextBits += pEnc->smpData[k].sStat->iTextBits;
1617                    current->sStat.kblks += pEnc->smpData[k].sStat->kblks;
1618                    current->sStat.mblks += pEnc->smpData[k].sStat->mblks;
1619                    current->sStat.ublks += pEnc->smpData[k].sStat->ublks;
1620                    current->sStat.iMVBits += pEnc->smpData[k].sStat->iMVBits;
1621            }
1622    
1623            if (num_threads > 1) {
1624                    uint32_t pos32 = pos>>2;
1625                    bs->tail = bs->start + pos32;
1626                    bs->pos = 8*(pos - (pos32<<2));
1627                    bs->buf = 0;
1628    
1629                    if (bs->pos > 0) {
1630                            uint32_t pos8 = bs->pos/8;
1631                            memset((void *)((ptr_t)bs->tail+pos8), 0, (4-pos8));
1632                            pos = *bs->tail;
1633    #ifndef ARCH_IS_BIG_ENDIAN
1634                            BSWAP(pos);
1635    #endif
1636                            bs->buf = pos;
1637                    }
1638            }
1639    }
1640    
1641  #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)  static int
1642    FrameCodeI(Encoder * pEnc,
1643                       Bitstream * bs)
1644    {
1645            int bits = BitstreamPos(bs);
1646            int bound = 0, num_slices = pEnc->num_slices;
1647            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1648            int slices_per_thread = (num_slices*1024 / num_threads);
1649            int mb_height = pEnc->mbParam.mb_height;
1650            void * status = NULL;
1651            uint16_t k;
1652    
1653                          for (x = 0; x < pEnc->mbParam.mb_width; x++) {          pEnc->mbParam.m_rounding_type = 1;
1654            pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
1655            pEnc->current->coding_type = I_VOP;
1656    
1657            call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
1658    
1659                                  MACROBLOCK *pMB = &pEnc->current->mbs[OFFSET(x, y)];          SetMacroblockQuants(&pEnc->mbParam, pEnc->current);
1660    
1661                                  pMB->dquant = iDQtab[temp_dquants[OFFSET(x, y)] + 2];          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current, num_slices);
                         }  
1662    
1663  #undef OFFSET          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
                 }  
1664    
1665                  xvid_free(temp_dquants);          BitstreamPad(bs);
         }  
1666    
1667          if (pEnc->current->global_flags & XVID_H263QUANT) {          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1, pEnc->current->mbs[0].quant);
                 if (pEnc->mbParam.m_quant_type != H263_QUANT)  
                         write_vol_header = 1;  
                 pEnc->mbParam.m_quant_type = H263_QUANT;  
         } else if (pEnc->current->global_flags & XVID_MPEGQUANT) {  
                 int matrix1_changed, matrix2_changed;  
1668    
1669                  matrix1_changed = matrix2_changed = 0;          pEnc->current->sStat.iTextBits = 0;
1670    
1671                  if (pEnc->mbParam.m_quant_type != MPEG4_QUANT)          /* multithreaded intra coding - dispatch threads */
1672                          write_vol_header = 1;          for (k = 0; k < num_threads; k++) {
1673                    int add = ((slices_per_thread + 512) >> 10);
1674    
1675                  pEnc->mbParam.m_quant_type = MPEG4_QUANT;                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
1676    
1677                  if ((pEnc->current->global_flags & XVID_CUSTOM_QMATRIX) > 0) {                  pEnc->smpData[k].pEnc = (void *) pEnc;
1678                          if (pFrame->quant_intra_matrix != NULL)                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
1679                                  matrix1_changed = set_intra_matrix(pFrame->quant_intra_matrix);                  pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
                         if (pFrame->quant_inter_matrix != NULL)  
                                 matrix2_changed = set_inter_matrix(pFrame->quant_inter_matrix);  
                 } else {  
                         matrix1_changed = set_intra_matrix(get_default_intra_matrix());  
                         matrix2_changed = set_inter_matrix(get_default_inter_matrix());  
                 }  
                 if (write_vol_header == 0)  
                         write_vol_header = matrix1_changed | matrix2_changed;  
         }  
1680    
1681          if (pFrame->intra < 0) {                  bound += add;
1682                  if ((pEnc->iFrameNum == 0)  
1683                          || ((pEnc->iMaxKeyInterval > 0)                  if (k > 0) {
1684                                  && (pEnc->iFrameNum >= pEnc->iMaxKeyInterval))) {                          BitstreamReset(pEnc->smpData[k].bs);
1685                          pFrame->intra = FrameCodeI(pEnc, &bs, &bits);                          pEnc->smpData[k].sStat->iTextBits = 0;
                 } else {  
                         pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 0, write_vol_header);  
1686                  }                  }
         } else {  
                 if (pFrame->intra == 1) {  
                         pFrame->intra = FrameCodeI(pEnc, &bs, &bits);  
                 } else {  
                         pFrame->intra = FrameCodeP(pEnc, &bs, &bits, 1, write_vol_header);  
1687                  }                  }
1688            pEnc->smpData[0].bs = bs;
1689            pEnc->smpData[0].sStat = &pEnc->current->sStat;
1690    
1691            /* create threads */
1692            for (k = 1; k < num_threads; k++) {
1693                    pthread_create(&pEnc->smpData[k].handle, NULL,
1694                                   (void*)SliceCodeI, (void*)&pEnc->smpData[k]);
1695          }          }
1696    
1697          BitstreamPutBits(&bs, 0xFFFF, 16);          SliceCodeI(&pEnc->smpData[0]);
         BitstreamPutBits(&bs, 0xFFFF, 16);  
         BitstreamPad(&bs);  
         pFrame->length = BitstreamLength(&bs);  
1698    
1699          if (pResult) {          /* wait until all threads are finished */
1700                  pResult->quant = pEnc->current->quant;          for (k = 1; k < num_threads; k++) {
1701                  pResult->hlength = pFrame->length - (pEnc->sStat.iTextBits / 8);                  pthread_join(pEnc->smpData[k].handle, &status);
                 pResult->kblks = pEnc->sStat.kblks;  
                 pResult->mblks = pEnc->sStat.mblks;  
                 pResult->ublks = pEnc->sStat.ublks;  
1702          }          }
1703    
1704          emms();          pEnc->current->length = BitstreamLength(bs) - (bits/8);
1705    
1706          if (pFrame->quant == 0) {          /* reassemble the pieces together */
1707                  RateControlUpdate(&pEnc->rate_control, pEnc->current->quant,          SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
                                                   pFrame->length, pFrame->intra);  
         }  
 #ifdef _DEBUG_PSNR  
         psnr =  
                 image_psnr(&pEnc->sOriginal, &pEnc->current->image,  
                                    pEnc->mbParam.edged_width, pEnc->mbParam.width,  
                                    pEnc->mbParam.height);  
1708    
1709          snprintf(temp, 127, "PSNR: %f\n", psnr);          pEnc->current->sStat.iMVBits = 0;
1710          DEBUG(temp);          pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1711  #endif          pEnc->current->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
1712    
1713          pEnc->iFrameNum++;          pEnc->fMvPrevSigma = -1;
1714            pEnc->mbParam.m_fcode = 2;
1715    
1716          stop_global_timer();          pEnc->current->is_edged = 0; /* not edged */
1717          write_timer();          pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
1718    
1719          return XVID_ERR_OK;          return 1;                                       /* intra */
1720  }  }
1721    
   
1722  static __inline void  static __inline void
1723  CodeIntraMB(Encoder * pEnc,  updateFcode(Statistics * sStat, Encoder * pEnc)
                         MACROBLOCK * pMB)  
1724  {  {
1725            float fSigma;
1726            int iSearchRange;
1727    
1728          pMB->mode = MODE_INTRA;          if (sStat->iMvCount == 0)
1729                    sStat->iMvCount = 1;
1730    
1731          /* zero mv statistics */          fSigma = (float) sqrt((float) sStat->iMvSum / sStat->iMvCount);
         pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;  
         pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;  
         pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;  
         pMB->sad16 = 0;  
1732    
1733          if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {          iSearchRange = 16 << pEnc->mbParam.m_fcode;
                 if (pMB->dquant != NO_CHANGE) {  
                         pMB->mode = MODE_INTRA_Q;  
                         pEnc->current->quant += DQtab[pMB->dquant];  
1734    
1735                          if (pEnc->current->quant > 31)          if ((3.0 * fSigma > iSearchRange) && (pEnc->mbParam.m_fcode <= 5) )
1736                                  pEnc->current->quant = 31;                  pEnc->mbParam.m_fcode++;
                         if (pEnc->current->quant < 1)  
                                 pEnc->current->quant = 1;  
                 }  
         }  
1737    
1738          pMB->quant = pEnc->current->quant;          else if ((5.0 * fSigma < iSearchRange)
1739  }                             && (4.0 * pEnc->fMvPrevSigma < iSearchRange)
1740                               && (pEnc->mbParam.m_fcode >= 2) )
1741                    pEnc->mbParam.m_fcode--;
1742    
1743            pEnc->fMvPrevSigma = fSigma;
1744    }
1745    
1746  #define FCODEBITS       3  #define BFRAME_SKIP_THRESHHOLD 30
 #define MODEBITS        5  
1747    
1748  void  static void
1749  HintedMESet(Encoder * pEnc,  SliceCodeP(SMPData *data)
                         int *intra)  
1750  {  {
1751          HINTINFO *hint;          Encoder *pEnc = (Encoder *) data->pEnc;
1752          Bitstream bs;          Bitstream *bs = (Bitstream *) data->bs;
         int length, high;  
         uint32_t x, y;  
1753    
1754          hint = pEnc->mbParam.hint;          int x, y, k;
1755            FRAMEINFO *const current = pEnc->current;
1756            FRAMEINFO *const reference = pEnc->reference;
1757            MBParam * const pParam = &pEnc->mbParam;
1758            int mb_width = pParam->mb_width;
1759            int mb_height = pParam->mb_height;
1760    
1761          if (hint->rawhints) {          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1762                  *intra = hint->mvhint.intra;          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1763          } else {  
1764                  BitstreamInit(&bs, hint->hintstream, hint->hintlength);          int bound = 0, num_slices = pEnc->num_slices;
1765                  *intra = BitstreamGetBit(&bs);  
1766            if (data->start_y > 0) { /* write resync marker */
1767                    bound = data->start_y*mb_width;
1768                    write_video_packet_header(bs, pParam, current, bound);
1769          }          }
1770    
1771          if (*intra) {          for (y = data->start_y; y < data->stop_y; y++) {
1772                  return;                  int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1773    
1774                    if (new_bound > bound) {
1775                            bound = new_bound;
1776                            BitstreamPadAlways(bs);
1777                            write_video_packet_header(bs, pParam, current, bound);
1778          }          }
1779    
1780          pEnc->current->fcode =                  for (x = 0; x < mb_width; x++) {
1781                  (hint->rawhints) ? hint->mvhint.fcode : BitstreamGetBits(&bs,                          MACROBLOCK *pMB = &current->mbs[x + y * pParam->mb_width];
1782                                                                                                                                   FCODEBITS);                          int skip_possible;
1783    
1784          length = pEnc->current->fcode + 5;                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {
1785          high = 1 << (length - 1);                                  CodeIntraMB(pMB);
1786                                    MBTransQuantIntra(pParam, current, pMB, x, y,
1787          for (y = 0; y < pEnc->mbParam.mb_height; ++y) {                                                                    dct_codes, qcoeff);
1788                  for (x = 0; x < pEnc->mbParam.mb_width; ++x) {  
1789                          MACROBLOCK *pMB =                                  start_timer();
1790                                  &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];                                  MBPrediction(current, x, y, pParam->mb_width, qcoeff, bound);
1791                          MVBLOCKHINT *bhint =                                  stop_prediction_timer();
1792                                  &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];  
1793                          VECTOR pred;                                  data->sStat->kblks++;
                         VECTOR tmp;  
                         int vec;  
   
                         pMB->mode =  
                                 (hint->rawhints) ? bhint->mode : BitstreamGetBits(&bs,  
                                                                                                                                   MODEBITS);  
   
                         pMB->mode = (pMB->mode == MODE_INTER_Q) ? MODE_INTER : pMB->mode;  
                         pMB->mode = (pMB->mode == MODE_INTRA_Q) ? MODE_INTRA : pMB->mode;  
   
                         if (pMB->mode == MODE_INTER) {  
                                 tmp.x =  
                                         (hint->rawhints) ? bhint->mvs[0].x : BitstreamGetBits(&bs,  
                                                                                                                                                   length);  
                                 tmp.y =  
                                         (hint->rawhints) ? bhint->mvs[0].y : BitstreamGetBits(&bs,  
                                                                                                                                                   length);  
                                 tmp.x -= (tmp.x >= high) ? high * 2 : 0;  
                                 tmp.y -= (tmp.y >= high) ? high * 2 : 0;  
   
                                 pred = get_pmv2(pEnc->current->mbs,pEnc->mbParam.mb_width,0,x,y,0);  
   
                                 for (vec = 0; vec < 4; ++vec) {  
                                         pMB->mvs[vec].x = tmp.x;  
                                         pMB->mvs[vec].y = tmp.y;  
                                         pMB->pmvs[vec].x = pMB->mvs[0].x - pred.x;  
                                         pMB->pmvs[vec].y = pMB->mvs[0].y - pred.y;  
                                 }  
                         } else if (pMB->mode == MODE_INTER4V) {  
                                 for (vec = 0; vec < 4; ++vec) {  
                                         tmp.x =  
                                                 (hint->rawhints) ? bhint->mvs[vec].  
                                                 x : BitstreamGetBits(&bs, length);  
                                         tmp.y =  
                                                 (hint->rawhints) ? bhint->mvs[vec].  
                                                 y : BitstreamGetBits(&bs, length);  
                                         tmp.x -= (tmp.x >= high) ? high * 2 : 0;  
                                         tmp.y -= (tmp.y >= high) ? high * 2 : 0;  
   
                                         pred = get_pmv2(pEnc->current->mbs,pEnc->mbParam.mb_width,0,x,y,vec);  
   
                                         pMB->mvs[vec].x = tmp.x;  
                                         pMB->mvs[vec].y = tmp.y;  
                                         pMB->pmvs[vec].x = pMB->mvs[vec].x - pred.x;  
                                         pMB->pmvs[vec].y = pMB->mvs[vec].y - pred.y;  
                                 }  
                         } else                          // intra / stuffing / not_coded  
                         {  
                                 for (vec = 0; vec < 4; ++vec) {  
                                         pMB->mvs[vec].x = pMB->mvs[vec].y = 0;  
                                 }  
                         }  
   
                         if (pMB->mode == MODE_INTER4V &&  
                                 (pEnc->current->global_flags & XVID_LUMIMASKING)  
                                 && pMB->dquant != NO_CHANGE) {  
                                 pMB->mode = MODE_INTRA;  
1794    
1795                                  for (vec = 0; vec < 4; ++vec) {                                  MBCoding(current, pMB, qcoeff, bs, data->sStat);
1796                                          pMB->mvs[vec].x = pMB->mvs[vec].y = 0;                                  stop_coding_timer();
1797                                  }                                  continue;
                         }  
                 }  
         }  
1798  }  }
1799    
1800                            start_timer();
1801                            MBMotionCompensation(pMB, x, y, &reference->image,
1802                                                                     &pEnc->vInterH, &pEnc->vInterV,
1803                                                                     &pEnc->vInterHV, &pEnc->vGMC,
1804                                                                     &current->image,
1805                                                                     dct_codes, pParam->width,
1806                                                                     pParam->height,
1807                                                                     pParam->edged_width,
1808                                                                     (current->vol_flags & XVID_VOL_QUARTERPEL),
1809                                                                     current->rounding_type,
1810                                                                     data->RefQ);
1811    
1812  void                          stop_comp_timer();
 HintedMEGet(Encoder * pEnc,  
                         int intra)  
 {  
         HINTINFO *hint;  
         Bitstream bs;  
         uint32_t x, y;  
         int length, high;  
1813    
1814          hint = pEnc->mbParam.hint;                          pMB->field_pred = 0;
1815    
1816          if (hint->rawhints) {                          if (pMB->cbp != 0) {
1817                  hint->mvhint.intra = intra;                                  pMB->cbp = MBTransQuantInter(pParam, current, pMB, x, y,
1818          } else {                                                               dct_codes, qcoeff);
                 BitstreamInit(&bs, hint->hintstream, 0);  
                 BitstreamPutBit(&bs, intra);  
1819          }          }
1820    
1821          if (intra) {                          if (pMB->dquant != 0)
1822                  if (!hint->rawhints) {                                  MBSetDquant(pMB, x, y, pParam);
                         BitstreamPad(&bs);  
                         hint->hintlength = BitstreamLength(&bs);  
                 }  
                 return;  
         }  
1823    
         length = pEnc->current->fcode + 5;  
         high = 1 << (length - 1);  
1824    
1825          if (hint->rawhints) {                          if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||
1826                  hint->mvhint.fcode = pEnc->current->fcode;                                     pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||
1827                                       pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {
1828                                    data->sStat->mblks++;
1829          } else {          } else {
1830                  BitstreamPutBits(&bs, pEnc->current->fcode, FCODEBITS);                                  data->sStat->ublks++;
1831          }          }
1832    
1833          for (y = 0; y < pEnc->mbParam.mb_height; ++y) {                          start_timer();
                 for (x = 0; x < pEnc->mbParam.mb_width; ++x) {  
                         MACROBLOCK *pMB =  
                                 &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
                         MVBLOCKHINT *bhint =  
                                 &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];  
                         VECTOR tmp;  
1834    
1835                          if (hint->rawhints) {                          /* Finished processing the MB, now check if to CODE or SKIP */
                                 bhint->mode = pMB->mode;  
                         } else {  
                                 BitstreamPutBits(&bs, pMB->mode, MODEBITS);  
                         }  
1836    
1837                          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q) {                          skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER);
1838                                  tmp.x = pMB->mvs[0].x;  
1839                                  tmp.y = pMB->mvs[0].y;                          if (current->coding_type == S_VOP)
1840                                  tmp.x += (tmp.x < 0) ? high * 2 : 0;                                  skip_possible &= (pMB->mcsel == 1);
1841                                  tmp.y += (tmp.y < 0) ? high * 2 : 0;                          else { /* PVOP */
1842                                    const VECTOR * const mv = (pParam->vol_flags & XVID_VOL_QUARTERPEL) ?
1843                                  if (hint->rawhints) {                                                                                  pMB->qmvs : pMB->mvs;
1844                                          bhint->mvs[0].x = tmp.x;                                  skip_possible &= ((mv->x|mv->y) == 0);
                                         bhint->mvs[0].y = tmp.y;  
                                 } else {  
                                         BitstreamPutBits(&bs, tmp.x, length);  
                                         BitstreamPutBits(&bs, tmp.y, length);  
1845                                  }                                  }
                         } else if (pMB->mode == MODE_INTER4V) {  
                                 int vec;  
1846    
1847                                  for (vec = 0; vec < 4; ++vec) {                          if ((pMB->mode == MODE_NOT_CODED) || (skip_possible)) {
1848                                          tmp.x = pMB->mvs[vec].x;                                  /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */
1849                                          tmp.y = pMB->mvs[vec].y;                                  int bSkip = 1;
1850                                          tmp.x += (tmp.x < 0) ? high * 2 : 0;  
1851                                          tmp.y += (tmp.y < 0) ? high * 2 : 0;                                  if (current->coding_type == P_VOP) {    /* special rule for P-VOP's SKIP */
1852                                            for (k = pEnc->bframenum_head; k < pEnc->bframenum_tail; k++) {
1853                                          if (hint->rawhints) {                                                  int iSAD;
1854                                                  bhint->mvs[vec].x = tmp.x;                                                  iSAD = sad16(reference->image.y + 16*y*pParam->edged_width + 16*x,
1855                                                  bhint->mvs[vec].y = tmp.y;                                                                                  pEnc->bframes[k]->image.y + 16*y*pParam->edged_width + 16*x,
1856                                                                                    pParam->edged_width, BFRAME_SKIP_THRESHHOLD * pMB->quant);
1857                                                    if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant || ((bound > 1) &&
1858                                                            ((y*mb_width+x == bound) || (y*mb_width+x == bound+1)))) { /* Some third-party decoders have problems with coloc skip MB before or after
1859                                                                                                                                                                               resync marker in BVOP. We avoid any ambiguity and force no skip at slice boundary */
1860                                                            bSkip = 0; /* could not SKIP */
1861                                                            if (pParam->vol_flags & XVID_VOL_QUARTERPEL) {
1862                                                                    VECTOR predMV = get_qpmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1863                                                                    pMB->pmvs[0].x = - predMV.x;
1864                                                                    pMB->pmvs[0].y = - predMV.y;
1865                                          } else {                                          } else {
1866                                                  BitstreamPutBits(&bs, tmp.x, length);                                                                  VECTOR predMV = get_pmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1867                                                  BitstreamPutBits(&bs, tmp.y, length);                                                                  pMB->pmvs[0].x = - predMV.x;
1868                                                                    pMB->pmvs[0].y = - predMV.y;
1869                                                            }
1870                                                            pMB->mode = MODE_INTER;
1871                                                            pMB->cbp = 0;
1872                                                            break;
1873                                          }                                          }
1874                                  }                                  }
1875                          }                          }
1876    
1877                                    if (bSkip) {
1878                                            /* do SKIP */
1879                                            pMB->mode = MODE_NOT_CODED;
1880                                            MBSkip(bs);
1881                                            stop_coding_timer();
1882                                            continue;       /* next MB */
1883                  }                  }
1884          }          }
1885    
1886          if (!hint->rawhints) {                          /* ordinary case: normal coded INTER/INTER4V block */
1887                  BitstreamPad(&bs);                          MBCoding(current, pMB, qcoeff, bs, data->sStat);
1888                  hint->hintlength = BitstreamLength(&bs);                          stop_coding_timer();
1889          }          }
1890  }  }
1891    
1892            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
1893            emms();
1894    }
1895    
1896    /* FrameCodeP also handles S(GMC)-VOPs */
1897  static int  static int
1898  FrameCodeI(Encoder * pEnc,  FrameCodeP(Encoder * pEnc, Bitstream * bs)
                    Bitstream * bs,  
                    uint32_t * pBits)  
1899  {  {
1900            int bits = BitstreamPos(bs);
1901    
1902          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          FRAMEINFO *const current = pEnc->current;
1903          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          FRAMEINFO *const reference = pEnc->reference;
1904            MBParam * const pParam = &pEnc->mbParam;
1905          uint16_t x, y;          int mb_width = pParam->mb_width;
1906            int mb_height = pParam->mb_height;
1907          pEnc->iFrameNum = 0;          int coded = 1;
1908          pEnc->mbParam.m_rounding_type = 1;  
1909          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;          int k = 0, bound = 0, num_slices = pEnc->num_slices;
1910          pEnc->current->quarterpel =  pEnc->mbParam.m_quarterpel;          int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1911          pEnc->current->coding_type = I_VOP;          void * status = NULL;
1912            int slices_per_thread = (num_slices*1024 / num_threads);
1913            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
1914    
1915          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);          IMAGE *pRef = &reference->image;
1916    
1917  #define DIVX501B481P "DivX501b481p"          if (!reference->is_edged) {
1918          if ((pEnc->global & XVID_GLOBAL_PACKED)) {                  start_timer();
1919                  BitstreamWriteUserData(bs, DIVX501B481P, strlen(DIVX501B481P));                  image_setedges(pRef, pParam->edged_width, pParam->edged_height,
1920                                               pParam->width, pParam->height, 0);
1921                    stop_edges_timer();
1922                    reference->is_edged = 1;
1923          }          }
1924    
1925  #define XVID_ID "XviD" XVID_BS_VERSION          pParam->m_rounding_type = 1 - pParam->m_rounding_type;
1926          BitstreamWriteUserData(bs, XVID_ID, strlen(XVID_ID));          current->rounding_type = pParam->m_rounding_type;
1927            current->fcode = pParam->m_fcode;
         set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);  
         BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);  
1928    
1929          *pBits = BitstreamPos(bs);          if ((current->vop_flags & XVID_VOP_HALFPEL)) {
1930                    if (reference->is_interpolated != current->rounding_type) {
1931                            start_timer();
1932                            image_interpolate(pRef->y, pEnc->vInterH.y, pEnc->vInterV.y,
1933                                                              pEnc->vInterHV.y, pParam->edged_width,
1934                                                              pParam->edged_height,
1935                                                              (pParam->vol_flags & XVID_VOL_QUARTERPEL),
1936                                                              current->rounding_type);
1937                            stop_inter_timer();
1938                            reference->is_interpolated = current->rounding_type;
1939                    }
1940            }
1941    
1942          pEnc->sStat.iTextBits = 0;          current->sStat.iTextBits = current->sStat.iMvSum = current->sStat.iMvCount =
1943          pEnc->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;                  current->sStat.kblks = current->sStat.mblks = current->sStat.ublks =
1944          pEnc->sStat.mblks = pEnc->sStat.ublks = 0;                  current->sStat.iMVBits = 0;
1945    
1946          for (y = 0; y < pEnc->mbParam.mb_height; y++)          current->coding_type = P_VOP;
                 for (x = 0; x < pEnc->mbParam.mb_width; x++) {  
                         MACROBLOCK *pMB =  
                                 &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
1947    
1948                          CodeIntraMB(pEnc, pMB);          if (current->vop_flags & XVID_VOP_RD_PSNRHVSM) {
1949                    image_block_variance(&current->image, pParam->edged_width, current->mbs,
1950                                         pParam->mb_width, pParam->mb_height);
1951            }
1952    
1953                          MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
                                                           dct_codes, qcoeff);  
1954    
1955                          start_timer();          SetMacroblockQuants(&pEnc->mbParam, current);
                         MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);  
                         stop_prediction_timer();  
1956    
1957                          start_timer();                          start_timer();
1958                          if (pEnc->current->global_flags & XVID_GREYSCALE)          if (current->vol_flags & XVID_VOL_GMC)  /* GMC only for S(GMC)-VOPs */
1959                          {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */          {       int gmcval;
1960                                  qcoeff[4*64+0]=0;               /* zero, because for INTRA MBs DC value is saved */                  current->warp = GlobalMotionEst( current->mbs, pParam, current, reference,
1961                                  qcoeff[5*64+0]=0;                                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV, num_slices);
1962                          }  
1963                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->sStat);                  if (current->motion_flags & XVID_ME_GME_REFINE) {
1964                          stop_coding_timer();                          gmcval = GlobalMotionEstRefine(&current->warp,
1965                  }                                                                                     current->mbs, pParam,
1966                                                                                       current, reference,
1967          emms();                                                                                     &current->image,
1968                                                                                       &reference->image,
1969                                                                                       &pEnc->vInterH,
1970                                                                                       &pEnc->vInterV,
1971                                                                                       &pEnc->vInterHV);
1972                    } else {
1973                            gmcval = globalSAD(&current->warp, pParam, current->mbs,
1974                                                               current,
1975                                                               &reference->image,
1976                                                               &current->image,
1977                                                               pEnc->vGMC.y);
1978                    }
1979    
1980                    gmcval += /*current->quant*/ 2 * (int)(pParam->mb_width*pParam->mb_height);
1981    
1982                    /* 1st '3': 3 warpoints, 2nd '3': 16th pel res (2<<3) */
1983                    generate_GMCparameters( 3, 3, &current->warp,
1984                                    pParam->width, pParam->height,
1985                                    &current->new_gmc_data);
1986    
1987                    if ( (gmcval<0) && ( (current->warp.duv[1].x != 0) || (current->warp.duv[1].y != 0) ||
1988                             (current->warp.duv[2].x != 0) || (current->warp.duv[2].y != 0) ) )
1989                    {
1990                            current->coding_type = S_VOP;
1991    
1992                            generate_GMCimage(&current->new_gmc_data, &reference->image,
1993                                    pParam->mb_width, pParam->mb_height,
1994                                    pParam->edged_width, pParam->edged_width/2,
1995                                    pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
1996                                    current->rounding_type, current->mbs, &pEnc->vGMC);
1997    
1998          *pBits = BitstreamPos(bs) - *pBits;                  } else {
         pEnc->sStat.fMvPrevSigma = -1;  
         pEnc->sStat.iMvSum = 0;  
         pEnc->sStat.iMvCount = 0;  
         pEnc->mbParam.m_fcode = 2;  
1999    
2000          if (pEnc->current->global_flags & XVID_HINTEDME_GET) {                          generate_GMCimage(&current->new_gmc_data, &reference->image,
2001                  HintedMEGet(pEnc, 1);                                  pParam->mb_width, pParam->mb_height,
2002                                    pParam->edged_width, pParam->edged_width/2,
2003                                    pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
2004                                    current->rounding_type, current->mbs, NULL);    /* no warping, just AMV */
2005          }          }
   
         return 1;                                       // intra  
2006  }  }
2007    
2008            if (pEnc->num_threads > 0) {
2009    
2010  #define INTRA_THRESHOLD 0.5                  /* multithreaded motion estimation - dispatch threads */
2011  #define BFRAME_SKIP_THRESHHOLD 30                  while (k < pEnc->num_threads) {
2012                            int i, add_s = (slices_per_thread + 512) >> 10;
2013                            int add_t = (threads_per_slice + 512) >> 10;
2014    
2015  static int                          int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2016  FrameCodeP(Encoder * pEnc,                          int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2017                     Bitstream * bs,                          int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
                    uint32_t * pBits,  
                    bool force_inter,  
                    bool vol_header)  
 {  
         float fSigma;  
2018    
2019          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);                          slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2020          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);                          threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
2021    
2022          int iLimit;                          for (i = 0; i < add_t; i++) {
2023          int x, y, k;                                  memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
         int iSearchRange;  
         int bIntra, skip_possible;  
2024    
2025          /* IMAGE *pCurrent = &pEnc->current->image; */                                  pEnc->smpData[k+i].pEnc = (void *) pEnc;
2026          IMAGE *pRef = &pEnc->reference->image;                                  pEnc->smpData[k+i].y_row = i;
2027                                    pEnc->smpData[k+i].y_step = add_t;
2028                                    pEnc->smpData[k+i].stop_y = stop_y;
2029                                    pEnc->smpData[k+i].start_y = start_y;
2030    
2031          start_timer();                                  /* todo: sort out temp space once and for all */
2032          image_setedges(pRef, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2033                                     pEnc->mbParam.width, pEnc->mbParam.height);                                                                                          16*((k+i)>>1)*pParam->edged_width;
2034          stop_edges_timer();                          }
2035    
2036          pEnc->mbParam.m_rounding_type = 1 - pEnc->mbParam.m_rounding_type;                          pEnc->smpData[k].complete_count_above =
2037          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;                                  pEnc->smpData[k+add_t-1].complete_count_self - 1;
         pEnc->current->quarterpel =  pEnc->mbParam.m_quarterpel;  
         pEnc->current->fcode = pEnc->mbParam.m_fcode;  
2038    
2039          if (!force_inter)                          bound += add_s;
2040                  iLimit =                          k += add_t;
2041                          (int) (pEnc->mbParam.mb_width * pEnc->mbParam.mb_height *                  }
                                    INTRA_THRESHOLD);  
         else  
                 iLimit = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height + 1;  
2042    
2043          if ((pEnc->current->global_flags & XVID_HALFPEL)) {                  for (k = 1; k < pEnc->num_threads; k++) {
2044                  start_timer();                          pthread_create(&pEnc->smpData[k].handle, NULL,
2045                  image_interpolate(pRef, &pEnc->vInterH, &pEnc->vInterV,                                  (void*)MotionEstimateSMP, (void*)&pEnc->smpData[k]);
                                                   &pEnc->vInterHV, pEnc->mbParam.edged_width,  
                                                   pEnc->mbParam.edged_height,  
                                                   pEnc->mbParam.m_quarterpel,  
                                                   pEnc->current->rounding_type);  
                 stop_inter_timer();  
2046          }          }
2047    
2048          if (pEnc->current->global_flags & XVID_GMC) {                  MotionEstimateSMP(&pEnc->smpData[0]);
 //              printf("Global Motion = %d %d quarterpel=%d\n", pEnc->current->GMC_MV.x, pEnc->current->GMC_MV.y,pEnc->current->quarterpel);  
                 DPRINTF(DPRINTF_HEADER, "Global Motion = %d %d quarterpel=%d\n", pEnc->current->GMC_MV.x, pEnc->current->GMC_MV.y,pEnc->current->quarterpel);  
                 pEnc->current->coding_type = S_VOP;  
         } else  
                 pEnc->current->coding_type = P_VOP;  
2049    
2050          start_timer();                  for (k = 1; k < pEnc->num_threads; k++) {
2051          if (pEnc->current->global_flags & XVID_HINTEDME_SET) {                          pthread_join(pEnc->smpData[k].handle, &status);
2052                  HintedMESet(pEnc, &bIntra);                  }
2053          if (bIntra == 0) {  
2054                          pEnc->current->fcode = FindFcode(&pEnc->mbParam, pEnc->current);                  current->fcode = 0;
2055                          MotionEstimationHinted(&pEnc->mbParam, pEnc->current, pEnc->reference,                  for (k = 0; k < pEnc->num_threads; k++) {
2056                                                                                          &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV);                          current->sStat.iMvSum += pEnc->smpData[k].mvSum;
2057                            current->sStat.iMvCount += pEnc->smpData[k].mvCount;
2058                            if (pEnc->smpData[k].minfcode > current->fcode)
2059                                    current->fcode = pEnc->smpData[k].minfcode;
2060                  }                  }
2061    
2062          } else {          } else {
2063    
2064                  bIntra =                  /* regular ME */
2065                          MotionEstimation(&pEnc->mbParam, pEnc->current, pEnc->reference,  
2066                    MotionEstimation(&pEnc->mbParam, current, reference,
2067                           &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                           &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
2068                           iLimit);                                                   &pEnc->vGMC, 256*4096, num_slices);
         }  
         stop_motion_timer();  
2069    
2070          if (bIntra == 1) return FrameCodeI(pEnc, bs, pBits);          }
2071    
2072          if ( (pEnc->current->GMC_MV.x == 0) && (pEnc->current->GMC_MV.y == 0) )          stop_motion_timer();
                         pEnc->current->coding_type = P_VOP;             /* no global motion -> no GMC */  
2073    
2074            set_timecodes(current,reference,pParam->fbase);
2075    
2076          if (vol_header)          BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 1, current->mbs[0].quant);
                 BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);  
2077    
2078            /* multithreaded inter coding - dispatch threads */
2079    
2080          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);          bound = 0;
2081          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1);          slices_per_thread = (num_slices*1024 / num_threads);
2082    
2083          *pBits = BitstreamPos(bs);          for (k = 0; k < num_threads; k++) {
2084                    int add = ((slices_per_thread + 512) >> 10);
2085    
2086          pEnc->sStat.iTextBits = pEnc->sStat.iMvSum = pEnc->sStat.iMvCount =                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
                 pEnc->sStat.kblks = pEnc->sStat.mblks = pEnc->sStat.ublks = 0;  
2087    
2088          for (y = 0; y < pEnc->mbParam.mb_height; y++) {                  pEnc->smpData[k].pEnc = (void *) pEnc;
2089                  for (x = 0; x < pEnc->mbParam.mb_width; x++) {                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2090                          MACROBLOCK *pMB =                  pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2091                                  &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];                  pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2092    
2093                          bIntra = (pMB->mode == MODE_INTRA) || (pMB->mode == MODE_INTRA_Q);                  bound += add;
2094    
2095                          if (!bIntra) {                  if (k > 0) {
2096                                  start_timer();                          pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2097                                  MBMotionCompensation(pMB, x, y, &pEnc->reference->image,                          pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks =
2098                                                                           &pEnc->vInterH, &pEnc->vInterV,                          pEnc->smpData[k].sStat->iMVBits = 0;
                                                                          &pEnc->vInterHV, &pEnc->current->image,  
                                                                          dct_codes, pEnc->mbParam.width,  
                                                                          pEnc->mbParam.height,  
                                                                          pEnc->mbParam.edged_width,  
                                                                          pEnc->mbParam.m_quarterpel,  
                                                                          pEnc->current->rounding_type);  
                                 stop_comp_timer();  
2099    
2100                                  if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {                          BitstreamReset(pEnc->smpData[k].bs);
                                         if (pMB->dquant != NO_CHANGE) {  
                                                 pMB->mode = MODE_INTER_Q;  
                                                 pEnc->current->quant += DQtab[pMB->dquant];  
                                                 if (pEnc->current->quant > 31)  
                                                         pEnc->current->quant = 31;  
                                                 else if (pEnc->current->quant < 1)  
                                                         pEnc->current->quant = 1;  
2101                                          }                                          }
2102                                  }                                  }
2103                                  pMB->quant = pEnc->current->quant;          pEnc->smpData[0].bs = bs;
2104            pEnc->smpData[0].sStat = &current->sStat;
2105    
2106                                  pMB->field_pred = 0;          /* create threads */
2107            for (k = 1; k < num_threads; k++) {
2108                                  if (pMB->mode != MODE_NOT_CODED)                  pthread_create(&pEnc->smpData[k].handle, NULL,
2109                                          pMB->cbp =                          (void*)SliceCodeP, (void*)&pEnc->smpData[k]);
                                                 MBTransQuantInter(&pEnc->mbParam, pEnc->current, pMB, x, y,  
                                                                                   dct_codes, qcoeff);  
                         } else {  
                                 CodeIntraMB(pEnc, pMB);  
                                 MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,  
                                                                   dct_codes, qcoeff);  
2110                          }                          }
2111    
2112                          start_timer();          SliceCodeP(&pEnc->smpData[0]);
                         MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);  
                         stop_prediction_timer();  
2113    
2114                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {          /* wait until all threads are finished */
2115                                  pEnc->sStat.kblks++;          for (k = 1; k < num_threads; k++) {
2116                          } else if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||                  pthread_join(pEnc->smpData[k].handle, &status);
                                            pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||  
                                            pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {  
                                 pEnc->sStat.mblks++;  
                         }  else {  
                                 pEnc->sStat.ublks++;  
2117                          }                          }
2118    
2119                          start_timer();          current->length = BitstreamLength(bs) - (bits/8);
2120    
2121                          /* Finished processing the MB, now check if to CODE or SKIP */          /* reassemble the pieces together */
2122            SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
2123    
2124                          skip_possible = (pMB->cbp == 0) & (pMB->mode == MODE_INTER) &          updateFcode(&current->sStat, pEnc);
                                                         (pMB->dquant == NO_CHANGE);  
2125    
2126                          if(pEnc->mbParam.m_quarterpel)          /* frame drop code */
2127                          {       skip_possible &= (pMB->qmvs[0].x == pEnc->current->GMC_MV.x) & (pMB->qmvs[0].y == pEnc->current->GMC_MV.y);  #if 0
2128                          }          DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", current->sStat.kblks, current->sStat.mblks, current->sStat.ublks);
2129                          else  #endif
                         {       skip_possible &= (pMB->mvs[0].x == pEnc->current->GMC_MV.x) & (pMB->mvs[0].y == pEnc->current->GMC_MV.y);  
                         }  
2130    
2131                          if ( (pMB->mode == MODE_NOT_CODED) || (skip_possible)) {          if (current->sStat.kblks + current->sStat.mblks <
2132                    (pParam->frame_drop_ratio * mb_width * mb_height) / 100 &&
2133                    ( (pEnc->bframenum_head >= pEnc->bframenum_tail) || !(pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP)) )
2134            {
2135                    current->sStat.kblks = current->sStat.mblks = current->sStat.iTextBits = 0;
2136                    current->sStat.ublks = mb_width * mb_height;
2137    
2138  /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */                  BitstreamReset(bs);
                                 int bSkip = 1;  
2139    
2140                                  if (pEnc->current->coding_type == P_VOP)        /* special rule for P-VOP's SKIP */                  set_timecodes(current,reference,pParam->fbase);
2141                                          for (k=pEnc->bframenum_head; k< pEnc->bframenum_tail; k++)                  BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 0, current->mbs[0].quant);
2142                                          {  
2143                                                  int iSAD;                  /* copy reference frame details into the current frame */
2144                                                  iSAD = sad16(pEnc->reference->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,                  current->quant = reference->quant;
2145                                                                          pEnc->bframes[k]->image.y + 16*y*pEnc->mbParam.edged_width + 16*x,                  current->motion_flags = reference->motion_flags;
2146                                                                  pEnc->mbParam.edged_width,BFRAME_SKIP_THRESHHOLD);                  current->rounding_type = reference->rounding_type;
2147                                                  if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant)                  current->fcode = reference->fcode;
2148                                                  {       bSkip = 0;                  current->bcode = reference->bcode;
2149                                                          break;                  current->stamp = reference->stamp;
2150                                                  }                  image_copy(&current->image, &reference->image, pParam->edged_width, pParam->height);
2151                    memcpy(current->mbs, reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);
2152                    coded = 0;
2153    
2154                    BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2155    
2156                    current->length = (BitstreamPos(bs) - bits) / 8;
2157    
2158            } else {
2159    
2160                    pEnc->current->is_edged = 0; /* not edged */
2161                    pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
2162    
2163                    /* what was this frame's interpolated reference will become
2164                            forward (past) reference in b-frame coding */
2165    
2166                    image_swap(&pEnc->vInterH, &pEnc->f_refh);
2167                    image_swap(&pEnc->vInterV, &pEnc->f_refv);
2168                    image_swap(&pEnc->vInterHV, &pEnc->f_refhv);
2169                                          }                                          }
2170    
2171                                  if (!bSkip)          /* XXX: debug
2172                                  {                                  {
2173                                          VECTOR predMV;                  char s[100];
2174                                          if(pEnc->mbParam.m_quarterpel) {                  sprintf(s, "\\%05i_cur.pgm", pEnc->m_framenum);
2175                                                  predMV = get_qpmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);                  image_dump_yuvpgm(&current->image,
2176                                                  pMB->pmvs[0].x = pMB->qmvs[0].x - predMV.x;  /* with GMC, qmvs doesn't have to be (0,0)! */                          pParam->edged_width,
2177                                                  pMB->pmvs[0].y = pMB->qmvs[0].y - predMV.y;                          pParam->width, pParam->height, s);
2178                                          }  
2179                                          else {                  sprintf(s, "\\%05i_ref.pgm", pEnc->m_framenum);
2180                                                  predMV = get_pmv2(pEnc->current->mbs, pEnc->mbParam.mb_width, 0, x, y, 0);                  image_dump_yuvpgm(&reference->image,
2181                                                  pMB->pmvs[0].x = pMB->mvs[0].x - predMV.x; /* with GMC, mvs doesn't have to be (0,0)! */                          pParam->edged_width,
2182                                                  pMB->pmvs[0].y = pMB->mvs[0].y - predMV.y;                          pParam->width, pParam->height, s);
2183                                          }                                          }
2184                                          pMB->mode = MODE_INTER;          */
2185                                          pMB->cbp = 0;  
2186                                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->sStat);          return coded;
2187                                  }                                  }
2188                                  else  
2189    static void
2190    SliceCodeB(SMPData *data)
2191                                  {                                  {
2192                                          pMB->mode = MODE_NOT_CODED;          Encoder *pEnc = (Encoder *) data->pEnc;
2193                                          MBSkip(bs);          Bitstream *bs = (Bitstream *) data->bs;
                                 }  
2194    
2195                          } else {          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
2196                                  if (pEnc->current->global_flags & XVID_GREYSCALE)          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
                                 {       pMB->cbp &= 0x3C;               /* keep only bits 5-2 */  
                                         qcoeff[4*64+0]=0;               /* zero, because DC for INTRA MBs DC value is saved */  
                                         qcoeff[5*64+0]=0;  
                                 }  
                                 MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->sStat);  
                         }  
2197    
2198                          stop_coding_timer();          int x, y;
2199                  }          FRAMEINFO * const frame = (FRAMEINFO * const) data->current;
2200          }          MBParam * const pParam = &pEnc->mbParam;
2201            int mb_width = pParam->mb_width;
2202            int mb_height = pParam->mb_height;
2203            IMAGE *f_ref = &pEnc->reference->image;
2204            IMAGE *b_ref = &pEnc->current->image;
2205    
2206          emms();          int bound = data->start_y*mb_width;
2207            int num_slices = pEnc->num_slices;
2208    
2209          if (pEnc->current->global_flags & XVID_HINTEDME_GET) {          if (data->start_y > 0) { /* write resync marker */
2210                  HintedMEGet(pEnc, 0);                  write_video_packet_header(bs, pParam, frame, bound+1);
2211          }          }
2212    
2213          if (pEnc->sStat.iMvCount == 0)          for (y = data->start_y; y < MIN(data->stop_y+1, mb_height); y++) {
2214                  pEnc->sStat.iMvCount = 1;                  int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
2215                    int stop_x = (y == data->stop_y) ? 1 : mb_width;
2216                    int start_x = (y == data->start_y && y > 0) ? 1 : 0;
2217    
2218          fSigma = (float) sqrt((float) pEnc->sStat.iMvSum / pEnc->sStat.iMvCount);                  for (x = start_x; x < stop_x; x++) {
2219                            MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];
         iSearchRange = 1 << (3 + pEnc->mbParam.m_fcode);  
2220    
2221          if ((fSigma > iSearchRange / 3)                          /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */
2222                  && (pEnc->mbParam.m_fcode <= (3 + pEnc->mbParam.m_quarterpel))) // maximum search range 128                          if (mb->mode == MODE_NOT_CODED) {
2223          {                                  if (pParam->plugin_flags & XVID_REQORIGINAL) {
2224                  pEnc->mbParam.m_fcode++;                                          MBMotionCompensation(mb, x, y, f_ref, NULL, f_ref, NULL, NULL, &frame->image,
2225                  iSearchRange *= 2;                                                                                   NULL, 0, 0, pParam->edged_width, 0, 0, data->RefQ);
2226          } else if ((fSigma < iSearchRange / 6)                                  }
2227                             && (pEnc->sStat.fMvPrevSigma >= 0)                                  continue;
                            && (pEnc->sStat.fMvPrevSigma < iSearchRange / 6)  
                         && (pEnc->mbParam.m_fcode >= (2 + pEnc->mbParam.m_quarterpel))) // minimum search range 16  
         {  
                 pEnc->mbParam.m_fcode--;  
                 iSearchRange /= 2;  
2228          }          }
2229    
2230          pEnc->sStat.fMvPrevSigma = fSigma;                          if (new_bound > bound && x > 0) {
2231                                    bound = new_bound;
2232  #ifdef FRAMEDROP                                  BitstreamPadAlways(bs);
2233          /* frame drop code */                                  write_video_packet_header(bs, pParam, frame, y*mb_width+x);
2234          // DPRINTF(DPRINTF_DEBUG, "kmu %i %i %i", pEnc->sStat.kblks, pEnc->sStat.mblks, pEnc->sStat.ublks);                          }
         if (pEnc->sStat.kblks + pEnc->sStat.mblks <  
                 (pEnc->frame_drop_ratio * pEnc->mbParam.mb_width * pEnc->mbParam.mb_height) / 100)  
         {  
                 pEnc->sStat.kblks = pEnc->sStat.mblks = 0;  
                 pEnc->sStat.ublks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;  
2235    
2236                  BitstreamReset(bs);                          mb->quant = frame->quant;
2237    
2238                  set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);                          if (mb->cbp != 0 || pParam->plugin_flags & XVID_REQORIGINAL) {
2239                  BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 0);                                  /* we have to motion-compensate, transfer etc,
2240                                            because there might be blocks to code */
2241    
2242                  // copy reference frame details into the current frame                                  MBMotionCompensationBVOP(pParam, mb, x, y, &frame->image,
2243                  pEnc->current->quant = pEnc->reference->quant;                                                                                   f_ref, &pEnc->f_refh, &pEnc->f_refv,
2244                  pEnc->current->motion_flags = pEnc->reference->motion_flags;                                                                                   &pEnc->f_refhv, b_ref, &pEnc->vInterH,
2245                  pEnc->current->rounding_type = pEnc->reference->rounding_type;                                                                                   &pEnc->vInterV, &pEnc->vInterHV, dct_codes,
2246                  pEnc->current->quarterpel =  pEnc->reference->quarterpel;                                                                                   data->RefQ);
                 pEnc->current->fcode = pEnc->reference->fcode;  
                 pEnc->current->bcode = pEnc->reference->bcode;  
                 image_copy(&pEnc->current->image, &pEnc->reference->image, pEnc->mbParam.edged_width, pEnc->mbParam.height);  
                 memcpy(pEnc->current->mbs, pEnc->reference->mbs, sizeof(MACROBLOCK) * pEnc->mbParam.mb_width * pEnc->mbParam.mb_height);  
2247    
2248                                    mb->cbp = MBTransQuantInterBVOP(pParam, frame, mb, x, y,  dct_codes, qcoeff);
2249          }          }
 #endif  
2250    
2251          *pBits = BitstreamPos(bs) - *pBits;                          if (mb->mode == MODE_DIRECT_NO4V)
2252                                    mb->mode = MODE_DIRECT;
2253    
2254                            if (mb->mode == MODE_DIRECT && (mb->cbp | mb->pmvs[3].x | mb->pmvs[3].y) == 0)
2255                                    mb->mode = MODE_DIRECT_NONE_MV; /* skipped */
2256                            else
2257                                    if (frame->vop_flags & XVID_VOP_GREYSCALE)
2258                                            /* keep only bits 5-2 -- Chroma blocks will just be skipped by MBCodingBVOP */
2259                                            mb->cbp &= 0x3C;
2260    
2261          return 0;                                       // inter                          start_timer();
2262                            MBCodingBVOP(frame, mb, qcoeff, frame->fcode, frame->bcode, bs, data->sStat);
2263                            stop_coding_timer();
2264                    }
2265  }  }
2266    
2267            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2268            emms();
2269    }
2270    
2271  static __inline void  static void
2272  FrameCodeB(Encoder * pEnc,  FrameCodeB(Encoder * pEnc,
2273                     FRAMEINFO * frame,                     FRAMEINFO * frame,
2274                     Bitstream * bs,                     Bitstream * bs)
                    uint32_t * pBits)  
2275  {  {
2276          int16_t dct_codes[6 * 64];          int bits = BitstreamPos(bs);
2277          int16_t qcoeff[6 * 64];          int k = 0, bound = 0, num_slices = pEnc->num_slices;
2278          uint32_t x, y;          int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
2279            void * status = NULL;
2280            int slices_per_thread = (num_slices*1024 / num_threads);
2281            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
2282    
2283          IMAGE *f_ref = &pEnc->reference->image;          IMAGE *f_ref = &pEnc->reference->image;
2284          IMAGE *b_ref = &pEnc->current->image;          IMAGE *b_ref = &pEnc->current->image;
2285    
2286            MBParam * const pParam = &pEnc->mbParam;
2287            int mb_height = pParam->mb_height;
2288    
2289  #ifdef BFRAMES_DEC_DEBUG  #ifdef BFRAMES_DEC_DEBUG
2290          FILE *fp;          FILE *fp;
2291          static char first=0;          static char first=0;
# Line 1885  Line 2298 
2298          }          }
2299  #endif  #endif
2300    
2301          frame->quarterpel =  pEnc->mbParam.m_quarterpel;          /* forward  */
2302            if (!pEnc->reference->is_edged) {
         // forward  
2303          image_setedges(f_ref, pEnc->mbParam.edged_width,          image_setedges(f_ref, pEnc->mbParam.edged_width,
2304                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,
2305                                     pEnc->mbParam.height);                                             pEnc->mbParam.height, 0);
2306                    pEnc->reference->is_edged = 1;
2307            }
2308    
2309            if (pEnc->reference->is_interpolated != 0) {
2310          start_timer();          start_timer();
2311          image_interpolate(f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,                  image_interpolate(f_ref->y, pEnc->f_refh.y, pEnc->f_refv.y, pEnc->f_refhv.y,
2312                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2313                                            pEnc->mbParam.m_quarterpel, 0);                                                    (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2314          stop_inter_timer();          stop_inter_timer();
2315                    pEnc->reference->is_interpolated = 0;
2316            }
2317    
2318          // backward          /* backward */
2319            if (!pEnc->current->is_edged) {
2320          image_setedges(b_ref, pEnc->mbParam.edged_width,          image_setedges(b_ref, pEnc->mbParam.edged_width,
2321                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,                                     pEnc->mbParam.edged_height, pEnc->mbParam.width,
2322                                     pEnc->mbParam.height);                                             pEnc->mbParam.height, 0);
2323                    pEnc->current->is_edged = 1;
2324            }
2325    
2326            if (pEnc->current->is_interpolated != 0) {
2327          start_timer();          start_timer();
2328          image_interpolate(b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                  image_interpolate(b_ref->y, pEnc->vInterH.y, pEnc->vInterV.y, pEnc->vInterHV.y,
2329                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,                                            pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2330                                            pEnc->mbParam.m_quarterpel, 0);                                                  (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2331          stop_inter_timer();          stop_inter_timer();
2332                    pEnc->current->is_interpolated = 0;
2333            }
2334    
2335            frame->coding_type = B_VOP;
2336    
2337            if ((frame->vop_flags & XVID_VOP_RD_PSNRHVSM) && (frame->vop_flags & XVID_VOP_RD_BVOP)) {
2338                    image_block_variance(&frame->image, pEnc->mbParam.edged_width, frame->mbs,
2339                                         pEnc->mbParam.mb_width, pEnc->mbParam.mb_height);
2340            }
2341    
2342            call_plugins(pEnc, frame, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
2343    
2344            frame->fcode = frame->bcode = pEnc->current->fcode;
2345    
2346          start_timer();          start_timer();
2347    
2348          MotionEstimationBVOP(&pEnc->mbParam, frame,          if (pEnc->num_threads > 0) {
                 ((int32_t)(pEnc->current->stamp - frame->stamp)),                               // time_bp  
                 ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),     // time_pp  
                         pEnc->reference->mbs, f_ref,  
                                                  &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,  
                                                  pEnc->current, b_ref, &pEnc->vInterH,  
                                                  &pEnc->vInterV, &pEnc->vInterHV);  
2349    
2350                    /* multithreaded motion estimation - dispatch threads */
2351                    while (k < pEnc->num_threads) {
2352                            int i, add_s = (slices_per_thread + 512) >> 10;
2353                            int add_t = (threads_per_slice + 512) >> 10;
2354    
2355          stop_motion_timer();                          int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2356                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2357                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2358    
2359          /*if (test_quant_type(&pEnc->mbParam, pEnc->current))                          slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2360             {                          threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
            BitstreamWriteVolHeader(bs, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.quant_type);  
            } */  
2361    
2362          frame->coding_type = B_VOP;                          for (i = 0; i < add_t; i++) {
2363                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2364    
2365          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);                                  pEnc->smpData[k+i].pEnc = (void *) pEnc;
2366          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1);                                  pEnc->smpData[k+i].current = frame;
2367    
2368          *pBits = BitstreamPos(bs);                                  pEnc->smpData[k+i].y_row = i;
2369                                    pEnc->smpData[k+i].y_step = add_t;
2370                                    pEnc->smpData[k+i].stop_y = stop_y;
2371                                    pEnc->smpData[k+i].start_y = start_y;
2372    
2373          pEnc->sStat.iTextBits = 0;                                  /* todo: sort out temp space once and for all */
2374          pEnc->sStat.iMvSum = 0;                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2375          pEnc->sStat.iMvCount = 0;                                                                                          16*((k+i)>>1)*pParam->edged_width;
2376          pEnc->sStat.kblks = pEnc->sStat.mblks = pEnc->sStat.ublks = 0;                          }
2377    
2378                            pEnc->smpData[k].complete_count_above =
2379                                    pEnc->smpData[k+add_t-1].complete_count_self - 1;
2380    
2381          for (y = 0; y < pEnc->mbParam.mb_height; y++) {                          bound += add_s;
2382                  for (x = 0; x < pEnc->mbParam.mb_width; x++) {                          k += add_t;
2383                          MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];                  }
                         int direction = pEnc->global & XVID_ALTERNATESCAN ? 2 : 0;  
2384    
2385                          // decoder ignores mb when refence block is INTER(0,0), CBP=0                  for (k = 1; k < pEnc->num_threads; k++) {
2386                          if (mb->mode == MODE_NOT_CODED) {                          pthread_create(&pEnc->smpData[k].handle, NULL,
2387                                  //mb->mvs[0].x = mb->mvs[0].y = mb->cbp = 0;                                  (void*)SMPMotionEstimationBVOP, (void*)&pEnc->smpData[k]);
                                 continue;  
2388                          }                          }
2389    
2390                          if (mb->mode != MODE_DIRECT_NONE_MV) {                  SMPMotionEstimationBVOP(&pEnc->smpData[0]);
2391                                  MBMotionCompensationBVOP(&pEnc->mbParam, mb, x, y, &frame->image,  
2392                                                                           f_ref, &pEnc->f_refh, &pEnc->f_refv,                  for (k = 1; k < pEnc->num_threads; k++) {
2393                                                                           &pEnc->f_refhv, b_ref, &pEnc->vInterH,                          pthread_join(pEnc->smpData[k].handle, &status);
2394                    }
2395    
2396                    frame->fcode = frame->bcode = 0;
2397                    for (k = 0; k < pEnc->num_threads; k++) {
2398                            if (pEnc->smpData[k].minfcode > frame->fcode)
2399                                    frame->fcode = pEnc->smpData[k].minfcode;
2400                            if (pEnc->smpData[k].minbcode > frame->bcode)
2401                                    frame->bcode = pEnc->smpData[k].minbcode;
2402                    }
2403            } else {
2404    
2405                    MotionEstimationBVOP(&pEnc->mbParam, frame,
2406                                                             ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */
2407                                                             ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */
2408                                                             pEnc->reference->mbs, f_ref,
2409                                                             &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,
2410                                                             pEnc->current, b_ref, &pEnc->vInterH,
2411                                                                           &pEnc->vInterV, &pEnc->vInterHV,                                                                           &pEnc->vInterV, &pEnc->vInterHV,
2412                                                                           dct_codes);                                                           pEnc->num_slices);
2413            }
2414            stop_motion_timer();
2415    
2416                                  if (mb->mode == MODE_DIRECT_NO4V) mb->mode = MODE_DIRECT;          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);
2417                                  mb->quant = frame->quant;          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1, frame->quant);
2418    
2419            /* reset stats */
2420            frame->sStat.iTextBits = 0;
2421            frame->sStat.iMVBits = 0;
2422            frame->sStat.iMvSum = 0;
2423            frame->sStat.iMvCount = 0;
2424            frame->sStat.kblks = frame->sStat.mblks = frame->sStat.ublks = 0;
2425            frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
2426            frame->sStat.kblks = frame->sStat.ublks = 0;
2427    
2428            /* multithreaded inter coding - dispatch threads */
2429            bound = 0;
2430            slices_per_thread = (num_slices*1024 / num_threads);
2431    
2432                                  mb->cbp =          for (k = 0; k < num_threads; k++) {
2433                                          MBTransQuantInterBVOP(&pEnc->mbParam, frame, mb, dct_codes, qcoeff);                  int add = ((slices_per_thread + 512) >> 10);
2434    
2435                                  if ( (mb->mode == MODE_DIRECT) && (mb->cbp == 0)                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
2436                                          && (mb->pmvs[3].x == 0) && (mb->pmvs[3].y == 0) ) {  
2437                                          mb->mode = MODE_DIRECT_NONE_MV; // skipped                  pEnc->smpData[k].pEnc = (void *) pEnc;
2438                    pEnc->smpData[k].current = frame;
2439                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2440                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2441                    bound += add;
2442    
2443                    /* todo: sort out temp space once and for all */
2444                    pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2445    
2446                    if (k > 0) {
2447                            BitstreamReset(pEnc->smpData[k].bs);
2448                            pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2449                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks = pEnc->smpData[k].sStat->iMVBits = 0;
2450                                  }                                  }
2451                          }                          }
2452    
2453  #ifdef BFRAMES_DEC_DEBUG          for (k = 1; k < num_threads; k++) {
2454          BFRAME_DEBUG                  pthread_create(&pEnc->smpData[k].handle, NULL,
2455  #endif                          (void*)SliceCodeB, (void*)&pEnc->smpData[k]);
                         start_timer();  
                         MBCodingBVOP(mb, qcoeff, frame->fcode, frame->bcode, bs,  
                                                  &pEnc->sStat, direction);  
                         stop_coding_timer();  
                 }  
2456          }          }
2457    
2458          emms();          pEnc->smpData[0].bs = bs;
2459            pEnc->smpData[0].sStat = &frame->sStat;
2460            SliceCodeB(&pEnc->smpData[0]);
2461    
2462            for (k = 1; k < num_threads; k++) {
2463                    pthread_join(pEnc->smpData[k].handle, &status);
2464            }
2465    
2466          // TODO: dynamic fcode/bcode ???          frame->length = BitstreamLength(bs) - (bits/8);
2467    
2468          *pBits = BitstreamPos(bs) - *pBits;          /* reassemble the pieces together */
2469            SerializeBitstreams(pEnc, frame, bs, num_threads);
2470    
2471  #ifdef BFRAMES_DEC_DEBUG  #ifdef BFRAMES_DEC_DEBUG
2472          if (!first){          if (!first){
# Line 1992  Line 2476 
2476          }          }
2477  #endif  #endif
2478  }  }
   
   
 /*      in case internal output is needed somewhere... */  
 /*      {  
         FILE *filehandle;  
         filehandle=fopen("last-b.pgm","wb");  
         if (filehandle)  
         {  
                 fprintf(filehandle,"P5\n\n");           //  
                 fprintf(filehandle,"%d %d 255\n",pEnc->mbParam.edged_width,pEnc->mbParam.edged_height);  
                 fwrite(frame->image.y,pEnc->mbParam.edged_width,pEnc->mbParam.edged_height,filehandle);  
                 fclose(filehandle);  
                 }  
         }  
 */  

Legend:
Removed from v.1.76.2.20  
changed lines
  Added in v.1.135.2.3

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4