[cvs] / xvidcore / src / encoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/encoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.40, Sun Jun 9 23:30:50 2002 UTC revision 1.135.2.6, Thu Apr 7 19:07:36 2011 UTC
# Line 3  Line 3 
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  -  Encoder main module  -   *  -  Encoder main module  -
5   *   *
6   *  This program is an implementation of a part of one or more MPEG-4   *  Copyright(C) 2002-2010 Michael Militzer <isibaar@xvid.org>
7   *  Video tools as specified in ISO/IEC 14496-2 standard.  Those intending   *               2002-2003 Peter Ross <pross@xvid.org>
8   *  to use this software module in hardware or software products are   *               2002      Daniel Smith <danielsmith@astroboymail.com>
  *  advised that its use may infringe existing patents or copyrights, and  
  *  any such use would be at such party's own risk.  The original  
  *  developer of this software module and his/her company, and subsequent  
  *  editors and their companies, will have no liability for use of this  
  *  software or modifications or derivatives thereof.  
9   *   *
10   *  This program is free software; you can redistribute it and/or modify   *  This program is free software; you can redistribute it and/or modify
11   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 26  Line 21 
21   *  along with this program; if not, write to the Free Software   *  along with this program; if not, write to the Free Software
22   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
23   *   *
  ****************************************************************************/  
   
 /*****************************************************************************  
  *  
  *  History  
  *  
  *  08.05.2002 fix some problem in DEBUG mode;  
  *             MinChen <chenm001@163.com>  
  *  14.04.2002 added FrameCodeB()  
  *  
24   *  $Id$   *  $Id$
25   *   *
26   ****************************************************************************/   ****************************************************************************/
# Line 43  Line 28 
28  #include <stdlib.h>  #include <stdlib.h>
29  #include <stdio.h>  #include <stdio.h>
30  #include <math.h>  #include <math.h>
31    #include <string.h>
32    
33  #include "encoder.h"  #include "encoder.h"
34  #include "prediction/mbprediction.h"  #include "prediction/mbprediction.h"
35  #include "global.h"  #include "global.h"
36  #include "utils/timer.h"  #include "utils/timer.h"
37  #include "image/image.h"  #include "image/image.h"
38    #include "image/font.h"
39    #include "motion/sad.h"
40  #include "motion/motion.h"  #include "motion/motion.h"
41    #include "motion/gmc.h"
42    
43  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
44  #include "utils/mbfunctions.h"  #include "utils/mbfunctions.h"
45  #include "bitstream/bitstream.h"  #include "bitstream/bitstream.h"
46  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
 #include "utils/ratecontrol.h"  
47  #include "utils/emms.h"  #include "utils/emms.h"
48  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
 #include "quant/adapt_quant.h"  
49  #include "quant/quant_matrix.h"  #include "quant/quant_matrix.h"
50  #include "utils/mem_align.h"  #include "utils/mem_align.h"
51    
52  /*****************************************************************************  # include "motion/motion_smp.h"
  * Local macros  
  ****************************************************************************/  
53    
 #define ENC_CHECK(X) if(!(X)) return XVID_ERR_FORMAT  
 #define SWAP(A,B)    { void * tmp = A; A = B; B = tmp; }  
54    
55  /*****************************************************************************  /*****************************************************************************
56   * Local function prototypes   * Local function prototypes
57   ****************************************************************************/   ****************************************************************************/
58    
59  static int FrameCodeI(Encoder * pEnc,  static int FrameCodeI(Encoder * pEnc,
60                        Bitstream * bs,                                            Bitstream * bs);
                       uint32_t *pBits);  
61    
62  static int FrameCodeP(Encoder * pEnc,  static int FrameCodeP(Encoder * pEnc,
63                        Bitstream * bs,                                            Bitstream * bs);
                       uint32_t *pBits,  
                       bool force_inter,  
                       bool vol_header);  
64    
 #ifdef BFRAMES  
65  static void FrameCodeB(Encoder * pEnc,  static void FrameCodeB(Encoder * pEnc,
66                         FRAMEINFO * frame,                         FRAMEINFO * frame,
67                         Bitstream * bs,                                             Bitstream * bs);
                        uint32_t *pBits);  
 #endif  
   
 /*****************************************************************************  
  * Local data  
  ****************************************************************************/  
   
 static int DQtab[4] =  
 {  
         -1, -2, 1, 2  
 };  
   
 static int iDQtab[5] =  
 {  
         1, 0, NO_CHANGE, 2, 3  
 };  
   
   
 static void __inline image_null(IMAGE * image)  
 {  
         image->y = image->u = image->v = NULL;  
 }  
68    
69    
70  /*****************************************************************************  /*****************************************************************************
# Line 121  Line 78 
78   * and cleaning code.   * and cleaning code.
79   *   *
80   * Returned values :   * Returned values :
81   *    - XVID_ERR_OK     - no errors   *      - 0                             - no errors
82   *    - XVID_ERR_MEMORY - the libc could not allocate memory, the function   *    - XVID_ERR_MEMORY - the libc could not allocate memory, the function
83   *                        cleans the structure before exiting.   *                        cleans the structure before exiting.
84   *                        pParam->handle is also set to NULL.   *                        pParam->handle is also set to NULL.
85   *   *
86   ****************************************************************************/   ****************************************************************************/
87    
 int  
 encoder_create(XVID_ENC_PARAM * pParam)  
 {  
         Encoder *pEnc;  
         uint32_t i;  
   
         pParam->handle = NULL;  
   
         ENC_CHECK(pParam);  
   
         ENC_CHECK(pParam->width > 0 && pParam->width <= 1920);  
         ENC_CHECK(pParam->height > 0 && pParam->height <= 1280);  
         ENC_CHECK(!(pParam->width % 2));  
         ENC_CHECK(!(pParam->height % 2));  
   
         /* Fps */  
   
         if (pParam->fincr <= 0 || pParam->fbase <= 0)  
         {  
                 pParam->fincr = 1;  
                 pParam->fbase = 25;  
         }  
   
88          /*          /*
89           * Simplify the "fincr/fbase" fraction           * Simplify the "fincr/fbase" fraction
          * (neccessary, since windows supplies us with huge numbers)  
90           */           */
91    static int
92          i = pParam->fincr;  gcd(int a, int b)
         while (i > 1)  
         {  
                 if (pParam->fincr % i == 0 && pParam->fbase % i == 0)  
93                  {                  {
94                          pParam->fincr /= i;          int r ;
                         pParam->fbase /= i;  
                         i = pParam->fincr;  
                         continue;  
                 }  
                 i--;  
         }  
95    
96          if (pParam->fbase > 65535)          if (b > a) {
97          {                  r = a;
98                  float div = (float)pParam->fbase / 65535;                  a = b;
99                  pParam->fbase = (int)(pParam->fbase / div);                  b = r;
                 pParam->fincr = (int)(pParam->fincr / div);  
100          }          }
101    
102          /* Bitrate allocator defaults */          while ((r = a % b)) {
103                    a = b;
104          if (pParam->rc_bitrate <= 0)                  b = r;
105                  pParam->rc_bitrate = 900000;          }
106            return b;
107    }
108    
109          if (pParam->rc_reaction_delay_factor <= 0)  static void
110                  pParam->rc_reaction_delay_factor = 16;  simplify_time(int *inc, int *base)
111    {
112            /* common factor */
113            const int s = gcd(*inc, *base);
114      *inc  /= s;
115      *base /= s;
116    
117          if (pParam->rc_averaging_period <= 0)          if (*base > 65535 || *inc > 65535) {
118                  pParam->rc_averaging_period = 100;                  int *biggest;
119                    int *other;
120                    float div;
121    
122          if (pParam->rc_buffer <= 0)                  if (*base > *inc) {
123                  pParam->rc_buffer = 100;                          biggest = base;
124                            other = inc;
125                    } else {
126                            biggest = inc;
127                            other = base;
128                    }
129    
130          /* Max and min quantizers */                  div = ((float)*biggest)/((float)65535);
131                    *biggest = (unsigned int)(((float)*biggest)/div);
132                    *other = (unsigned int)(((float)*other)/div);
133            }
134    }
135    
         if ((pParam->min_quantizer <= 0) || (pParam->min_quantizer > 31))  
                 pParam->min_quantizer = 1;  
136    
137          if ((pParam->max_quantizer <= 0) || (pParam->max_quantizer > 31))  int
138                  pParam->max_quantizer = 31;  enc_create(xvid_enc_create_t * create)
139    {
140            Encoder *pEnc;
141            int n;
142    
143          if (pParam->max_quantizer < pParam->min_quantizer)          if (XVID_VERSION_MAJOR(create->version) != 1) /* v1.x.x */
144                  pParam->max_quantizer = pParam->min_quantizer;                  return XVID_ERR_VERSION;
145    
146          /* 1 keyframe each 10 seconds */          if (create->width%2 || create->height%2)
147                    return XVID_ERR_FAIL;
148    
149          if (pParam->max_key_interval == 0)          if (create->width<=0 || create->height<=0)
150                  pParam->max_key_interval = 10 * pParam->fincr / pParam->fbase;                  return XVID_ERR_FAIL;
151    
152            /* allocate encoder struct */
153    
154          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);          pEnc = (Encoder *) xvid_malloc(sizeof(Encoder), CACHE_LINE);
155          if (pEnc == NULL)          if (pEnc == NULL)
156                  return XVID_ERR_MEMORY;                  return XVID_ERR_MEMORY;
157            memset(pEnc, 0, sizeof(Encoder));
158    
159          /* Fill members of Encoder structure */          pEnc->mbParam.profile = create->profile;
   
         pEnc->mbParam.width = pParam->width;  
         pEnc->mbParam.height = pParam->height;  
160    
161            /* global flags */
162            pEnc->mbParam.global_flags = create->global;
163      if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED))
164        pEnc->mbParam.global_flags |= XVID_GLOBAL_DIVX5_USERDATA;
165    
166            /* width, height */
167            pEnc->mbParam.width = create->width;
168            pEnc->mbParam.height = create->height;
169          pEnc->mbParam.mb_width = (pEnc->mbParam.width + 15) / 16;          pEnc->mbParam.mb_width = (pEnc->mbParam.width + 15) / 16;
170          pEnc->mbParam.mb_height = (pEnc->mbParam.height + 15) / 16;          pEnc->mbParam.mb_height = (pEnc->mbParam.height + 15) / 16;
   
171          pEnc->mbParam.edged_width  = 16*pEnc->mbParam.mb_width  + 2*EDGE_SIZE;          pEnc->mbParam.edged_width  = 16*pEnc->mbParam.mb_width  + 2*EDGE_SIZE;
172          pEnc->mbParam.edged_height = 16*pEnc->mbParam.mb_height + 2*EDGE_SIZE;          pEnc->mbParam.edged_height = 16*pEnc->mbParam.mb_height + 2*EDGE_SIZE;
173    
174          pEnc->mbParam.fbase = pParam->fbase;          /* framerate */
175          pEnc->mbParam.fincr = pParam->fincr;          pEnc->mbParam.fincr = MAX(create->fincr, 0);
176            pEnc->mbParam.fbase = create->fincr <= 0 ? 25 : create->fbase;
177          pEnc->sStat.fMvPrevSigma = -1;          if (pEnc->mbParam.fincr>0)
178                    simplify_time((int*)&pEnc->mbParam.fincr, (int*)&pEnc->mbParam.fbase);
179          /* Fill rate control parameters */  
180            /* zones */
181            if(create->num_zones > 0) {
182                    pEnc->num_zones = create->num_zones;
183                    pEnc->zones = xvid_malloc(sizeof(xvid_enc_zone_t) * pEnc->num_zones, CACHE_LINE);
184                    if (pEnc->zones == NULL)
185                            goto xvid_err_memory0;
186                    memcpy(pEnc->zones, create->zones, sizeof(xvid_enc_zone_t) * pEnc->num_zones);
187            } else {
188                    pEnc->num_zones = 0;
189                    pEnc->zones = NULL;
190            }
191    
192            /* plugins */
193            if(create->num_plugins > 0) {
194                    pEnc->num_plugins = create->num_plugins;
195                    pEnc->plugins = xvid_malloc(sizeof(xvid_enc_plugin_t) * pEnc->num_plugins, CACHE_LINE);
196                    if (pEnc->plugins == NULL)
197                            goto xvid_err_memory0;
198            } else {
199                    pEnc->num_plugins = 0;
200                    pEnc->plugins = NULL;
201            }
202    
203            for (n=0; n<pEnc->num_plugins;n++) {
204                    xvid_plg_create_t pcreate;
205                    xvid_plg_info_t pinfo;
206    
207                    memset(&pinfo, 0, sizeof(xvid_plg_info_t));
208                    pinfo.version = XVID_VERSION;
209                    if (create->plugins[n].func(NULL, XVID_PLG_INFO, &pinfo, NULL) >= 0) {
210                            pEnc->mbParam.plugin_flags |= pinfo.flags;
211                    }
212    
213                    memset(&pcreate, 0, sizeof(xvid_plg_create_t));
214                    pcreate.version = XVID_VERSION;
215                    pcreate.num_zones = pEnc->num_zones;
216                    pcreate.zones = pEnc->zones;
217                    pcreate.width = pEnc->mbParam.width;
218                    pcreate.height = pEnc->mbParam.height;
219                    pcreate.mb_width = pEnc->mbParam.mb_width;
220                    pcreate.mb_height = pEnc->mbParam.mb_height;
221                    pcreate.fincr = pEnc->mbParam.fincr;
222                    pcreate.fbase = pEnc->mbParam.fbase;
223                    pcreate.param = create->plugins[n].param;
224    
225                    pEnc->plugins[n].func = NULL;   /* disable plugins that fail */
226                    if (create->plugins[n].func(NULL, XVID_PLG_CREATE, &pcreate, &pEnc->plugins[n].param) >= 0) {
227                            pEnc->plugins[n].func = create->plugins[n].func;
228                    }
229            }
230    
231            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_EXTRASTATS_ENABLE) ||
232                    (pEnc->mbParam.plugin_flags & XVID_REQPSNR)) {
233                    pEnc->mbParam.plugin_flags |= XVID_REQORIGINAL; /* psnr calculation requires the original */
234            }
235    
236            /* temp dquants */
237            if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
238                    pEnc->temp_dquants = (int *) xvid_malloc(pEnc->mbParam.mb_width *
239                                                    pEnc->mbParam.mb_height * sizeof(int), CACHE_LINE);
240                    if (pEnc->temp_dquants==NULL)
241                            goto xvid_err_memory1a;
242            }
243    
244            /* temp lambdas */
245            if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
246                    pEnc->temp_lambda = (float *) xvid_malloc(pEnc->mbParam.mb_width *
247                                                    pEnc->mbParam.mb_height * 6 * sizeof(float), CACHE_LINE);
248                    if (pEnc->temp_lambda == NULL)
249                            goto xvid_err_memory1a;
250            }
251    
252            /* bframes */
253            pEnc->mbParam.max_bframes = MAX(create->max_bframes, 0);
254            pEnc->mbParam.bquant_ratio = MAX(create->bquant_ratio, 0);
255            pEnc->mbParam.bquant_offset = create->bquant_offset;
256    
257            /* min/max quant */
258            for (n=0; n<3; n++) {
259                    pEnc->mbParam.min_quant[n] = create->min_quant[n] > 0 ? create->min_quant[n] : 2;
260                    pEnc->mbParam.max_quant[n] = create->max_quant[n] > 0 ? create->max_quant[n] : 31;
261            }
262    
263          pEnc->bitrate = pParam->rc_bitrate;          /* frame drop ratio */
264            pEnc->mbParam.frame_drop_ratio = MAX(create->frame_drop_ratio, 0);
265    
266          pEnc->iFrameNum = 0;          /* max keyframe interval */
267          pEnc->iMaxKeyInterval = pParam->max_key_interval;          pEnc->mbParam.iMaxKeyInterval = create->max_key_interval <= 0 ? (10 * (int)pEnc->mbParam.fbase) / (int)pEnc->mbParam.fincr : create->max_key_interval;
268    
269          /* try to allocate frame memory */          /* allocate working frame-image memory */
270    
271          pEnc->current = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);          pEnc->current = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
272          pEnc->reference = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);          pEnc->reference = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
# Line 242  Line 274 
274          if ( pEnc->current == NULL || pEnc->reference == NULL)          if ( pEnc->current == NULL || pEnc->reference == NULL)
275                  goto xvid_err_memory1;                  goto xvid_err_memory1;
276    
277          /* try to allocate mb memory */          /* allocate macroblock memory */
278    
279          pEnc->current->mbs = xvid_malloc(sizeof(MACROBLOCK) * \          pEnc->current->mbs =
280                                           pEnc->mbParam.mb_width * \                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
281                                           pEnc->mbParam.mb_height,                                          pEnc->mbParam.mb_height, CACHE_LINE);
282                                           CACHE_LINE);          pEnc->reference->mbs =
283          pEnc->reference->mbs = xvid_malloc(sizeof(MACROBLOCK) * \                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
284                                             pEnc->mbParam.mb_width * \                                          pEnc->mbParam.mb_height, CACHE_LINE);
                                            pEnc->mbParam.mb_height,  
                                            CACHE_LINE);  
285    
286          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)          if (pEnc->current->mbs == NULL || pEnc->reference->mbs == NULL)
287                  goto xvid_err_memory2;                  goto xvid_err_memory2;
288    
289          /* try to allocate image memory */          /* allocate quant matrix memory */
290    
291            pEnc->mbParam.mpeg_quant_matrices =
292                    xvid_malloc(sizeof(uint16_t) * 64 * 8, CACHE_LINE);
293    
294            if (pEnc->mbParam.mpeg_quant_matrices == NULL)
295                    goto xvid_err_memory2a;
296    
297            /* allocate interpolation image memory */
298    
299  #ifdef _DEBUG          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
300          image_null(&pEnc->sOriginal);          image_null(&pEnc->sOriginal);
301  #endif                  image_null(&pEnc->sOriginal2);
302  #ifdef BFRAMES          }
303    
304          image_null(&pEnc->f_refh);          image_null(&pEnc->f_refh);
305          image_null(&pEnc->f_refv);          image_null(&pEnc->f_refv);
306          image_null(&pEnc->f_refhv);          image_null(&pEnc->f_refhv);
307  #endif  
308          image_null(&pEnc->current->image);          image_null(&pEnc->current->image);
309          image_null(&pEnc->reference->image);          image_null(&pEnc->reference->image);
310          image_null(&pEnc->vInterH);          image_null(&pEnc->vInterH);
311          image_null(&pEnc->vInterV);          image_null(&pEnc->vInterV);
         image_null(&pEnc->vInterVf);  
312          image_null(&pEnc->vInterHV);          image_null(&pEnc->vInterHV);
         image_null(&pEnc->vInterHVf);  
313    
314  #ifdef _DEBUG          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
315          if (image_create(&pEnc->sOriginal,                  if (image_create
316                           pEnc->mbParam.edged_width,                          (&pEnc->sOriginal, pEnc->mbParam.edged_width,
317                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
318                  goto xvid_err_memory3;                  goto xvid_err_memory3;
319  #endif  
320  #ifdef BFRAMES                  if (image_create
321          if (image_create(&pEnc->f_refh,                          (&pEnc->sOriginal2, pEnc->mbParam.edged_width,
                          pEnc->mbParam.edged_width,  
322                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
323                  goto xvid_err_memory3;                  goto xvid_err_memory3;
324          if (image_create(&pEnc->f_refv,          }
325                           pEnc->mbParam.edged_width,  
326            if (image_create
327                    (&pEnc->f_refh, pEnc->mbParam.edged_width,
328                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
329                  goto xvid_err_memory3;                  goto xvid_err_memory3;
330          if (image_create(&pEnc->f_refhv,          if (image_create
331                           pEnc->mbParam.edged_width,                  (&pEnc->f_refv, pEnc->mbParam.edged_width,
332                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
333                  goto xvid_err_memory3;                  goto xvid_err_memory3;
334  #endif          if (image_create
335          if (image_create(&pEnc->current->image,                  (&pEnc->f_refhv, pEnc->mbParam.edged_width,
                          pEnc->mbParam.edged_width,  
336                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
337                  goto xvid_err_memory3;                  goto xvid_err_memory3;
338          if (image_create(&pEnc->reference->image,  
339                           pEnc->mbParam.edged_width,          if (image_create
340                    (&pEnc->current->image, pEnc->mbParam.edged_width,
341                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
342                  goto xvid_err_memory3;                  goto xvid_err_memory3;
343          if (image_create(&pEnc->vInterH,          if (image_create
344                           pEnc->mbParam.edged_width,                  (&pEnc->reference->image, pEnc->mbParam.edged_width,
345                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
346                  goto xvid_err_memory3;                  goto xvid_err_memory3;
347          if (image_create(&pEnc->vInterV,          if (image_create
348                           pEnc->mbParam.edged_width,                  (&pEnc->vInterH, pEnc->mbParam.edged_width,
349                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
350                  goto xvid_err_memory3;                  goto xvid_err_memory3;
351          if (image_create(&pEnc->vInterVf,          if (image_create
352                           pEnc->mbParam.edged_width,                  (&pEnc->vInterV, pEnc->mbParam.edged_width,
353                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
354                  goto xvid_err_memory3;                  goto xvid_err_memory3;
355          if (image_create(&pEnc->vInterHV,          if (image_create
356                           pEnc->mbParam.edged_width,                  (&pEnc->vInterHV, pEnc->mbParam.edged_width,
357                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
358                  goto xvid_err_memory3;                  goto xvid_err_memory3;
359          if (image_create(&pEnc->vInterHVf,  
360                           pEnc->mbParam.edged_width,  /* Create full bitplane for GMC, this might be wasteful */
361            if (image_create
362                    (&pEnc->vGMC, pEnc->mbParam.edged_width,
363                           pEnc->mbParam.edged_height) < 0)                           pEnc->mbParam.edged_height) < 0)
364                  goto xvid_err_memory3;                  goto xvid_err_memory3;
365    
366            /* init bframe image buffers */
367    
368            pEnc->bframenum_head = 0;
369            pEnc->bframenum_tail = 0;
370            pEnc->flush_bframes = 0;
371            pEnc->closed_bframenum = -1;
372    
373          /* B Frames specific init */          /* B Frames specific init */
 #ifdef BFRAMES  
   
         pEnc->mbParam.max_bframes = pParam->max_bframes;  
         pEnc->bquant_ratio = pParam->bquant_ratio;  
374          pEnc->bframes = NULL;          pEnc->bframes = NULL;
375    
376          if (pEnc->mbParam.max_bframes > 0)          if (pEnc->mbParam.max_bframes > 0) {
         {  
                 int n;  
377    
378                  pEnc->bframes = xvid_malloc(pEnc->mbParam.max_bframes * \                  pEnc->bframes =
379                                              sizeof(FRAMEINFO *),                          xvid_malloc(pEnc->mbParam.max_bframes * sizeof(FRAMEINFO *),
380                                              CACHE_LINE);                                              CACHE_LINE);
381    
382                  if (pEnc->bframes == NULL)                  if (pEnc->bframes == NULL)
# Line 347  Line 386 
386                          pEnc->bframes[n] = NULL;                          pEnc->bframes[n] = NULL;
387    
388    
389                  for (n = 0; n < pEnc->mbParam.max_bframes; n++)                  for (n = 0; n < pEnc->mbParam.max_bframes; n++) {
390                  {                          pEnc->bframes[n] = xvid_malloc(sizeof(FRAMEINFO), CACHE_LINE);
                         pEnc->bframes[n] = xvid_malloc(sizeof(FRAMEINFO),  
                                                        CACHE_LINE);  
391    
392                          if (pEnc->bframes[n] == NULL)                          if (pEnc->bframes[n] == NULL)
393                                  goto xvid_err_memory4;                                  goto xvid_err_memory4;
394    
395                          pEnc->bframes[n]->mbs = xvid_malloc(sizeof(MACROBLOCK) * \                          pEnc->bframes[n]->mbs =
396                                                              pEnc->mbParam.mb_width * \                                  xvid_malloc(sizeof(MACROBLOCK) * pEnc->mbParam.mb_width *
397                                                              pEnc->mbParam.mb_height,                                                          pEnc->mbParam.mb_height, CACHE_LINE);
                                                             CACHE_LINE);  
398    
399                          if (pEnc->bframes[n]->mbs == NULL)                          if (pEnc->bframes[n]->mbs == NULL)
400                                  goto xvid_err_memory4;                                  goto xvid_err_memory4;
401    
402                          image_null(&pEnc->bframes[n]->image);                          image_null(&pEnc->bframes[n]->image);
403    
404                          if (image_create(&pEnc->bframes[n]->image,                          if (image_create
405                                           pEnc->mbParam.edged_width,                                  (&pEnc->bframes[n]->image, pEnc->mbParam.edged_width,
406                                           pEnc->mbParam.edged_height) < 0)                                           pEnc->mbParam.edged_height) < 0)
407                                  goto xvid_err_memory4;                                  goto xvid_err_memory4;
408    
409                  }                  }
410          }          }
411    
412          pEnc->bframenum_head = 0;          /* init incoming frame queue */
413          pEnc->bframenum_tail = 0;          pEnc->queue_head = 0;
414          pEnc->flush_bframes = 0;          pEnc->queue_tail = 0;
415            pEnc->queue_size = 0;
416    
417            pEnc->queue =
418                    xvid_malloc((pEnc->mbParam.max_bframes+1) * sizeof(QUEUEINFO),
419                                            CACHE_LINE);
420    
421            if (pEnc->queue == NULL)
422                    goto xvid_err_memory4;
423    
424            for (n = 0; n < pEnc->mbParam.max_bframes+1; n++)
425                    image_null(&pEnc->queue[n].image);
426    
427    
428            for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
429                    if (image_create
430                            (&pEnc->queue[n].image, pEnc->mbParam.edged_width,
431                             pEnc->mbParam.edged_height) < 0)
432                            goto xvid_err_memory5;
433            }
434    
435            /* timestamp stuff */
436    
437            pEnc->mbParam.m_stamp = 0;
438            pEnc->m_framenum = create->start_frame_num;
439            pEnc->current->stamp = 0;
440            pEnc->reference->stamp = 0;
441    
442          pEnc->mbParam.m_seconds = 0;          /* other stuff */
443          pEnc->mbParam.m_ticks = 0;  
444            pEnc->iFrameNum = 0;
445            pEnc->fMvPrevSigma = -1;
446    
447            /* slices */
448            pEnc->num_slices = MIN(MAX(1, create->num_slices), (int) pEnc->mbParam.mb_height);
449    
450            /* multithreaded stuff */
451            if (create->num_threads > 0) {
452    #ifndef HAVE_PTHREAD
453                    int t = MAX(1, create->num_threads);
454    #else
455                    int t = MIN(create->num_threads, (int) (pEnc->mbParam.mb_height>>1)); /* at least two rows per thread */
456  #endif  #endif
457                    int threads_per_slice = MAX(1, (t / pEnc->num_slices));
458                    int rows_per_thread = (pEnc->mbParam.mb_height + threads_per_slice - 1) / threads_per_slice;
459    
460          pParam->handle = (void *)pEnc;                  pEnc->num_threads = t;
461                    pEnc->smpData = xvid_malloc(t*sizeof(SMPData), CACHE_LINE);
462                    if (!pEnc->smpData)
463                            goto xvid_err_nosmp;
464    
465          if (pParam->rc_bitrate)                  /* tmp bitstream buffer for slice coding */
466          {                  pEnc->smpData[0].tmp_buffer = xvid_malloc(16*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height*sizeof(uint8_t), CACHE_LINE);
467                  RateControlInit(&pEnc->rate_control,                  if (! pEnc->smpData[0].tmp_buffer) goto xvid_err_nosmp;
468                                  pParam->rc_bitrate,  
469                                  pParam->rc_reaction_delay_factor,                  for (n = 0; n < t; n++) {
470                                  pParam->rc_averaging_period,                          int s = MIN(pEnc->num_threads, pEnc->num_slices);
471                                  pParam->rc_buffer,  
472                                  pParam->fbase * 1000 / pParam->fincr,                          pEnc->smpData[n].complete_count_self =
473                                  pParam->max_quantizer,                                  xvid_malloc(rows_per_thread * sizeof(int), CACHE_LINE);
474                                  pParam->min_quantizer);  
475                            if (!pEnc->smpData[n].complete_count_self)
476                                    goto xvid_err_nosmp;
477    
478                            if (n > 0 && n < s) {
479                                    pEnc->smpData[n].bs = (Bitstream *) xvid_malloc(sizeof(Bitstream), CACHE_LINE);
480                                    if (!pEnc->smpData[n].bs)
481                                            goto xvid_err_nosmp;
482    
483                                    pEnc->smpData[n].sStat = (Statistics *) xvid_malloc(sizeof(Statistics), CACHE_LINE);
484                                    if (!pEnc->smpData[n].sStat)
485                                            goto xvid_err_nosmp;
486    
487                                    pEnc->smpData[n].tmp_buffer = pEnc->smpData[0].tmp_buffer + 16*(((n-1)*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height)/s);
488                                    BitstreamInit(pEnc->smpData[n].bs, pEnc->smpData[n].tmp_buffer, 0);
489                            }
490    
491                            if (n != 0)
492                                    pEnc->smpData[n].complete_count_above =
493                                            pEnc->smpData[n-1].complete_count_self;
494                    }
495                    pEnc->smpData[0].complete_count_above =
496                            pEnc->smpData[t-1].complete_count_self - 1;
497    
498            } else {
499      xvid_err_nosmp:
500                    /* no SMP */
501                    if (pEnc->smpData) {
502                            if (pEnc->smpData[0].tmp_buffer)
503                                    xvid_free(pEnc->smpData[0].tmp_buffer);
504                    }
505                    else {
506                            pEnc->smpData = xvid_malloc(1*sizeof(SMPData), CACHE_LINE);
507                            if (pEnc->smpData == NULL)
508                                    goto xvid_err_memory5;
509                    }
510    
511                    create->num_threads = 0;
512          }          }
513    
514            create->handle = (void *) pEnc;
515    
516          init_timer();          init_timer();
517            init_mpeg_matrix(pEnc->mbParam.mpeg_quant_matrices);
518    
519          return XVID_ERR_OK;          return 0;   /* ok */
520    
521          /*          /*
522           * We handle all XVID_ERR_MEMORY here, this makes the code lighter           * We handle all XVID_ERR_MEMORY here, this makes the code lighter
523           */           */
 #ifdef BFRAMES  
  xvid_err_memory4:  
         for (i=0; i<pEnc->mbParam.max_bframes; i++)  
         {  
524    
525                  if (pEnc->bframes[i] == NULL) continue;    xvid_err_memory5:
526    
527                  image_destroy(&pEnc->bframes[i]->image,          for (n = 0; n < pEnc->mbParam.max_bframes+1; n++) {
528                                pEnc->mbParam.edged_width,                          image_destroy(&pEnc->queue[n].image, pEnc->mbParam.edged_width,
529                                pEnc->mbParam.edged_height);                                pEnc->mbParam.edged_height);
530                    }
531    
532                  xvid_free(pEnc->bframes[i]->mbs);          xvid_free(pEnc->queue);
533    
534                  xvid_free(pEnc->bframes[i]);    xvid_err_memory4:
535    
536            if (pEnc->mbParam.max_bframes > 0) {
537                    int i;
538    
539                    for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
540    
541                            if (pEnc->bframes[i] == NULL)
542                                    continue;
543    
544                            image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
545                                                      pEnc->mbParam.edged_height);
546                            xvid_free(pEnc->bframes[i]->mbs);
547                            xvid_free(pEnc->bframes[i]);
548          }          }
549    
550          xvid_free(pEnc->bframes);          xvid_free(pEnc->bframes);
551            }
 #endif  
552    
553   xvid_err_memory3:   xvid_err_memory3:
554  #ifdef _DEBUG  
555          image_destroy(&pEnc->sOriginal,          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
556                        pEnc->mbParam.edged_width,                  image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
557                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
558  #endif                  image_destroy(&pEnc->sOriginal2, pEnc->mbParam.edged_width,
559                                              pEnc->mbParam.edged_height);
560            }
561    
562  #ifdef BFRAMES          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
         image_destroy(&pEnc->f_refh,  
                       pEnc->mbParam.edged_width,  
563                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
564          image_destroy(&pEnc->f_refv,          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
565                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
566          image_destroy(&pEnc->f_refhv,          image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
567                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
 #endif  
568    
569          image_destroy(&pEnc->current->image,          image_destroy(&pEnc->current->image, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
                       pEnc->mbParam.edged_height);  
         image_destroy(&pEnc->reference->image,  
                       pEnc->mbParam.edged_width,  
570                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
571          image_destroy(&pEnc->vInterH,          image_destroy(&pEnc->reference->image, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
572                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
573          image_destroy(&pEnc->vInterV,          image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
574                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
575          image_destroy(&pEnc->vInterVf,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
576                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
577          image_destroy(&pEnc->vInterHV,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
578                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
579          image_destroy(&pEnc->vInterHVf,  
580                        pEnc->mbParam.edged_width,  /* destroy GMC image */
581            image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
582                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
583    
584      xvid_err_memory2a:
585            xvid_free(pEnc->mbParam.mpeg_quant_matrices);
586    
587   xvid_err_memory2:   xvid_err_memory2:
588          xvid_free(pEnc->current->mbs);          xvid_free(pEnc->current->mbs);
589          xvid_free(pEnc->reference->mbs);          xvid_free(pEnc->reference->mbs);
# Line 471  Line 591 
591   xvid_err_memory1:   xvid_err_memory1:
592          xvid_free(pEnc->current);          xvid_free(pEnc->current);
593          xvid_free(pEnc->reference);          xvid_free(pEnc->reference);
594    
595      xvid_err_memory1a:
596            if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
597                    xvid_free(pEnc->temp_dquants);
598            }
599    
600            if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
601                    xvid_free(pEnc->temp_lambda);
602            }
603    
604      xvid_err_memory0:
605            for (n=0; n<pEnc->num_plugins;n++) {
606                    if (pEnc->plugins[n].func) {
607                            pEnc->plugins[n].func(pEnc->plugins[n].param, XVID_PLG_DESTROY, NULL, NULL);
608                    }
609            }
610            xvid_free(pEnc->plugins);
611    
612            xvid_free(pEnc->zones);
613    
614          xvid_free(pEnc);          xvid_free(pEnc);
615    
616          pParam->handle = NULL;          create->handle = NULL;
617    
618          return XVID_ERR_MEMORY;          return XVID_ERR_MEMORY;
619  }  }
# Line 482  Line 622 
622   * Encoder destruction   * Encoder destruction
623   *   *
624   * This function destroy the entire encoder structure created by a previous   * This function destroy the entire encoder structure created by a previous
625   * successful encoder_create call.   * successful enc_create call.
626   *   *
627   * Returned values (for now only one returned value) :   * Returned values (for now only one returned value) :
628   *    - XVID_ERR_OK     - no errors   *      - 0      - no errors
629   *   *
630   ****************************************************************************/   ****************************************************************************/
631    
632  int  int
633  encoder_destroy(Encoder * pEnc)  enc_destroy(Encoder * pEnc)
634  {  {
635          ENC_CHECK(pEnc);          int i;
636    
637          /* B Frames specific */          /* B Frames specific */
638  #ifdef BFRAMES          for (i = 0; i < pEnc->mbParam.max_bframes+1; i++) {
639          int i;                  image_destroy(&pEnc->queue[i].image, pEnc->mbParam.edged_width,
640                                              pEnc->mbParam.edged_height);
641            }
642    
643          for (i=0; i<pEnc->mbParam.max_bframes; i++)          xvid_free(pEnc->queue);
         {  
644    
645                  if (pEnc->bframes[i] == NULL) continue;          if (pEnc->mbParam.max_bframes > 0) {
646    
647                  image_destroy(&pEnc->bframes[i]->image,                  for (i = 0; i < pEnc->mbParam.max_bframes; i++) {
                               pEnc->mbParam.edged_width,  
                               pEnc->mbParam.edged_height);  
648    
649                  xvid_free(pEnc->bframes[i]->mbs);                          if (pEnc->bframes[i] == NULL)
650                                    continue;
651    
652                            image_destroy(&pEnc->bframes[i]->image, pEnc->mbParam.edged_width,
653                                              pEnc->mbParam.edged_height);
654                            xvid_free(pEnc->bframes[i]->mbs);
655                  xvid_free(pEnc->bframes[i]);                  xvid_free(pEnc->bframes[i]);
   
656          }          }
657    
658          xvid_free(pEnc->bframes);          xvid_free(pEnc->bframes);
659    
660  #endif          }
661    
662          /* All images, reference, current etc ... */          /* All images, reference, current etc ... */
663    
664          image_destroy(&pEnc->current->image,          image_destroy(&pEnc->current->image, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
665                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
666          image_destroy(&pEnc->reference->image,          image_destroy(&pEnc->reference->image, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
667                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
668          image_destroy(&pEnc->vInterH,          image_destroy(&pEnc->vInterH, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
669                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
670          image_destroy(&pEnc->vInterV,          image_destroy(&pEnc->vInterV, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
671                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
672          image_destroy(&pEnc->vInterVf,          image_destroy(&pEnc->vInterHV, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
673                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
674          image_destroy(&pEnc->vInterHV,          image_destroy(&pEnc->f_refh, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
675                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
676          image_destroy(&pEnc->vInterHVf,          image_destroy(&pEnc->f_refv, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
677                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
678  #ifdef BFRAMES          image_destroy(&pEnc->f_refhv, pEnc->mbParam.edged_width,
         image_destroy(&pEnc->f_refh,  
                       pEnc->mbParam.edged_width,  
679                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
680          image_destroy(&pEnc->f_refv,          image_destroy(&pEnc->vGMC, pEnc->mbParam.edged_width,
                       pEnc->mbParam.edged_width,  
681                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
682          image_destroy(&pEnc->f_refhv,  
683                        pEnc->mbParam.edged_width,          if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
684                    image_destroy(&pEnc->sOriginal, pEnc->mbParam.edged_width,
685                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
686  #endif                  image_destroy(&pEnc->sOriginal2, pEnc->mbParam.edged_width,
 #ifdef _DEBUG  
         image_destroy(&pEnc->sOriginal,  
                       pEnc->mbParam.edged_width,  
687                        pEnc->mbParam.edged_height);                        pEnc->mbParam.edged_height);
688  #endif          }
689    
690          /* Encoder structure */          /* Encoder structure */
691    
# Line 565  Line 695 
695          xvid_free(pEnc->reference->mbs);          xvid_free(pEnc->reference->mbs);
696          xvid_free(pEnc->reference);          xvid_free(pEnc->reference);
697    
698          xvid_free(pEnc);          if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
699                    xvid_free(pEnc->temp_dquants);
700            }
701    
702          return XVID_ERR_OK;          if ((pEnc->mbParam.plugin_flags & XVID_REQLAMBDA)) {
703                    xvid_free(pEnc->temp_lambda);
704  }  }
705    
706  /*****************************************************************************          if (pEnc->num_plugins>0) {
707   * Frame encoder entry point                  xvid_plg_destroy_t pdestroy;
708   *                  memset(&pdestroy, 0, sizeof(xvid_plg_destroy_t));
  * At this moment 2 versions coexist : one for IPB compatible encoder,  
  *                                     another one for the old IP encoder.  
  *  
  * Returned values :  
  *    - XVID_ERR_OK     - no errors  
  *    - XVID_ERR_FORMAT - the image subsystem reported the image had a wrong  
  *                        format  
  ****************************************************************************/  
709    
710                    pdestroy.version = XVID_VERSION;
711                    pdestroy.num_frames = pEnc->m_framenum;
712    
713  #ifdef BFRAMES                  for (i=0; i<pEnc->num_plugins;i++) {
714  /*****************************************************************************                          if (pEnc->plugins[i].func) {
715   * Frame encoder entry point for IPB capable encoder                                  pEnc->plugins[i].func(pEnc->plugins[i].param, XVID_PLG_DESTROY, &pdestroy, NULL);
716   ****************************************************************************/                          }
717  int                  }
718  encoder_encode(Encoder * pEnc,                  xvid_free(pEnc->plugins);
719                 XVID_ENC_FRAME * pFrame,          }
                XVID_ENC_STATS * pResult)  
 {  
         uint16_t x, y;  
         Bitstream bs;  
         uint32_t bits;  
720    
721  #ifdef _DEBUG          xvid_free(pEnc->mbParam.mpeg_quant_matrices);
         float psnr;  
         char temp[128];  
 #endif  
722    
723          ENC_CHECK(pEnc);          if (pEnc->num_zones > 0)
724          ENC_CHECK(pFrame);                  xvid_free(pEnc->zones);
725    
726          start_global_timer();          if (pEnc->num_threads > 0) {
727                    for (i = 1; i < MAX(1, MIN(pEnc->num_threads, pEnc->num_slices)); i++) {
728                            xvid_free(pEnc->smpData[i].bs);
729                            xvid_free(pEnc->smpData[i].sStat);
730                    }
731                    if (pEnc->smpData[0].tmp_buffer) xvid_free(pEnc->smpData[0].tmp_buffer);
732    
733          BitstreamInit(&bs, pFrame->bitstream, 0);                  for (i = 0; i < pEnc->num_threads; i++)
734                            xvid_free(pEnc->smpData[i].complete_count_self);
735            }
736            xvid_free(pEnc->smpData);
737    
738          /*          xvid_free(pEnc);
          * bframe "flush" code  
          */  
739    
740          if ( (pFrame->image == NULL || pEnc->flush_bframes) &&          return 0;  /* ok */
741               (pEnc->bframenum_head < pEnc->bframenum_tail))  }
         {  
742    
                 if (pEnc->flush_bframes == 0)  
                 {  
                         /*  
                          * we have reached the end of stream without getting  
                          * a future reference frame... so encode last final  
                          * frame as a pframe  
                          */  
743    
                         /* ToDo : remove dprintf calls */  
744                          /*                          /*
745                            dprintf("--- PFRAME (final frame correction) --- ");    call the plugins
746                          */                          */
                         pEnc->bframenum_tail--;  
                         SWAP(pEnc->current, pEnc->reference);  
   
                         SWAP(pEnc->current,  
                              pEnc->bframes[pEnc->bframenum_tail]);  
747    
748                          FrameCodeP(pEnc, &bs, &bits, 1, 0);  static void call_plugins(Encoder * pEnc, FRAMEINFO * frame, IMAGE * original,
749                                                     int opt, int * type, int * quant, xvid_enc_stats_t * stats)
750    {
751            unsigned int i, j, k;
752            xvid_plg_data_t data;
753    
754                          BitstreamPad(&bs);          /* set data struct */
                         pFrame->length = BitstreamLength(&bs);  
                         pFrame->input_consumed = 0;  
                         pFrame->intra = 0;  
755    
756                          return XVID_ERR_OK;          memset(&data, 0, sizeof(xvid_plg_data_t));
757            data.version = XVID_VERSION;
758    
759            /* find zone */
760            for(i=0; i<pEnc->num_zones && pEnc->zones[i].frame<=frame->frame_num; i++) ;
761            data.zone = i>0 ? &pEnc->zones[i-1] : NULL;
762    
763            data.width = pEnc->mbParam.width;
764            data.height = pEnc->mbParam.height;
765            data.mb_width = pEnc->mbParam.mb_width;
766            data.mb_height = pEnc->mbParam.mb_height;
767            data.fincr = frame->fincr;
768            data.fbase = pEnc->mbParam.fbase;
769            data.bquant_ratio = pEnc->mbParam.bquant_ratio;
770            data.bquant_offset = pEnc->mbParam.bquant_offset;
771    
772            for (i=0; i<3; i++) {
773                    data.min_quant[i] = pEnc->mbParam.min_quant[i];
774                    data.max_quant[i] = pEnc->mbParam.max_quant[i];
775            }
776    
777            data.reference.csp = XVID_CSP_PLANAR;
778            data.reference.plane[0] = pEnc->reference->image.y;
779            data.reference.plane[1] = pEnc->reference->image.u;
780            data.reference.plane[2] = pEnc->reference->image.v;
781            data.reference.stride[0] = pEnc->mbParam.edged_width;
782            data.reference.stride[1] = pEnc->mbParam.edged_width/2;
783            data.reference.stride[2] = pEnc->mbParam.edged_width/2;
784    
785            data.current.csp = XVID_CSP_PLANAR;
786            data.current.plane[0] = frame->image.y;
787            data.current.plane[1] = frame->image.u;
788            data.current.plane[2] = frame->image.v;
789            data.current.stride[0] = pEnc->mbParam.edged_width;
790            data.current.stride[1] = pEnc->mbParam.edged_width/2;
791            data.current.stride[2] = pEnc->mbParam.edged_width/2;
792    
793            data.frame_num = frame->frame_num;
794    
795            if (opt == XVID_PLG_BEFORE) {
796                    data.type = *type;
797                    data.quant = *quant;
798    
799                    data.vol_flags = frame->vol_flags;
800                    data.vop_flags = frame->vop_flags;
801                    data.motion_flags = frame->motion_flags;
802    
803            } else if (opt == XVID_PLG_FRAME) {
804                    data.type = coding2type(frame->coding_type);
805                    data.quant = frame->quant;
806    
807                    if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
808                            data.dquant = pEnc->temp_dquants;
809                            data.dquant_stride = pEnc->mbParam.mb_width;
810                            memset(data.dquant, 0, data.mb_width*data.mb_height*sizeof(int));
811                  }                  }
812    
813                  /* ToDo : remove dprintf calls */                  if(pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
814                  /*                          int block = 0;
815                    dprintf("--- BFRAME (flush) --- ");                          emms();
816                  */                          data.lambda = pEnc->temp_lambda;
817                  FrameCodeB(pEnc,                          for(i = 0;i < pEnc->mbParam.mb_height; i++)
818                             pEnc->bframes[pEnc->bframenum_head],                                  for(j = 0;j < pEnc->mbParam.mb_width; j++)
819                             &bs,                                          for (k = 0; k < 6; k++)
820                             &bits);                                                  data.lambda[block++] = 1.0f;
821                  pEnc->bframenum_head++;                  }
822    
823            } else { /* XVID_PLG_AFTER */
824                  BitstreamPad(&bs);                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
825                  pFrame->length = BitstreamLength(&bs);                          data.original.csp = XVID_CSP_PLANAR;
826                  pFrame->input_consumed = 0;                          data.original.plane[0] = original->y;
827                  pFrame->intra = 0;                          data.original.plane[1] = original->u;
828                            data.original.plane[2] = original->v;
829                            data.original.stride[0] = pEnc->mbParam.edged_width;
830                            data.original.stride[1] = pEnc->mbParam.edged_width/2;
831                            data.original.stride[2] = pEnc->mbParam.edged_width/2;
832                    }
833    
834                    if ((frame->vol_flags & XVID_VOL_EXTRASTATS) ||
835                            (pEnc->mbParam.plugin_flags & XVID_REQPSNR)) {
836    
837                            data.sse_y =
838                                    plane_sse( original->y, frame->image.y,
839                                                       pEnc->mbParam.edged_width, pEnc->mbParam.width,
840                                                       pEnc->mbParam.height);
841    
842                  return XVID_ERR_OK;                          data.sse_u =
843                                    plane_sse( original->u, frame->image.u,
844                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
845                                                       pEnc->mbParam.height/2);
846    
847                            data.sse_v =
848                                    plane_sse( original->v, frame->image.v,
849                                                       pEnc->mbParam.edged_width/2, pEnc->mbParam.width/2,
850                                                       pEnc->mbParam.height/2);
851                    }
852    
853                    data.type = coding2type(frame->coding_type);
854                    data.quant = frame->quant;
855    
856                    if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
857                            data.dquant = pEnc->temp_dquants;
858                            data.dquant_stride = pEnc->mbParam.mb_width;
859    
860                            for (j=0; j<pEnc->mbParam.mb_height; j++)
861                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
862                                    data.dquant[j*data.dquant_stride + i] = frame->mbs[j*pEnc->mbParam.mb_width + i].dquant;
863                            }
864          }          }
865    
866          if (pFrame->image == NULL)                  data.vol_flags = frame->vol_flags;
867          {                  data.vop_flags = frame->vop_flags;
868                  pFrame->length = 0;                  data.motion_flags = frame->motion_flags;
869                  pFrame->input_consumed = 1;  
870                  pFrame->intra = 0;                  data.length = frame->length;
871                    data.kblks = frame->sStat.kblks;
872                    data.mblks = frame->sStat.mblks;
873                    data.ublks = frame->sStat.ublks;
874    
875                    /* New code */
876                    data.stats.type      = coding2type(frame->coding_type);
877                    data.stats.quant     = frame->quant;
878                    data.stats.vol_flags = frame->vol_flags;
879                    data.stats.vop_flags = frame->vop_flags;
880                    data.stats.length    = frame->length;
881                    data.stats.hlength   = frame->length - (frame->sStat.iTextBits / 8);
882                    data.stats.kblks     = frame->sStat.kblks;
883                    data.stats.mblks     = frame->sStat.mblks;
884                    data.stats.ublks     = frame->sStat.ublks;
885                    data.stats.sse_y     = data.sse_y;
886                    data.stats.sse_u     = data.sse_u;
887                    data.stats.sse_v     = data.sse_v;
888    
889                  return XVID_ERR_OK;                  if (stats)
890                            *stats = data.stats;
891          }          }
892    
893          if (pEnc->bframenum_head > 0)          /* call plugins */
894          {          for (i=0; i<(unsigned int)pEnc->num_plugins;i++) {
895                  pEnc->bframenum_head = pEnc->bframenum_tail = 0;                  emms();
896                    if (pEnc->plugins[i].func) {
897                            if (pEnc->plugins[i].func(pEnc->plugins[i].param, opt, &data, NULL) < 0) {
898                                    continue;
899          }          }
900                    }
901            }
902            emms();
903    
904          pEnc->flush_bframes = 0;          /* copy modified values back into frame*/
905            if (opt == XVID_PLG_BEFORE) {
906          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%                  *type = data.type;
907           * Well there was a separation here so i put it in ANSI C                  *quant = data.quant > 0 ? data.quant : 2;   /* default */
          * comment style :-)  
          * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */  
   
         SWAP(pEnc->current, pEnc->reference);  
908    
909          EMMS();                  frame->vol_flags = data.vol_flags;
910                    frame->vop_flags = data.vop_flags;
911                    frame->motion_flags = data.motion_flags;
912    
913          if (pFrame->quant == 0)          } else if (opt == XVID_PLG_FRAME) {
                 pEnc->current->quant = RateControlGetQ(&pEnc->rate_control, 0);  
         else  
                 pEnc->current->quant = pFrame->quant;  
914    
915          if(pEnc->current->quant < 1)                  if ((pEnc->mbParam.plugin_flags & XVID_REQDQUANTS)) {
916                  pEnc->current->quant = 1;                          for (j=0; j<pEnc->mbParam.mb_height; j++)
917                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
918                                    frame->mbs[j*pEnc->mbParam.mb_width + i].dquant = data.dquant[j*data.mb_width + i];
919                            }
920                    } else {
921                            for (j=0; j<pEnc->mbParam.mb_height; j++)
922                            for (i=0; i<pEnc->mbParam.mb_width; i++) {
923                                    frame->mbs[j*pEnc->mbParam.mb_width + i].dquant = 0;
924                            }
925                    }
926    
927          if(pEnc->current->quant > 31)                  if (pEnc->mbParam.plugin_flags & XVID_REQLAMBDA) {
928                  pEnc->current->quant = 31;                          for (j = 0; j < pEnc->mbParam.mb_height; j++)
929                                    for (i = 0; i < pEnc->mbParam.mb_width; i++)
930                                            for (k = 0; k < 6; k++) {
931                                                    frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] =
932                                                            (int) ((float)(1<<LAMBDA_EXP) * data.lambda[6 * (j * data.mb_width + i) + k]);
933                                            }
934                    } else {
935                            for (j = 0; j<pEnc->mbParam.mb_height; j++)
936                                    for (i = 0; i<pEnc->mbParam.mb_width; i++)
937                                            for (k = 0; k < 6; k++) {
938                                                    frame->mbs[j*pEnc->mbParam.mb_width + i].lambda[k] = 1<<LAMBDA_EXP;
939                                            }
940                    }
941    
         pEnc->current->global_flags = pFrame->general;  
         pEnc->current->motion_flags = pFrame->motion;  
         pEnc->current->seconds = pEnc->mbParam.m_seconds;  
         pEnc->current->ticks = pEnc->mbParam.m_ticks;  
         /* ToDo : dynamic fcode (in both directions) */  
         pEnc->current->fcode = pEnc->mbParam.m_fcode;  
         pEnc->current->bcode = pEnc->mbParam.m_fcode;  
942    
943          start_timer();                  frame->mbs[0].quant = data.quant; /* FRAME will not affect the quant in stats */
944          if (image_input(&pEnc->current->image,          }
                         pEnc->mbParam.width,  
                         pEnc->mbParam.height,  
                         pEnc->mbParam.edged_width,  
                         pFrame->image,  
                         pFrame->colorspace))  
                 return XVID_ERR_FORMAT;  
         stop_conv_timer();  
945    
 #ifdef _DEBUG  
         image_copy(&pEnc->sOriginal,  
                    &pEnc->current->image,  
                    pEnc->mbParam.edged_width,  
                    pEnc->mbParam.height);  
 #endif  
946    
947          EMMS();  }
948    
         /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%  
          * Luminance masking  
          * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */  
949    
950          if ((pEnc->current->global_flags & XVID_LUMIMASKING))  static __inline void inc_frame_num(Encoder * pEnc)
951          {          {
952                  int *temp_dquants =          pEnc->current->frame_num = pEnc->m_framenum;
953                          (int *) xvid_malloc(pEnc->mbParam.mb_width * \          pEnc->current->stamp = pEnc->mbParam.m_stamp;   /* first frame is zero */
                                             pEnc->mbParam.mb_height * \  
                                             sizeof(int),  
                                             CACHE_LINE);  
954    
955                  pEnc->current->quant =          pEnc->mbParam.m_stamp += pEnc->current->fincr;
956                          adaptive_quantization(pEnc->current->image.y,          pEnc->m_framenum++;     /* debug ticker */
957                                                pEnc->mbParam.edged_width,  }
                                               temp_dquants,  
                                               pEnc->current->quant,  
                                               pEnc->current->quant,  
                                               2*pEnc->current->quant,  
                                               pEnc->mbParam.mb_width,  
                                               pEnc->mbParam.mb_height);  
958    
959                  for (y = 0; y < pEnc->mbParam.mb_height; y++)  static __inline void dec_frame_num(Encoder * pEnc)
960                  {                  {
961            pEnc->mbParam.m_stamp -= pEnc->mbParam.fincr;
962            pEnc->m_framenum--;     /* debug ticker */
963    }
964    
965                          #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)  static __inline void
966    MBSetDquant(MACROBLOCK * pMB, int x, int y, MBParam * mbParam)
                         for (x = 0; x < pEnc->mbParam.mb_width; x++)  
967                          {                          {
968                                  MACROBLOCK *pMB =          if (pMB->cbp == 0) {
969                                          &pEnc->current->mbs[OFFSET(x,y)];                  /* we want to code dquant but the quantizer value will not be used yet
970                                  pMB->dquant =                          let's find out if we can postpone dquant to next MB
971                                          iDQtab[temp_dquants[OFFSET(x,y)] + 2];                  */
972                    if (x == mbParam->mb_width-1 && y == mbParam->mb_height-1) {
973                            pMB->dquant = 0; /* it's the last MB of all, the easiest case */
974                            return;
975                    } else {
976                            MACROBLOCK * next = pMB + 1;
977                            const MACROBLOCK * prev = pMB - 1;
978                            if (next->mode != MODE_INTER4V && next->mode != MODE_NOT_CODED)
979                                    /* mode allows dquant change in the future */
980                                    if (abs(next->quant - prev->quant) <= 2) {
981                                            /* quant change is not out of range */
982                                            pMB->quant = prev->quant;
983                                            pMB->dquant = 0;
984                                            next->dquant = next->quant - prev->quant;
985                                            return;
986                          }                          }
   
                         #undef OFFSET  
   
987                  }                  }
   
                 xvid_free(temp_dquants);  
988          }          }
989            /* couldn't skip this dquant */
990          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%          pMB->mode = MODE_INTER_Q;
991           * ivop/pvop/bvop selection  }
          * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */  
992    
993    
         if (pEnc->iFrameNum == 0 ||  
             pFrame->intra   == 1 ||  
994    
995              (pFrame->intra < 0  &&  static __inline void
996               pEnc->iMaxKeyInterval > 0 &&  set_timecodes(FRAMEINFO* pCur,FRAMEINFO *pRef, int32_t time_base)
              pEnc->iFrameNum >= pEnc->iMaxKeyInterval) ||  
   
             image_mad(&pEnc->reference->image,  
                       &pEnc->current->image,  
                       pEnc->mbParam.edged_width,  
                       pEnc->mbParam.width,  
                       pEnc->mbParam.height) > 30)  
997          {          {
                 /*  
                  * This will be coded as an Intra Frame  
                  */  
998    
999                  /* ToDo : Remove dprintf calls */          pCur->ticks = (int32_t)pCur->stamp % time_base;
1000                  /*          pCur->seconds =  ((int32_t)pCur->stamp / time_base)     - ((int32_t)pRef->stamp / time_base) ;
                   dprintf("--- IFRAME ---");  
                 */  
1001    
1002                  FrameCodeI(pEnc, &bs, &bits);  #if 0   /* HEAVY DEBUG OUTPUT */
1003            fprintf(stderr,"WriteVop:   %d - %d \n",
1004                            ((int32_t)pCur->stamp / time_base), ((int32_t)pRef->stamp / time_base));
1005            fprintf(stderr,"set_timecodes: VOP %1d   stamp=%lld ref_stamp=%lld  base=%d\n",
1006                            pCur->coding_type, pCur->stamp, pRef->stamp, time_base);
1007            fprintf(stderr,"set_timecodes: VOP %1d   seconds=%d   ticks=%d   (ref-sec=%d  ref-tick=%d)\n",
1008                            pCur->coding_type, pCur->seconds, pCur->ticks, pRef->seconds, pRef->ticks);
1009    #endif
1010    }
1011    
1012                  pFrame->intra = 1;  static void
1013                  pEnc->flush_bframes = 1;  simplify_par(int *par_width, int *par_height)
1014    {
1015    
1016                  /*          int _par_width  = (!*par_width)  ? 1 : (*par_width<0)  ? -*par_width:  *par_width;
1017                   * NB : sequences like "IIBB" decode fine with msfdam but,          int _par_height = (!*par_height) ? 1 : (*par_height<0) ? -*par_height: *par_height;
1018                   *      go screwy with divx 5.00          int divisor = gcd(_par_width, _par_height);
1019                   */  
1020            _par_width  /= divisor;
1021            _par_height /= divisor;
1022    
1023            /* 2^8 precision maximum */
1024            if (_par_width>255 || _par_height>255) {
1025                    float div;
1026                    emms();
1027                    if (_par_width>_par_height)
1028                            div = (float)_par_width/255;
1029                    else
1030                            div = (float)_par_height/255;
1031    
1032                    _par_width  = (int)((float)_par_width/div);
1033                    _par_height = (int)((float)_par_height/div);
1034          }          }
         else if (pEnc->bframenum_tail >= pEnc->mbParam.max_bframes)  
         {  
                 /*  
                  * This will be coded as a Predicted Frame  
                  */  
1035    
1036                  /* ToDo : Remove dprintf calls */          *par_width = _par_width;
1037                  /*          *par_height = _par_height;
                   dprintf("--- PFRAME ---");  
                 */  
1038    
1039                  FrameCodeP(pEnc, &bs, &bits, 1, 0);          return;
                 pFrame->intra = 0;  
                 pEnc->flush_bframes = 1;  
1040          }          }
1041          else  
1042    /*****************************************************************************
1043     * IPB frame encoder entry point
1044     *
1045     * Returned values :
1046     *      - >0                       - output bytes
1047     *      - 0                             - no output
1048     *      - XVID_ERR_VERSION - wrong version passed to core
1049     *      - XVID_ERR_END   - End of stream reached before end of coding
1050     *      - XVID_ERR_FORMAT  - the image subsystem reported the image had a wrong
1051     *                                               format
1052     ****************************************************************************/
1053    
1054    
1055    int
1056    enc_encode(Encoder * pEnc,
1057                               xvid_enc_frame_t * xFrame,
1058                               xvid_enc_stats_t * stats)
1059          {          {
1060                  /*          xvid_enc_frame_t * frame;
1061                   * This will be coded as a Bidirectional Frame          int type;
1062                   */          Bitstream bs;
1063    
1064                  /* ToDo : Remove dprintf calls */          if (XVID_VERSION_MAJOR(xFrame->version) != 1 || (stats && XVID_VERSION_MAJOR(stats->version) != 1))     /* v1.x.x */
1065                  /*                  return XVID_ERR_VERSION;
                   dprintf("--- BFRAME (store) ---  head=%i tail=%i",  
                   pEnc->bframenum_head,  
                   pEnc->bframenum_tail);  
                 */  
1066    
1067                  if (pFrame->bquant < 1)          xFrame->out_flags = 0;
1068    
1069            start_global_timer();
1070            BitstreamInit(&bs, xFrame->bitstream, 0);
1071    
1072    
1073            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1074             * enqueue image to the encoding-queue
1075             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1076    
1077            if (xFrame->input.csp != XVID_CSP_NULL)
1078                  {                  {
1079                          pEnc->current->quant =                  QUEUEINFO * q = &pEnc->queue[pEnc->queue_tail];
1080                                  ((pEnc->reference->quant+pEnc->current->quant)*\  
1081                                   pEnc->bquant_ratio) / 200;                  start_timer();
1082                    if (image_input
1083                            (&q->image, pEnc->mbParam.width, pEnc->mbParam.height,
1084                            pEnc->mbParam.edged_width, (uint8_t**)xFrame->input.plane, xFrame->input.stride,
1085                            xFrame->input.csp, xFrame->vol_flags & XVID_VOL_INTERLACING))
1086                    {
1087                            emms();
1088                            return XVID_ERR_FORMAT;
1089                  }                  }
1090                  else                  stop_conv_timer();
1091    
1092                    if ((xFrame->vop_flags & XVID_VOP_CHROMAOPT)) {
1093                            image_chroma_optimize(&q->image,
1094                                    pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
1095                    }
1096    
1097                    q->frame = *xFrame;
1098    
1099                    if (xFrame->quant_intra_matrix)
1100                  {                  {
1101                          pEnc->current->quant = pFrame->bquant;                          memcpy(q->quant_intra_matrix, xFrame->quant_intra_matrix, 64*sizeof(unsigned char));
1102                            q->frame.quant_intra_matrix = q->quant_intra_matrix;
1103                  }                  }
1104    
1105                  /* store frame into bframe buffer & swap ref back to current */                  if (xFrame->quant_inter_matrix)
1106                  SWAP(pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);                  {
1107                  SWAP(pEnc->current, pEnc->reference);                          memcpy(q->quant_inter_matrix, xFrame->quant_inter_matrix, 64*sizeof(unsigned char));
1108                            q->frame.quant_inter_matrix = q->quant_inter_matrix;
1109                    }
1110    
1111                  pEnc->bframenum_tail++;                  pEnc->queue_tail = (pEnc->queue_tail + 1) % (pEnc->mbParam.max_bframes+1);
1112                    pEnc->queue_size++;
1113            }
1114    
1115    
1116            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1117             * bframe flush code
1118             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1119    
1120                  pFrame->intra = 0;  repeat:
                 pFrame->length = 0;  
                 pFrame->input_consumed = 1;  
1121    
1122                  pEnc->mbParam.m_ticks += pEnc->mbParam.fincr;          if (pEnc->flush_bframes)
                 if (pEnc->mbParam.m_ticks > pEnc->mbParam.fbase)  
1123                  {                  {
1124                          pEnc->mbParam.m_seconds++;                  if (pEnc->bframenum_head < pEnc->bframenum_tail) {
1125                          pEnc->mbParam.m_ticks = 0;  
1126                            DPRINTF(XVID_DEBUG_DEBUG,"*** BFRAME (flush) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1127                                            pEnc->bframenum_head, pEnc->bframenum_tail,
1128                                            pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1129    
1130                            if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1131                                    image_copy(&pEnc->sOriginal2, &pEnc->bframes[pEnc->bframenum_head]->image,
1132                                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1133                  }                  }
1134    
1135                  return XVID_ERR_OK;                          FrameCodeB(pEnc, pEnc->bframes[pEnc->bframenum_head], &bs);
1136                            call_plugins(pEnc, pEnc->bframes[pEnc->bframenum_head], &pEnc->sOriginal2, XVID_PLG_AFTER, NULL, NULL, stats);
1137                            pEnc->bframenum_head++;
1138    
1139                            goto done;
1140          }          }
1141    
1142                    /* write an empty marker to the bitstream.
1143    
1144                       for divx5 decoder compatibility, this marker must consist
1145                       of a not-coded p-vop, with a time_base of zero, and time_increment
1146                       indentical to the future-referece frame.
1147                    */
1148    
1149                    if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED && pEnc->bframenum_tail > 0)) {
1150                            int tmp;
1151                            int bits;
1152    
1153                            DPRINTF(XVID_DEBUG_DEBUG,"*** EMPTY bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1154                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1155                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1156    
1157                            bits = BitstreamPos(&bs);
1158    
1159                            tmp = pEnc->current->seconds;
1160                            pEnc->current->seconds = 0; /* force time_base = 0 */
1161    
1162                            BitstreamWriteVopHeader(&bs, &pEnc->mbParam, pEnc->current, 0, pEnc->current->quant);
1163          BitstreamPad(&bs);          BitstreamPad(&bs);
1164          pFrame->length = BitstreamLength(&bs);                          pEnc->current->seconds = tmp;
1165    
1166                            /* add the not-coded length to the reference frame size */
1167                            pEnc->current->length += (BitstreamPos(&bs) - bits) / 8;
1168                            call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1169    
1170                            /* flush complete: reset counters */
1171                            pEnc->flush_bframes = 0;
1172                            pEnc->bframenum_head = pEnc->bframenum_tail = 0;
1173                            goto done;
1174    
1175          if (pResult)                  }
1176    
1177                    /* flush complete: reset counters */
1178                    pEnc->flush_bframes = 0;
1179                    pEnc->bframenum_head = pEnc->bframenum_tail = 0;
1180            }
1181    
1182            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1183             * dequeue frame from the encoding queue
1184             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1185    
1186            if (pEnc->queue_size == 0)              /* empty */
1187          {          {
1188                  pResult->quant = pEnc->current->quant;                  if (xFrame->input.csp == XVID_CSP_NULL) /* no futher input */
1189                  pResult->hlength = pFrame->length - (pEnc->sStat.iTextBits/8);                  {
1190                  pResult->kblks = pEnc->sStat.kblks;  
1191                  pResult->mblks = pEnc->sStat.mblks;                          DPRINTF(XVID_DEBUG_DEBUG,"*** FINISH bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1192                  pResult->ublks = pEnc->sStat.ublks;                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1193                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1194    
1195                            if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0) {
1196                                    call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1197          }          }
1198    
1199          EMMS();                          /* if the very last frame is to be b-vop, we must change it to a p-vop */
1200                            if (pEnc->bframenum_tail > 0) {
1201    
1202  #ifdef _DEBUG                                  SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
1203          psnr = image_psnr(&pEnc->sOriginal,                                  pEnc->bframenum_tail--;
1204                            &pEnc->current->image,                                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
                           pEnc->mbParam.edged_width,  
                           pEnc->mbParam.width,  
                           pEnc->mbParam.height);  
1205    
1206          snprintf(temp, 127, "PSNR: %f\n", psnr);                                  /* convert B-VOP to P-VOP */
1207          DEBUG(temp);                                  pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1208  #endif                                  pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1209                                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1210    
1211          if (pFrame->quant == 0)                                  if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1212          {                                          image_copy(&pEnc->sOriginal, &pEnc->current->image,
1213                  RateControlUpdate(&pEnc->rate_control,                                                     pEnc->mbParam.edged_width, pEnc->mbParam.height);
1214                                    pEnc->current->quant,                                  }
1215                                    pFrame->length,  
1216                                    pFrame->intra);                                  DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1217                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1218                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1219                                    pEnc->mbParam.frame_drop_ratio = -1; /* it must be a coded vop */
1220    
1221                                    FrameCodeP(pEnc, &bs);
1222    
1223    
1224                                    if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail==0) {
1225                                            call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1226                                    }else{
1227                                            pEnc->flush_bframes = 1;
1228                                            goto done;
1229                                    }
1230                            }
1231                            DPRINTF(XVID_DEBUG_DEBUG, "*** END\n");
1232    
1233                            emms();
1234                            return XVID_ERR_END;    /* end of stream reached */
1235                    }
1236                    goto done;      /* nothing to encode yet; encoder lag */
1237            }
1238    
1239            /* the current FRAME becomes the reference */
1240            SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
1241    
1242            /* remove frame from encoding-queue (head), and move it into the current */
1243            image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head].image);
1244            frame = &pEnc->queue[pEnc->queue_head].frame;
1245            pEnc->queue_head = (pEnc->queue_head + 1) % (pEnc->mbParam.max_bframes+1);
1246            pEnc->queue_size--;
1247    
1248    
1249            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1250             * init pEnc->current fields
1251             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1252    
1253            pEnc->current->fincr = pEnc->mbParam.fincr>0 ? pEnc->mbParam.fincr : frame->fincr;
1254            inc_frame_num(pEnc);
1255            pEnc->current->vol_flags = frame->vol_flags;
1256            pEnc->current->vop_flags = frame->vop_flags;
1257            pEnc->current->motion_flags = frame->motion;
1258            pEnc->current->fcode = pEnc->mbParam.m_fcode;
1259            pEnc->current->bcode = pEnc->mbParam.m_fcode;
1260    
1261    
1262            if ((xFrame->vop_flags & XVID_VOP_CHROMAOPT)) {
1263                    image_chroma_optimize(&pEnc->current->image,
1264                            pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.edged_width);
1265            }
1266    
1267            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1268             * frame type & quant selection
1269             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1270    
1271            type = frame->type;
1272            pEnc->current->quant = frame->quant;
1273    
1274            call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_BEFORE, &type, (int*)&pEnc->current->quant, stats);
1275    
1276            if (type > 0){  /* XVID_TYPE_?VOP */
1277                    type = type2coding(type);       /* convert XVID_TYPE_?VOP to bitstream coding type */
1278            } else{         /* XVID_TYPE_AUTO */
1279                    if (pEnc->iFrameNum == 0 || (pEnc->mbParam.iMaxKeyInterval > 0 && pEnc->iFrameNum >= pEnc->mbParam.iMaxKeyInterval)){
1280                            pEnc->iFrameNum = 0;
1281                            type = I_VOP;
1282                    }else{
1283                            type = MEanalysis(&pEnc->reference->image, pEnc->current,
1284                                                              &pEnc->mbParam, pEnc->mbParam.iMaxKeyInterval,
1285                                                              pEnc->iFrameNum, pEnc->bframenum_tail, xFrame->bframe_threshold,
1286                                                              (pEnc->bframes) ? pEnc->bframes[pEnc->bframenum_head]->mbs: NULL);
1287                    }
1288            }
1289    
1290            if (type != I_VOP)
1291                    pEnc->current->vol_flags = pEnc->mbParam.vol_flags; /* don't allow VOL changes here */
1292    
1293            /* bframes buffer overflow check */
1294            if (type == B_VOP && pEnc->bframenum_tail >= pEnc->mbParam.max_bframes) {
1295                    type = P_VOP;
1296          }          }
1297    
1298          pEnc->iFrameNum++;          pEnc->iFrameNum++;
1299          pEnc->mbParam.m_ticks += pEnc->mbParam.fincr;  
1300          if (pEnc->mbParam.m_ticks > pEnc->mbParam.fbase)          if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1301          {                  image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 5,
1302                  pEnc->mbParam.m_seconds++;                          "%d  st:%lld  if:%d", pEnc->current->frame_num, pEnc->current->stamp, pEnc->iFrameNum);
                 pEnc->mbParam.m_ticks = 0;  
1303          }          }
         pFrame->input_consumed = 1;  
1304    
1305          stop_global_timer();          /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1306          write_timer();           * encode this frame as a b-vop
1307             * (we dont encode here, rather we store the frame in the bframes queue, to be encoded later)
1308             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1309            if (type == B_VOP) {
1310                    if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1311                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "BVOP");
1312                    }
1313    
1314          return XVID_ERR_OK;                  if (frame->quant < 1) {
1315                            pEnc->current->quant = ((((pEnc->reference->quant + pEnc->current->quant) *
1316                                    pEnc->mbParam.bquant_ratio) / 2) + pEnc->mbParam.bquant_offset)/100;
1317    
1318                    } else {
1319                            pEnc->current->quant = frame->quant;
1320  }  }
 #else  
 /*****************************************************************************  
  * Frame encoder entry point for IP capable encoder  
  ****************************************************************************/  
 int  
 encoder_encode(Encoder * pEnc,  
                XVID_ENC_FRAME * pFrame,  
                XVID_ENC_STATS * pResult)  
 {  
         uint16_t x, y;  
         Bitstream bs;  
         uint32_t bits;  
         uint16_t write_vol_header = 0;  
 #ifdef _DEBUG  
         float psnr;  
         uint8_t temp[128];  
 #endif  
1321    
1322          start_global_timer();                  if (pEnc->current->quant < 1)
1323                            pEnc->current->quant = 1;
1324                    else if (pEnc->current->quant > 31)
1325                            pEnc->current->quant = 31;
1326    
1327          ENC_CHECK(pEnc);                  DPRINTF(XVID_DEBUG_DEBUG,"*** BFRAME (store) bf: head=%i tail=%i   queue: head=%i tail=%i size=%i  quant=%i\n",
1328          ENC_CHECK(pFrame);                                  pEnc->bframenum_head, pEnc->bframenum_tail,
1329          ENC_CHECK(pFrame->bitstream);                                  pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size,pEnc->current->quant);
         ENC_CHECK(pFrame->image);  
   
         SWAP(pEnc->current, pEnc->reference);  
   
         pEnc->current->global_flags = pFrame->general;  
         pEnc->current->motion_flags = pFrame->motion;  
         pEnc->mbParam.hint = &pFrame->hint;  
1330    
1331          start_timer();                  /* store frame into bframe buffer & swap ref back to current */
1332          if (image_input(&pEnc->current->image,                  SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1333                          pEnc->mbParam.width,                  SWAP(FRAMEINFO*, pEnc->current, pEnc->reference);
                         pEnc->mbParam.height,  
                         pEnc->mbParam.edged_width,  
                         pFrame->image,  
                         pFrame->colorspace) < 0)  
                 return XVID_ERR_FORMAT;  
         stop_conv_timer();  
1334    
1335  #ifdef _DEBUG                  pEnc->bframenum_tail++;
1336          image_copy(&pEnc->sOriginal,  
1337                     &pEnc->current->image,                  goto repeat;
1338                     pEnc->mbParam.edged_width,          }
                    pEnc->mbParam.height);  
 #endif  
1339    
         EMMS();  
1340    
1341          BitstreamInit(&bs, pFrame->bitstream, 0);                  DPRINTF(XVID_DEBUG_DEBUG,"*** XXXXXX bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1342                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1343                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1344    
1345          if (pFrame->quant == 0)          /* for unpacked bframes, output the stats for the last encoded frame */
1346            if (!(pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->mbParam.max_bframes > 0)
1347          {          {
1348                  pEnc->current->quant = RateControlGetQ(&pEnc->rate_control,0);                  if (pEnc->current->stamp > 0) {
1349                            call_plugins(pEnc, pEnc->reference, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1350          }          }
1351          else          else if (stats) {
1352          {              stats->type = XVID_TYPE_NOTHING;
1353                  pEnc->current->quant = pFrame->quant;          }
1354            }
1355    
1356            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1357             * closed-gop
1358             * if the frame prior to an iframe is scheduled as a bframe, we must change it to a pframe
1359             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1360    
1361            if (type == I_VOP && (pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP) && pEnc->bframenum_tail > 0) {
1362    
1363                    /* place this frame back on the encoding-queue (head) */
1364                    /* we will deal with it next time */
1365                    dec_frame_num(pEnc);
1366                    pEnc->iFrameNum--;
1367    
1368                    pEnc->queue_head = (pEnc->queue_head + (pEnc->mbParam.max_bframes+1) - 1) % (pEnc->mbParam.max_bframes+1);
1369                    pEnc->queue_size++;
1370                    image_swap(&pEnc->current->image, &pEnc->queue[pEnc->queue_head].image);
1371    
1372                    /* grab the last frame from the bframe-queue */
1373    
1374                    pEnc->bframenum_tail--;
1375                    SWAP(FRAMEINFO*, pEnc->current, pEnc->bframes[pEnc->bframenum_tail]);
1376    
1377                    if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1378                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 100, "CLOSED GOP BVOP->PVOP");
1379                    }
1380    
1381                    /* convert B-VOP quant to P-VOP */
1382                    pEnc->current->quant  = 100*pEnc->current->quant - pEnc->mbParam.bquant_offset;
1383                    pEnc->current->quant += pEnc->mbParam.bquant_ratio - 1; /* to avoid rouding issues */
1384                    pEnc->current->quant /= pEnc->mbParam.bquant_ratio;
1385                    type = P_VOP;
1386            }
1387    
1388    
1389            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1390             * encode this frame as an i-vop
1391             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1392    
1393            if (type == I_VOP) {
1394    
1395                    DPRINTF(XVID_DEBUG_DEBUG,"*** IFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1396                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1397                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1398    
1399                    if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1400                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "IVOP");
1401                    }
1402    
1403                    pEnc->iFrameNum = 1;
1404    
1405                    /* ---- update vol flags at IVOP ----------- */
1406                    pEnc->mbParam.vol_flags = pEnc->current->vol_flags;
1407    
1408                    /* Aspect ratio */
1409                    switch(frame->par) {
1410                    case XVID_PAR_11_VGA:
1411                    case XVID_PAR_43_PAL:
1412                    case XVID_PAR_43_NTSC:
1413                    case XVID_PAR_169_PAL:
1414                    case XVID_PAR_169_NTSC:
1415                    case XVID_PAR_EXT:
1416                            pEnc->mbParam.par = frame->par;
1417                            break;
1418                    default:
1419                            pEnc->mbParam.par = XVID_PAR_11_VGA;
1420                            break;
1421                    }
1422    
1423                    /* For extended PAR only, we try to sanityse/simplify par values */
1424                    if (pEnc->mbParam.par == XVID_PAR_EXT) {
1425                            pEnc->mbParam.par_width  = frame->par_width;
1426                            pEnc->mbParam.par_height = frame->par_height;
1427                            simplify_par(&pEnc->mbParam.par_width, &pEnc->mbParam.par_height);
1428                    }
1429    
1430                    if ((pEnc->mbParam.vol_flags & XVID_VOL_MPEGQUANT)) {
1431                            if (frame->quant_intra_matrix != NULL)
1432                                    set_intra_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_intra_matrix);
1433                            if (frame->quant_inter_matrix != NULL)
1434                                    set_inter_matrix(pEnc->mbParam.mpeg_quant_matrices, frame->quant_inter_matrix);
1435                    }
1436    
1437                    /* prevent vol/vop misuse */
1438    
1439                    if (!(pEnc->current->vol_flags & XVID_VOL_INTERLACING))
1440                            pEnc->current->vop_flags &= ~(XVID_VOP_TOPFIELDFIRST|XVID_VOP_ALTERNATESCAN);
1441    
1442                    /* ^^^------------------------ */
1443    
1444                    if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1445                            image_copy(&pEnc->sOriginal, &pEnc->current->image,
1446                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1447                    }
1448    
1449                    FrameCodeI(pEnc, &bs);
1450                    xFrame->out_flags |= XVID_KEYFRAME;
1451    
1452            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1453             * encode this frame as an p-vop
1454             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1455    
1456            } else { /* (type == P_VOP || type == S_VOP) */
1457    
1458                    DPRINTF(XVID_DEBUG_DEBUG,"*** PFRAME bf: head=%i tail=%i   queue: head=%i tail=%i size=%i\n",
1459                                    pEnc->bframenum_head, pEnc->bframenum_tail,
1460                                    pEnc->queue_head, pEnc->queue_tail, pEnc->queue_size);
1461    
1462                    if ((pEnc->current->vop_flags & XVID_VOP_DEBUG)) {
1463                            image_printf(&pEnc->current->image, pEnc->mbParam.edged_width, pEnc->mbParam.height, 5, 200, "PVOP");
1464                    }
1465    
1466                    if ((pEnc->mbParam.plugin_flags & XVID_REQORIGINAL)) {
1467                            image_copy(&pEnc->sOriginal, &pEnc->current->image,
1468                                       pEnc->mbParam.edged_width, pEnc->mbParam.height);
1469          }          }
1470    
1471          if ((pEnc->current->global_flags & XVID_LUMIMASKING))                  if ( FrameCodeP(pEnc, &bs) == 0 ) {
1472                            /* N-VOP, we mustn't code b-frames yet */
1473                            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) ||
1474                                     pEnc->mbParam.max_bframes == 0)
1475                                    call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1476                            goto done;
1477                    }
1478            }
1479    
1480    
1481            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1482             * on next enc_encode call we must flush bframes
1483             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1484    
1485    /*done_flush:*/
1486    
1487            pEnc->flush_bframes = 1;
1488    
1489            /* packed & queued_bframes: dont bother outputting stats here, we do so after the flush */
1490            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) && pEnc->bframenum_tail > 0) {
1491                    goto repeat;
1492            }
1493    
1494            /* packed or no-bframes or no-bframes-queued: output stats */
1495            if ((pEnc->mbParam.global_flags & XVID_GLOBAL_PACKED) || pEnc->mbParam.max_bframes == 0 ) {
1496                    call_plugins(pEnc, pEnc->current, &pEnc->sOriginal, XVID_PLG_AFTER, NULL, NULL, stats);
1497            }
1498    
1499            /* %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
1500             * done; return number of bytes consumed
1501             * %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% */
1502    
1503    done:
1504    
1505            stop_global_timer();
1506            write_timer();
1507    
1508            emms();
1509            return BitstreamLength(&bs);
1510    }
1511    
1512    
1513    static void SetMacroblockQuants(MBParam * const pParam, FRAMEINFO * frame)
1514          {          {
1515                  int * temp_dquants = (int *)          unsigned int i;
1516                          xvid_malloc(pEnc->mbParam.mb_width * \          MACROBLOCK * pMB = frame->mbs;
1517                                      pEnc->mbParam.mb_height * \          int quant = frame->mbs[0].quant; /* set by XVID_PLG_FRAME */
1518                                      sizeof(int),          if (quant > 31)
1519                                      CACHE_LINE);                  frame->quant = quant = 31;
1520            else if (quant < 1)
1521                    frame->quant = quant = 1;
1522    
1523            for (i = 0; i < pParam->mb_height * pParam->mb_width; i++) {
1524                    quant += pMB->dquant;
1525                    if (quant > 31)
1526                            quant = 31;
1527                    else if (quant < 1)
1528                            quant = 1;
1529                    pMB->quant = quant;
1530                    pMB++;
1531            }
1532    }
1533    
                 pEnc->current->quant =  
                         adaptive_quantization(pEnc->current->image.y,  
                                               pEnc->mbParam.edged_width,  
                                               temp_dquants,  
                                               pEnc->current->quant,  
                                               pEnc->current->quant,  
                                               2*pEnc->current->quant,  
                                               pEnc->mbParam.mb_width,  
                                               pEnc->mbParam.mb_height);  
1534    
1535                  for (y = 0; y < pEnc->mbParam.mb_height; y++)  static __inline void
1536    CodeIntraMB(MACROBLOCK * pMB)
1537                  {                  {
1538            pMB->mode = MODE_INTRA;
1539    
1540                          #define OFFSET(x,y) ((x) + (y)*pEnc->mbParam.mb_width)          /* zero mv statistics */
1541            pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;
1542            pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;
1543            pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;
1544            pMB->sad16 = 0;
1545    
1546            if (pMB->dquant != 0) {
1547                    pMB->mode = MODE_INTRA_Q;
1548            }
1549    }
1550    
1551                          for (x = 0; x < pEnc->mbParam.mb_width; x++)  static void
1552    SliceCodeI(SMPData *data)
1553                          {                          {
1554            Encoder *pEnc = (Encoder *) data->pEnc;
1555            Bitstream *bs = (Bitstream *) data->bs;
1556    
1557            uint16_t x, y;
1558            int mb_width = pEnc->mbParam.mb_width;
1559            int mb_height = pEnc->mbParam.mb_height;
1560    
1561            int bound = 0, num_slices = pEnc->num_slices;
1562            FRAMEINFO *const current = pEnc->current;
1563    
1564            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1565            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1566    
1567                                  MACROBLOCK *pMB =          if (data->start_y > 0) { /* write resync marker */
1568                                          &pEnc->current->mbs[OFFSET(x,y)];                  bound = data->start_y*mb_width;
1569                                  pMB->dquant =                  write_video_packet_header(bs, &pEnc->mbParam, current, bound);
                                         iDQtab[temp_dquants[OFFSET(x,y)] + 2];  
1570                          }                          }
1571    
1572                          #undef OFFSET          for (y = data->start_y; y < data->stop_y; y++) {
1573                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1574    
1575                    if (new_bound > bound) {
1576                            bound = new_bound;
1577                            BitstreamPadAlways(bs);
1578                            write_video_packet_header(bs, &pEnc->mbParam, current, bound);
1579                  }                  }
1580    
1581                  xvid_free(temp_dquants);                  for (x = 0; x < mb_width; x++) {
1582                            MACROBLOCK *pMB = &current->mbs[x + y * mb_width];
1583    
1584                            CodeIntraMB(pMB);
1585    
1586                            MBTransQuantIntra(&pEnc->mbParam, current, pMB, x, y,
1587                                                              dct_codes, qcoeff);
1588    
1589                            start_timer();
1590                            MBPrediction(current, x, y, mb_width, qcoeff, bound);
1591                            stop_prediction_timer();
1592    
1593                            start_timer();
1594                            MBCoding(current, pMB, qcoeff, bs, data->sStat);
1595                            stop_coding_timer();
1596    
1597                    }
1598          }          }
1599    
1600          if (pEnc->current->global_flags & XVID_H263QUANT)          emms();
1601          {          BitstreamPadAlways(bs);
                 if(pEnc->mbParam.m_quant_type != H263_QUANT)  
                         write_vol_header = 1;  
                 pEnc->mbParam.m_quant_type = H263_QUANT;  
1602          }          }
1603          else if (pEnc->current->global_flags & XVID_MPEGQUANT)  
1604    static __inline void
1605    SerializeBitstreams(Encoder *pEnc, FRAMEINFO *current, Bitstream *bs, int num_threads)
1606          {          {
1607                  int matrix1_changed, matrix2_changed;          int k;
1608            uint32_t pos = BitstreamLength(bs);
1609    
1610                  matrix1_changed = matrix2_changed = 0;          for (k = 1; k < num_threads; k++) {
1611                    uint32_t len = BitstreamLength(pEnc->smpData[k].bs);
1612    
1613                  if(pEnc->mbParam.m_quant_type != MPEG4_QUANT)                  memcpy((void *)((ptr_t)bs->start + pos),
1614                          write_vol_header = 1;                             (void *)((ptr_t)pEnc->smpData[k].bs->start), len);
1615    
1616                  pEnc->mbParam.m_quant_type = MPEG4_QUANT;                  current->length += len;
1617                    pos += len;
1618    
1619                  if ((pEnc->current->global_flags & XVID_CUSTOM_QMATRIX) > 0) {                  /* collect stats */
1620                          if(pFrame->quant_intra_matrix != NULL)                  current->sStat.iTextBits += pEnc->smpData[k].sStat->iTextBits;
1621                                  matrix1_changed =                  current->sStat.kblks += pEnc->smpData[k].sStat->kblks;
1622                                          set_intra_matrix(pFrame->quant_intra_matrix);                  current->sStat.mblks += pEnc->smpData[k].sStat->mblks;
1623                          if(pFrame->quant_inter_matrix != NULL)                  current->sStat.ublks += pEnc->smpData[k].sStat->ublks;
1624                                  matrix2_changed                  current->sStat.iMVBits += pEnc->smpData[k].sStat->iMVBits;
1625                                          = set_inter_matrix(pFrame->quant_inter_matrix);          }
1626    
1627            if (num_threads > 1) {
1628                    uint32_t pos32 = pos>>2;
1629                    bs->tail = bs->start + pos32;
1630                    bs->pos = 8*(pos - (pos32<<2));
1631                    bs->buf = 0;
1632    
1633                    if (bs->pos > 0) {
1634                            uint32_t pos8 = bs->pos/8;
1635                            memset((void *)((ptr_t)bs->tail+pos8), 0, (4-pos8));
1636                            pos = *bs->tail;
1637    #ifndef ARCH_IS_BIG_ENDIAN
1638                            BSWAP(pos);
1639    #endif
1640                            bs->buf = pos;
1641                  }                  }
                 else {  
                         matrix1_changed = set_intra_matrix(get_default_intra_matrix());  
                         matrix2_changed = set_inter_matrix(get_default_inter_matrix());  
1642                  }                  }
                 if(write_vol_header == 0)  
                         write_vol_header = matrix1_changed | matrix2_changed;  
1643          }          }
1644    
1645          if (pFrame->intra < 0)  static int
1646    FrameCodeI(Encoder * pEnc,
1647                       Bitstream * bs)
1648          {          {
1649                  if ((pEnc->iFrameNum == 0) ||          int bits = BitstreamPos(bs);
1650            int bound = 0, num_slices = pEnc->num_slices;
1651            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1652            int slices_per_thread = (num_slices*1024 / num_threads);
1653            int mb_height = pEnc->mbParam.mb_height;
1654    #ifdef HAVE_PTHREAD
1655            void * status = NULL;
1656    #endif
1657            uint16_t k;
1658    
1659                      ((pEnc->iMaxKeyInterval > 0) &&          pEnc->mbParam.m_rounding_type = 1;
1660                       (pEnc->iFrameNum >= pEnc->iMaxKeyInterval)))          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
1661                  {          pEnc->current->coding_type = I_VOP;
1662                          pFrame->intra = FrameCodeI(pEnc,  
1663                                                     &bs,          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
1664                                                     &bits);  
1665            SetMacroblockQuants(&pEnc->mbParam, pEnc->current);
1666    
1667            BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current, num_slices);
1668    
1669            set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
1670    
1671            BitstreamPad(bs);
1672    
1673            BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1, pEnc->current->mbs[0].quant);
1674    
1675            pEnc->current->sStat.iTextBits = 0;
1676    
1677            /* multithreaded intra coding - dispatch threads */
1678            for (k = 0; k < num_threads; k++) {
1679                    int add = ((slices_per_thread + 512) >> 10);
1680    
1681                    slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
1682    
1683                    pEnc->smpData[k].pEnc = (void *) pEnc;
1684                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
1685                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
1686    
1687                    bound += add;
1688    
1689                    if (k > 0) {
1690                            BitstreamReset(pEnc->smpData[k].bs);
1691                            pEnc->smpData[k].sStat->iTextBits = 0;
1692                  }                  }
                 else  
                 {  
                         pFrame->intra = FrameCodeP(pEnc,  
                                                    &bs,  
                                                    &bits,  
                                                    0,  
                                                    write_vol_header);  
1693                  }                  }
1694            pEnc->smpData[0].bs = bs;
1695            pEnc->smpData[0].sStat = &pEnc->current->sStat;
1696    
1697    #ifdef HAVE_PTHREAD
1698            /* create threads */
1699            for (k = 1; k < num_threads; k++) {
1700                    pthread_create(&pEnc->smpData[k].handle, NULL,
1701                                   (void*)SliceCodeI, (void*)&pEnc->smpData[k]);
1702          }          }
1703          else  #endif
1704          {  
1705                  if (pFrame->intra == 1)          SliceCodeI(&pEnc->smpData[0]);
1706    
1707    #ifdef HAVE_PTHREAD
1708            /* wait until all threads are finished */
1709            for (k = 1; k < num_threads; k++) {
1710                    pthread_join(pEnc->smpData[k].handle, &status);
1711            }
1712    #endif
1713    
1714            pEnc->current->length = BitstreamLength(bs) - (bits/8);
1715    
1716            /* reassemble the pieces together */
1717            SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
1718    
1719            pEnc->current->sStat.iMVBits = 0;
1720            pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1721            pEnc->current->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
1722    
1723            pEnc->fMvPrevSigma = -1;
1724            pEnc->mbParam.m_fcode = 2;
1725    
1726            pEnc->current->is_edged = 0; /* not edged */
1727            pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
1728    
1729            return 1;                                       /* intra */
1730    }
1731    
1732    static __inline void
1733    updateFcode(Statistics * sStat, Encoder * pEnc)
1734                  {                  {
1735                          pFrame->intra = FrameCodeI(pEnc,          float fSigma;
1736                                                     &bs,          int iSearchRange;
1737                                                     &bits);  
1738            if (sStat->iMvCount == 0)
1739                    sStat->iMvCount = 1;
1740    
1741            fSigma = (float) sqrt((float) sStat->iMvSum / sStat->iMvCount);
1742    
1743            iSearchRange = 16 << pEnc->mbParam.m_fcode;
1744    
1745            if ((3.0 * fSigma > iSearchRange) && (pEnc->mbParam.m_fcode <= 5) )
1746                    pEnc->mbParam.m_fcode++;
1747    
1748            else if ((5.0 * fSigma < iSearchRange)
1749                               && (4.0 * pEnc->fMvPrevSigma < iSearchRange)
1750                               && (pEnc->mbParam.m_fcode >= 2) )
1751                    pEnc->mbParam.m_fcode--;
1752    
1753            pEnc->fMvPrevSigma = fSigma;
1754                  }                  }
1755                  else  
1756    #define BFRAME_SKIP_THRESHHOLD 30
1757    
1758    static void
1759    SliceCodeP(SMPData *data)
1760                  {                  {
1761                          pFrame->intra = FrameCodeP(pEnc,          Encoder *pEnc = (Encoder *) data->pEnc;
1762                                                     &bs,          Bitstream *bs = (Bitstream *) data->bs;
1763                                                     &bits,  
1764                                                     1,          int x, y, k;
1765                                                     write_vol_header);          FRAMEINFO *const current = pEnc->current;
1766            FRAMEINFO *const reference = pEnc->reference;
1767            MBParam * const pParam = &pEnc->mbParam;
1768            int mb_width = pParam->mb_width;
1769            int mb_height = pParam->mb_height;
1770    
1771            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1772            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1773    
1774            int bound = 0, num_slices = pEnc->num_slices;
1775    
1776            if (data->start_y > 0) { /* write resync marker */
1777                    bound = data->start_y*mb_width;
1778                    write_video_packet_header(bs, pParam, current, bound);
1779                  }                  }
1780    
1781            for (y = data->start_y; y < data->stop_y; y++) {
1782                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1783    
1784                    if (new_bound > bound) {
1785                            bound = new_bound;
1786                            BitstreamPadAlways(bs);
1787                            write_video_packet_header(bs, pParam, current, bound);
1788          }          }
1789    
1790          BitstreamPutBits(&bs, 0xFFFF, 16);                  for (x = 0; x < mb_width; x++) {
1791          BitstreamPutBits(&bs, 0xFFFF, 16);                          MACROBLOCK *pMB = &current->mbs[x + y * pParam->mb_width];
1792          BitstreamPad(&bs);                          int skip_possible;
         pFrame->length = BitstreamLength(&bs);  
1793    
1794          if (pResult)                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {
1795          {                                  CodeIntraMB(pMB);
1796                  pResult->quant = pEnc->current->quant;                                  MBTransQuantIntra(pParam, current, pMB, x, y,
1797                  pResult->hlength = pFrame->length - (pEnc->sStat.iTextBits / 8);                                                                    dct_codes, qcoeff);
1798                  pResult->kblks = pEnc->sStat.kblks;  
1799                  pResult->mblks = pEnc->sStat.mblks;                                  start_timer();
1800                  pResult->ublks = pEnc->sStat.ublks;                                  MBPrediction(current, x, y, pParam->mb_width, qcoeff, bound);
1801                                    stop_prediction_timer();
1802    
1803                                    data->sStat->kblks++;
1804    
1805                                    MBCoding(current, pMB, qcoeff, bs, data->sStat);
1806                                    stop_coding_timer();
1807                                    continue;
1808          }          }
1809    
1810          EMMS();                          start_timer();
1811                            MBMotionCompensation(pMB, x, y, &reference->image,
1812                                                                     &pEnc->vInterH, &pEnc->vInterV,
1813                                                                     &pEnc->vInterHV, &pEnc->vGMC,
1814                                                                     &current->image,
1815                                                                     dct_codes, pParam->width,
1816                                                                     pParam->height,
1817                                                                     pParam->edged_width,
1818                                                                     (current->vol_flags & XVID_VOL_QUARTERPEL),
1819                                                                     current->rounding_type,
1820                                                                     data->RefQ);
1821    
1822          if (pFrame->quant == 0)                          stop_comp_timer();
         {  
                 RateControlUpdate(&pEnc->rate_control,  
                                   pEnc->current->quant,  
                                   pFrame->length,  
                                   pFrame->intra);  
         }  
1823    
1824  #ifdef _DEBUG                          pMB->field_pred = 0;
         psnr = image_psnr(&pEnc->sOriginal,  
                           &pEnc->current->image,  
                           pEnc->mbParam.edged_width,  
                           pEnc->mbParam.width,  
                           pEnc->mbParam.height);  
1825    
1826          snprintf(temp, 127, "PSNR: %f\n", psnr);                          if (pMB->cbp != 0) {
1827          DEBUG(temp);                                  pMB->cbp = MBTransQuantInter(pParam, current, pMB, x, y,
1828  #endif                                                               dct_codes, qcoeff);
1829                            }
1830    
1831          pEnc->iFrameNum++;                          if (pMB->dquant != 0)
1832                                    MBSetDquant(pMB, x, y, pParam);
1833    
         stop_global_timer();  
         write_timer();  
1834    
1835          return XVID_ERR_OK;                          if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||
1836                                       pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||
1837                                       pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {
1838                                    data->sStat->mblks++;
1839                            }  else {
1840                                    data->sStat->ublks++;
1841  }  }
 #endif  
1842    
1843                            start_timer();
1844    
1845  static __inline void CodeIntraMB(Encoder *pEnc, MACROBLOCK *pMB) {                          /* Finished processing the MB, now check if to CODE or SKIP */
1846    
1847          pMB->mode = MODE_INTRA;                          skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER);
1848    
1849          /* zero mv statistics */                          if (current->coding_type == S_VOP)
1850          pMB->mvs[0].x = pMB->mvs[1].x = pMB->mvs[2].x = pMB->mvs[3].x = 0;                                  skip_possible &= (pMB->mcsel == 1);
1851          pMB->mvs[0].y = pMB->mvs[1].y = pMB->mvs[2].y = pMB->mvs[3].y = 0;                          else { /* PVOP */
1852          pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = 0;                                  const VECTOR * const mv = (pParam->vol_flags & XVID_VOL_QUARTERPEL) ?
1853          pMB->sad16 = 0;                                                                                  pMB->qmvs : pMB->mvs;
1854                                    skip_possible &= ((mv->x|mv->y) == 0);
1855                            }
1856    
1857                            if ((pMB->mode == MODE_NOT_CODED) || (skip_possible)) {
1858                                    /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */
1859                                    int bSkip = 1;
1860    
1861                                    if (current->coding_type == P_VOP) {    /* special rule for P-VOP's SKIP */
1862                                            for (k = pEnc->bframenum_head; k < pEnc->bframenum_tail; k++) {
1863                                                    int iSAD;
1864                                                    iSAD = sad16(reference->image.y + 16*y*pParam->edged_width + 16*x,
1865                                                                                    pEnc->bframes[k]->image.y + 16*y*pParam->edged_width + 16*x,
1866                                                                                    pParam->edged_width, BFRAME_SKIP_THRESHHOLD * pMB->quant);
1867                                                    if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant || ((bound > 1) &&
1868                                                            ((y*mb_width+x == bound) || (y*mb_width+x == bound+1)))) { /* Some third-party decoders have problems with coloc skip MB before or after
1869                                                                                                                                                                               resync marker in BVOP. We avoid any ambiguity and force no skip at slice boundary */
1870                                                            bSkip = 0; /* could not SKIP */
1871                                                            if (pParam->vol_flags & XVID_VOL_QUARTERPEL) {
1872                                                                    VECTOR predMV = get_qpmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1873                                                                    pMB->pmvs[0].x = - predMV.x;
1874                                                                    pMB->pmvs[0].y = - predMV.y;
1875                                                            } else {
1876                                                                    VECTOR predMV = get_pmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1877                                                                    pMB->pmvs[0].x = - predMV.x;
1878                                                                    pMB->pmvs[0].y = - predMV.y;
1879                                                            }
1880                                                            pMB->mode = MODE_INTER;
1881                                                            pMB->cbp = 0;
1882                                                            break;
1883                                                    }
1884                                            }
1885                                    }
1886    
1887          if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {                                  if (bSkip) {
1888                  if(pMB->dquant != NO_CHANGE)                                          /* do SKIP */
1889                  {                                          pMB->mode = MODE_NOT_CODED;
1890                          pMB->mode = MODE_INTRA_Q;                                          MBSkip(bs);
1891                          pEnc->current->quant += DQtab[pMB->dquant];                                          stop_coding_timer();
1892                                            continue;       /* next MB */
1893                                    }
1894                            }
1895    
1896                          if (pEnc->current->quant > 31) pEnc->current->quant = 31;                          /* ordinary case: normal coded INTER/INTER4V block */
1897                          if (pEnc->current->quant < 1) pEnc->current->quant = 1;                          MBCoding(current, pMB, qcoeff, bs, data->sStat);
1898                            stop_coding_timer();
1899                  }                  }
1900          }          }
1901    
1902          pMB->quant = pEnc->current->quant;          BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
1903            emms();
1904  }  }
1905    
1906    /* FrameCodeP also handles S(GMC)-VOPs */
1907    static int
1908    FrameCodeP(Encoder * pEnc, Bitstream * bs)
1909    {
1910            int bits = BitstreamPos(bs);
1911    
1912            FRAMEINFO *const current = pEnc->current;
1913            FRAMEINFO *const reference = pEnc->reference;
1914            MBParam * const pParam = &pEnc->mbParam;
1915            int mb_width = pParam->mb_width;
1916            int mb_height = pParam->mb_height;
1917            int coded = 1;
1918    
1919            int k = 0, bound = 0, num_slices = pEnc->num_slices;
1920            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1921    #ifdef HAVE_PTHREAD
1922            void * status = NULL;
1923            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
1924    #endif
1925            int slices_per_thread = (num_slices*1024 / num_threads);
1926    
1927  #define FCODEBITS       3          IMAGE *pRef = &reference->image;
 #define MODEBITS        5  
1928    
1929  void HintedMESet(Encoder * pEnc, int * intra)          if (!reference->is_edged) {
1930  {                  start_timer();
1931          HINTINFO * hint;                  image_setedges(pRef, pParam->edged_width, pParam->edged_height,
1932          Bitstream bs;                                             pParam->width, pParam->height, XVID_BS_VERSION);
1933          int length, high;                  stop_edges_timer();
1934          uint32_t x, y;                  reference->is_edged = 1;
1935            }
1936    
1937          hint = pEnc->mbParam.hint;          pParam->m_rounding_type = 1 - pParam->m_rounding_type;
1938            current->rounding_type = pParam->m_rounding_type;
1939            current->fcode = pParam->m_fcode;
1940    
1941          if (hint->rawhints)          if ((current->vop_flags & XVID_VOP_HALFPEL)) {
1942          {                  if (reference->is_interpolated != current->rounding_type) {
1943                  *intra = hint->mvhint.intra;                          start_timer();
1944                            image_interpolate(pRef->y, pEnc->vInterH.y, pEnc->vInterV.y,
1945                                                              pEnc->vInterHV.y, pParam->edged_width,
1946                                                              pParam->edged_height,
1947                                                              (pParam->vol_flags & XVID_VOL_QUARTERPEL),
1948                                                              current->rounding_type);
1949                            stop_inter_timer();
1950                            reference->is_interpolated = current->rounding_type;
1951          }          }
         else  
         {  
                 BitstreamInit(&bs, hint->hintstream, hint->hintlength);  
                 *intra = BitstreamGetBit(&bs);  
1952          }          }
1953    
1954          if (*intra)          current->sStat.iTextBits = current->sStat.iMvSum = current->sStat.iMvCount =
1955          {                  current->sStat.kblks = current->sStat.mblks = current->sStat.ublks =
1956                  return;                  current->sStat.iMVBits = 0;
         }  
1957    
1958          pEnc->current->fcode = (hint->rawhints) ? hint->mvhint.fcode : BitstreamGetBits(&bs, FCODEBITS);          current->coding_type = P_VOP;
1959    
1960          length  = pEnc->current->fcode + 5;          if (current->vop_flags & XVID_VOP_RD_PSNRHVSM) {
1961          high    = 1 << (length - 1);                  image_block_variance(&current->image, pParam->edged_width, current->mbs,
1962                                         pParam->mb_width, pParam->mb_height);
1963            }
1964    
1965          for (y=0 ; y<pEnc->mbParam.mb_height ; ++y)          call_plugins(pEnc, pEnc->current, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
         {  
                 for (x=0 ; x<pEnc->mbParam.mb_width ; ++x)  
                 {  
                         MACROBLOCK * pMB = &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
                         MVBLOCKHINT * bhint = &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];  
                         VECTOR pred[4];  
                         VECTOR tmp;  
                         int32_t dummy[4];  
                         int vec;  
1966    
1967                          pMB->mode = (hint->rawhints) ? bhint->mode : BitstreamGetBits(&bs, MODEBITS);          SetMacroblockQuants(&pEnc->mbParam, current);
1968    
1969                          pMB->mode = (pMB->mode == MODE_INTER_Q) ? MODE_INTER : pMB->mode;          start_timer();
1970                          pMB->mode = (pMB->mode == MODE_INTRA_Q) ? MODE_INTRA : pMB->mode;          if (current->vol_flags & XVID_VOL_GMC)  /* GMC only for S(GMC)-VOPs */
1971            {       int gmcval;
1972                    current->warp = GlobalMotionEst( current->mbs, pParam, current, reference,
1973                                                                     &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV, num_slices);
1974    
1975                    if (current->motion_flags & XVID_ME_GME_REFINE) {
1976                            gmcval = GlobalMotionEstRefine(&current->warp,
1977                                                                                       current->mbs, pParam,
1978                                                                                       current, reference,
1979                                                                                       &current->image,
1980                                                                                       &reference->image,
1981                                                                                       &pEnc->vInterH,
1982                                                                                       &pEnc->vInterV,
1983                                                                                       &pEnc->vInterHV);
1984                    } else {
1985                            gmcval = globalSAD(&current->warp, pParam, current->mbs,
1986                                                               current,
1987                                                               &reference->image,
1988                                                               &current->image,
1989                                                               pEnc->vGMC.y);
1990                    }
1991    
1992                          if (pMB->mode == MODE_INTER)                  gmcval += /*current->quant*/ 2 * (int)(pParam->mb_width*pParam->mb_height);
                         {  
                                 tmp.x  = (hint->rawhints) ? bhint->mvs[0].x : BitstreamGetBits(&bs, length);  
                                 tmp.y  = (hint->rawhints) ? bhint->mvs[0].y : BitstreamGetBits(&bs, length);  
                                 tmp.x -= (tmp.x >= high) ? high*2 : 0;  
                                 tmp.y -= (tmp.y >= high) ? high*2 : 0;  
1993    
1994                                  get_pmvdata(pEnc->current->mbs, x, y, pEnc->mbParam.mb_width, 0, pred, dummy);                  /* 1st '3': 3 warpoints, 2nd '3': 16th pel res (2<<3) */
1995                    generate_GMCparameters( 3, 3, &current->warp,
1996                                    pParam->width, pParam->height,
1997                                    &current->new_gmc_data);
1998    
1999                                  for (vec=0 ; vec<4 ; ++vec)                  if ( (gmcval<0) && ( (current->warp.duv[1].x != 0) || (current->warp.duv[1].y != 0) ||
2000                                  {                           (current->warp.duv[2].x != 0) || (current->warp.duv[2].y != 0) ) )
                                         pMB->mvs[vec].x  = tmp.x;  
                                         pMB->mvs[vec].y  = tmp.y;  
                                         pMB->pmvs[vec].x = pMB->mvs[0].x - pred[0].x;  
                                         pMB->pmvs[vec].y = pMB->mvs[0].y - pred[0].y;  
                                 }  
                         }  
                         else if (pMB->mode == MODE_INTER4V)  
2001                          {                          {
2002                                  for (vec=0 ; vec<4 ; ++vec)                          current->coding_type = S_VOP;
                                 {  
                                         tmp.x  = (hint->rawhints) ? bhint->mvs[vec].x : BitstreamGetBits(&bs, length);  
                                         tmp.y  = (hint->rawhints) ? bhint->mvs[vec].y : BitstreamGetBits(&bs, length);  
                                         tmp.x -= (tmp.x >= high) ? high*2 : 0;  
                                         tmp.y -= (tmp.y >= high) ? high*2 : 0;  
2003    
2004                                          get_pmvdata(pEnc->current->mbs, x, y, pEnc->mbParam.mb_width, vec, pred, dummy);                          generate_GMCimage(&current->new_gmc_data, &reference->image,
2005                                    pParam->mb_width, pParam->mb_height,
2006                                    pParam->edged_width, pParam->edged_width/2,
2007                                    pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
2008                                    current->rounding_type, current->mbs, &pEnc->vGMC);
2009    
2010                                          pMB->mvs[vec].x  = tmp.x;                  } else {
2011                                          pMB->mvs[vec].y  = tmp.y;  
2012                                          pMB->pmvs[vec].x = pMB->mvs[vec].x - pred[0].x;                          generate_GMCimage(&current->new_gmc_data, &reference->image,
2013                                          pMB->pmvs[vec].y = pMB->mvs[vec].y - pred[0].y;                                  pParam->mb_width, pParam->mb_height,
2014                                  }                                  pParam->edged_width, pParam->edged_width/2,
2015                          }                                  pParam->m_fcode, ((pParam->vol_flags & XVID_VOL_QUARTERPEL)?1:0), 0,
2016                          else    // intra / stuffing / not_coded                                  current->rounding_type, current->mbs, NULL);    /* no warping, just AMV */
                         {  
                                 for (vec=0 ; vec<4 ; ++vec)  
                                 {  
                                         pMB->mvs[vec].x  = pMB->mvs[vec].y  = 0;  
2017                                  }                                  }
2018                          }                          }
2019    
2020                          if (pMB->mode == MODE_INTER4V &&  #ifdef HAVE_PTHREAD
2021                                  (pEnc->current->global_flags & XVID_LUMIMASKING) && pMB->dquant != NO_CHANGE)          if (pEnc->num_threads > 0) {
                         {  
                                 pMB->mode = MODE_INTRA;  
2022    
2023                                  for (vec=0 ; vec<4 ; ++vec)                  /* multithreaded motion estimation - dispatch threads */
2024                                  {                  while (k < pEnc->num_threads) {
2025                                          pMB->mvs[vec].x = pMB->mvs[vec].y = 0;                          int i, add_s = (slices_per_thread + 512) >> 10;
2026                                  }                          int add_t = (threads_per_slice + 512) >> 10;
                         }  
                 }  
         }  
 }  
2027    
2028                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2029                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2030                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2031    
2032  void HintedMEGet(Encoder * pEnc, int intra)                          slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2033  {                          threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
         HINTINFO * hint;  
         Bitstream bs;  
         uint32_t x, y;  
         int length, high;  
2034    
2035          hint = pEnc->mbParam.hint;                          for (i = 0; i < add_t; i++) {
2036                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2037    
2038          if (hint->rawhints)                                  pEnc->smpData[k+i].pEnc = (void *) pEnc;
2039          {                                  pEnc->smpData[k+i].y_row = i;
2040                  hint->mvhint.intra = intra;                                  pEnc->smpData[k+i].y_step = add_t;
2041          }                                  pEnc->smpData[k+i].stop_y = stop_y;
2042          else                                  pEnc->smpData[k+i].start_y = start_y;
         {  
                 BitstreamInit(&bs, hint->hintstream, 0);  
                 BitstreamPutBit(&bs, intra);  
         }  
2043    
2044          if (intra)                                  /* todo: sort out temp space once and for all */
2045          {                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2046                  if (!hint->rawhints)                                                                                          16*((k+i)>>1)*pParam->edged_width;
                 {  
                         BitstreamPad(&bs);  
                         hint->hintlength = BitstreamLength(&bs);  
                 }  
                 return;  
2047          }          }
2048    
2049          length  = pEnc->current->fcode + 5;                          pEnc->smpData[k].complete_count_above =
2050          high    = 1 << (length - 1);                                  pEnc->smpData[k+add_t-1].complete_count_self - 1;
2051    
2052          if (hint->rawhints)                          bound += add_s;
2053          {                          k += add_t;
                 hint->mvhint.fcode = pEnc->current->fcode;  
2054          }          }
2055          else  
2056          {                  for (k = 1; k < pEnc->num_threads; k++) {
2057                  BitstreamPutBits(&bs, pEnc->current->fcode, FCODEBITS);                          pthread_create(&pEnc->smpData[k].handle, NULL,
2058                                    (void*)MotionEstimateSMP, (void*)&pEnc->smpData[k]);
2059          }          }
2060    
2061          for (y=0 ; y<pEnc->mbParam.mb_height ; ++y)                  MotionEstimateSMP(&pEnc->smpData[0]);
         {  
                 for (x=0 ; x<pEnc->mbParam.mb_width ; ++x)  
                 {  
                         MACROBLOCK * pMB = &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
                         MVBLOCKHINT * bhint = &hint->mvhint.block[x + y * pEnc->mbParam.mb_width];  
                         VECTOR tmp;  
2062    
2063                          if (hint->rawhints)                  for (k = 1; k < pEnc->num_threads; k++) {
2064                          {                          pthread_join(pEnc->smpData[k].handle, &status);
                                 bhint->mode = pMB->mode;  
2065                          }                          }
2066                          else  
2067                          {                  current->fcode = 0;
2068                                  BitstreamPutBits(&bs, pMB->mode, MODEBITS);                  for (k = 0; k < pEnc->num_threads; k++) {
2069                            current->sStat.iMvSum += pEnc->smpData[k].mvSum;
2070                            current->sStat.iMvCount += pEnc->smpData[k].mvCount;
2071                            if (pEnc->smpData[k].minfcode > current->fcode)
2072                                    current->fcode = pEnc->smpData[k].minfcode;
2073                          }                          }
2074    
2075                          if (pMB->mode == MODE_INTER || pMB->mode == MODE_INTER_Q)          } else
2076    #endif
2077                          {                          {
                                 tmp.x  = pMB->mvs[0].x;  
                                 tmp.y  = pMB->mvs[0].y;  
                                 tmp.x += (tmp.x < 0) ? high*2 : 0;  
                                 tmp.y += (tmp.y < 0) ? high*2 : 0;  
2078    
2079                                  if (hint->rawhints)                  /* regular ME */
                                 {  
                                         bhint->mvs[0].x = tmp.x;  
                                         bhint->mvs[0].y = tmp.y;  
                                 }  
                                 else  
                                 {  
                                         BitstreamPutBits(&bs, tmp.x, length);  
                                         BitstreamPutBits(&bs, tmp.y, length);  
                                 }  
                         }  
                         else if (pMB->mode == MODE_INTER4V)  
                         {  
                                 int vec;  
2080    
2081                                  for (vec=0 ; vec<4 ; ++vec)                  MotionEstimation(&pEnc->mbParam, current, reference,
2082                                  {                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
2083                                          tmp.x  = pMB->mvs[vec].x;                                                   &pEnc->vGMC, 256*4096, num_slices);
                                         tmp.y  = pMB->mvs[vec].y;  
                                         tmp.x += (tmp.x < 0) ? high*2 : 0;  
                                         tmp.y += (tmp.y < 0) ? high*2 : 0;  
2084    
                                         if (hint->rawhints)  
                                         {  
                                                 bhint->mvs[vec].x = tmp.x;  
                                                 bhint->mvs[vec].y = tmp.y;  
                                         }  
                                         else  
                                         {  
                                                 BitstreamPutBits(&bs, tmp.x, length);  
                                                 BitstreamPutBits(&bs, tmp.y, length);  
                                         }  
                                 }  
                         }  
                 }  
2085          }          }
2086    
2087          if (!hint->rawhints)          stop_motion_timer();
         {  
                 BitstreamPad(&bs);  
                 hint->hintlength = BitstreamLength(&bs);  
         }  
 }  
2088    
2089            set_timecodes(current,reference,pParam->fbase);
2090    
2091  static int FrameCodeI(Encoder * pEnc, Bitstream * bs, uint32_t *pBits)          BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 1, current->mbs[0].quant);
 {  
2092    
2093          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          /* multithreaded inter coding - dispatch threads */
         DECLARE_ALIGNED_MATRIX(qcoeff,    6, 64, int16_t, CACHE_LINE);  
2094    
2095          uint16_t x, y;          bound = 0;
2096            slices_per_thread = (num_slices*1024 / num_threads);
2097    
2098          pEnc->iFrameNum = 0;          for (k = 0; k < num_threads; k++) {
2099          pEnc->mbParam.m_rounding_type = 1;                  int add = ((slices_per_thread + 512) >> 10);
         pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;  
         pEnc->current->coding_type = I_VOP;  
2100    
2101          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
         BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current);  
2102    
2103          *pBits = BitstreamPos(bs);                  pEnc->smpData[k].pEnc = (void *) pEnc;
2104                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2105                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2106                    pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2107    
2108          pEnc->sStat.iTextBits = 0;                  bound += add;
         pEnc->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;  
         pEnc->sStat.mblks = pEnc->sStat.ublks = 0;  
2109    
2110          for (y = 0; y < pEnc->mbParam.mb_height; y++)                  if (k > 0) {
2111                  for (x = 0; x < pEnc->mbParam.mb_width; x++)                          pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2112                  {                          pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks =
2113                          MACROBLOCK *pMB = &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];                          pEnc->smpData[k].sStat->iMVBits = 0;
2114    
2115                          CodeIntraMB(pEnc, pMB);                          BitstreamReset(pEnc->smpData[k].bs);
2116                    }
2117            }
2118            pEnc->smpData[0].bs = bs;
2119            pEnc->smpData[0].sStat = &current->sStat;
2120    
2121                          MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y, dct_codes, qcoeff);  #ifdef HAVE_PTHREAD
2122            /* create threads */
2123            for (k = 1; k < num_threads; k++) {
2124                    pthread_create(&pEnc->smpData[k].handle, NULL,
2125                            (void*)SliceCodeP, (void*)&pEnc->smpData[k]);
2126            }
2127    #endif
2128    
2129                          start_timer();          SliceCodeP(&pEnc->smpData[0]);
                         MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);  
                         stop_prediction_timer();  
2130    
2131                          start_timer();  #ifdef HAVE_PTHREAD
2132                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->sStat);          /* wait until all threads are finished */
2133                          stop_coding_timer();          for (k = 1; k < num_threads; k++) {
2134                    pthread_join(pEnc->smpData[k].handle, &status);
2135                  }                  }
2136    #endif
2137    
2138          emms();          current->length = BitstreamLength(bs) - (bits/8);
2139    
2140          *pBits = BitstreamPos(bs) - *pBits;          /* reassemble the pieces together */
2141          pEnc->sStat.fMvPrevSigma = -1;          SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
         pEnc->sStat.iMvSum = 0;  
         pEnc->sStat.iMvCount = 0;  
         pEnc->mbParam.m_fcode = 2;  
2142    
2143          if (pEnc->current->global_flags & XVID_HINTEDME_GET)          updateFcode(&current->sStat, pEnc);
         {  
                 HintedMEGet(pEnc, 1);  
         }  
2144    
2145          return 1;                                        // intra          /* frame drop code */
2146  }  #if 0
2147            DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", current->sStat.kblks, current->sStat.mblks, current->sStat.ublks);
2148    #endif
2149    
2150            if (current->sStat.kblks + current->sStat.mblks <
2151                    (pParam->frame_drop_ratio * mb_width * mb_height) / 100 &&
2152                    ( (pEnc->bframenum_head >= pEnc->bframenum_tail) || !(pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP)) &&
2153                    (current->coding_type == P_VOP) )
2154            {
2155                    current->sStat.kblks = current->sStat.mblks = current->sStat.iTextBits = 0;
2156                    current->sStat.ublks = mb_width * mb_height;
2157    
2158  #define INTRA_THRESHOLD 0.5                  BitstreamReset(bs);
2159    
2160  static int FrameCodeP(Encoder * pEnc, Bitstream * bs, uint32_t *pBits, bool force_inter, bool vol_header)                  set_timecodes(current,reference,pParam->fbase);
2161  {                  BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 0, current->mbs[0].quant);
         float fSigma;  
2162    
2163          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);                  /* copy reference frame details into the current frame */
2164          DECLARE_ALIGNED_MATRIX(qcoeff,    6, 64, int16_t, CACHE_LINE);                  current->quant = reference->quant;
2165                    current->motion_flags = reference->motion_flags;
2166                    current->rounding_type = reference->rounding_type;
2167                    current->fcode = reference->fcode;
2168                    current->bcode = reference->bcode;
2169                    current->stamp = reference->stamp;
2170                    image_copy(&current->image, &reference->image, pParam->edged_width, pParam->height);
2171                    memcpy(current->mbs, reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);
2172                    coded = 0;
2173    
2174          int iLimit;                  BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
         uint32_t x, y;  
         int iSearchRange;  
         int bIntra;  
2175    
2176          /* IMAGE *pCurrent = &pEnc->current->image; */                  current->length = (BitstreamPos(bs) - bits) / 8;
         IMAGE *pRef = &pEnc->reference->image;  
2177    
2178          start_timer();          } else {
         image_setedges(pRef,  
                        pEnc->mbParam.edged_width,  
                        pEnc->mbParam.edged_height,  
                        pEnc->mbParam.width,  
                        pEnc->mbParam.height,  
                        pEnc->current->global_flags & XVID_INTERLACING);  
         stop_edges_timer();  
2179    
2180          pEnc->mbParam.m_rounding_type = 1 - pEnc->mbParam.m_rounding_type;                  pEnc->current->is_edged = 0; /* not edged */
2181          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;                  pEnc->current->is_interpolated = -1; /* not interpolated (fake rounding -1) */
         pEnc->current->fcode = pEnc->mbParam.m_fcode;  
2182    
2183          if (!force_inter)                  /* what was this frame's interpolated reference will become
2184                  iLimit = (int)(pEnc->mbParam.mb_width * pEnc->mbParam.mb_height * INTRA_THRESHOLD);                          forward (past) reference in b-frame coding */
         else  
                 iLimit = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height + 1;  
2185    
2186          if ((pEnc->current->global_flags & XVID_HALFPEL)) {                  image_swap(&pEnc->vInterH, &pEnc->f_refh);
2187                  start_timer();                  image_swap(&pEnc->vInterV, &pEnc->f_refv);
2188                  image_interpolate(pRef, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                  image_swap(&pEnc->vInterHV, &pEnc->f_refhv);
                                   pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,  
                                   pEnc->current->rounding_type);  
                 stop_inter_timer();  
2189          }          }
2190    
2191          start_timer();          /* XXX: debug
         if (pEnc->current->global_flags & XVID_HINTEDME_SET)  
         {  
                 HintedMESet(pEnc, &bIntra);  
         }  
         else  
2192          {          {
2193                  bIntra = MotionEstimation(                  char s[100];
2194                          &pEnc->mbParam,                  sprintf(s, "\\%05i_cur.pgm", pEnc->m_framenum);
2195                          pEnc->current,                  image_dump_yuvpgm(&current->image,
2196                          pEnc->reference,                          pParam->edged_width,
2197                          &pEnc->vInterH,                          pParam->width, pParam->height, s);
2198                          &pEnc->vInterV,  
2199                          &pEnc->vInterHV,                  sprintf(s, "\\%05i_ref.pgm", pEnc->m_framenum);
2200                          iLimit);                  image_dump_yuvpgm(&reference->image,
2201                            pParam->edged_width,
2202                            pParam->width, pParam->height, s);
2203          }          }
2204          stop_motion_timer();          */
2205    
2206          if (bIntra == 1)          return coded;
         {  
                 return FrameCodeI(pEnc, bs, pBits);  
2207          }          }
2208    
2209          pEnc->current->coding_type = P_VOP;  static void
2210    SliceCodeB(SMPData *data)
2211    {
2212            Encoder *pEnc = (Encoder *) data->pEnc;
2213            Bitstream *bs = (Bitstream *) data->bs;
2214    
2215          if(vol_header)          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
2216                  BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
2217    
2218          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current);          int x, y;
2219            FRAMEINFO * const frame = (FRAMEINFO * const) data->current;
2220            MBParam * const pParam = &pEnc->mbParam;
2221            int mb_width = pParam->mb_width;
2222            int mb_height = pParam->mb_height;
2223            IMAGE *f_ref = &pEnc->reference->image;
2224            IMAGE *b_ref = &pEnc->current->image;
2225    
2226          *pBits = BitstreamPos(bs);          int bound = data->start_y*mb_width;
2227            int num_slices = pEnc->num_slices;
2228    
2229          pEnc->sStat.iTextBits = 0;          if (data->start_y > 0) { /* write resync marker */
2230          pEnc->sStat.iMvSum = 0;                  write_video_packet_header(bs, pParam, frame, bound+1);
2231          pEnc->sStat.iMvCount = 0;          }
         pEnc->sStat.kblks = pEnc->sStat.mblks = pEnc->sStat.ublks = 0;  
2232    
2233          for(y = 0; y < pEnc->mbParam.mb_height; y++)          for (y = data->start_y; y < MIN(data->stop_y+1, mb_height); y++) {
2234          {                  int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
2235                  for(x = 0; x < pEnc->mbParam.mb_width; x++)                  int stop_x = (y == data->stop_y) ? 1 : mb_width;
2236                  {                  int start_x = (y == data->start_y && y > 0) ? 1 : 0;
2237                          MACROBLOCK * pMB = &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
2238                    for (x = start_x; x < stop_x; x++) {
2239                            MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];
2240    
2241                            /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */
2242                            if (mb->mode == MODE_NOT_CODED) {
2243                                    if (pParam->plugin_flags & XVID_REQORIGINAL) {
2244                                            MBMotionCompensation(mb, x, y, f_ref, NULL, f_ref, NULL, NULL, &frame->image,
2245                                                                                     NULL, 0, 0, pParam->edged_width, 0, 0, data->RefQ);
2246                                    }
2247                                    continue;
2248                            }
2249    
2250                          bIntra = (pMB->mode == MODE_INTRA) || (pMB->mode == MODE_INTRA_Q);                          if (new_bound > bound && x > 0) {
2251                                    bound = new_bound;
2252                                    BitstreamPadAlways(bs);
2253                                    write_video_packet_header(bs, pParam, frame, y*mb_width+x);
2254                            }
2255    
2256                          if (!bIntra)                          mb->quant = frame->quant;
                         {  
                                 start_timer();  
                                 MBMotionCompensation(pMB,  
                                                      x, y,  
                                                      &pEnc->reference->image,  
                                                      &pEnc->vInterH,  
                                                      &pEnc->vInterV,  
                                                      &pEnc->vInterHV,  
                                                      &pEnc->current->image,  
                                                      dct_codes,  
                                                      pEnc->mbParam.width,  
                                                      pEnc->mbParam.height,  
                                                      pEnc->mbParam.edged_width,  
                                                      pEnc->current->rounding_type);  
                                 stop_comp_timer();  
2257    
2258                                  if ((pEnc->current->global_flags & XVID_LUMIMASKING)) {                          if (mb->cbp != 0 || pParam->plugin_flags & XVID_REQORIGINAL) {
2259                                          if(pMB->dquant != NO_CHANGE) {                                  /* we have to motion-compensate, transfer etc,
2260                                                  pMB->mode = MODE_INTER_Q;                                          because there might be blocks to code */
                                                 pEnc->current->quant += DQtab[pMB->dquant];  
                                                 if (pEnc->current->quant > 31) pEnc->current->quant = 31;  
                                                 else if(pEnc->current->quant < 1) pEnc->current->quant = 1;  
                                         }  
                                 }  
                                 pMB->quant = pEnc->current->quant;  
2261    
2262                                  pMB->field_pred = 0;                                  MBMotionCompensationBVOP(pParam, mb, x, y, &frame->image,
2263                                                                                     f_ref, &pEnc->f_refh, &pEnc->f_refv,
2264                                                                                     &pEnc->f_refhv, b_ref, &pEnc->vInterH,
2265                                                                                     &pEnc->vInterV, &pEnc->vInterHV, dct_codes,
2266                                                                                     data->RefQ);
2267    
2268                                  pMB->cbp = MBTransQuantInter(&pEnc->mbParam, pEnc->current, pMB, x, y, dct_codes, qcoeff);                                  mb->cbp = MBTransQuantInterBVOP(pParam, frame, mb, x, y,  dct_codes, qcoeff);
                         }  
                         else  
                         {  
                                 CodeIntraMB(pEnc, pMB);  
                                 MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y, dct_codes, qcoeff);  
2269                          }                          }
2270    
2271                          start_timer();                          if (mb->mode == MODE_DIRECT_NO4V)
2272                          MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);                                  mb->mode = MODE_DIRECT;
                         stop_prediction_timer();  
2273    
2274                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q)                          if (mb->mode == MODE_DIRECT && (mb->cbp | mb->pmvs[3].x | mb->pmvs[3].y) == 0)
2275                          {                                  mb->mode = MODE_DIRECT_NONE_MV; /* skipped */
                                 pEnc->sStat.kblks++;  
                         }  
                         else if (pMB->cbp ||  
                                  pMB->mvs[0].x || pMB->mvs[0].y ||  
                                  pMB->mvs[1].x || pMB->mvs[1].y ||  
                                  pMB->mvs[2].x || pMB->mvs[2].y ||  
                                  pMB->mvs[3].x || pMB->mvs[3].y)  
                         {  
                                 pEnc->sStat.mblks++;  
                         }  
2276                          else                          else
2277                          {                                  if (frame->vop_flags & XVID_VOP_GREYSCALE)
2278                                  pEnc->sStat.ublks++;                                          /* keep only bits 5-2 -- Chroma blocks will just be skipped by MBCodingBVOP */
2279                          }                                          mb->cbp &= 0x3C;
2280    
2281                          start_timer();                          start_timer();
2282                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->sStat);                          MBCodingBVOP(frame, mb, qcoeff, frame->fcode, frame->bcode, bs, data->sStat);
2283                          stop_coding_timer();                          stop_coding_timer();
2284                  }                  }
2285          }          }
2286    
2287            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2288          emms();          emms();
   
         if (pEnc->current->global_flags & XVID_HINTEDME_GET)  
         {  
                 HintedMEGet(pEnc, 0);  
2289          }          }
2290    
2291          if (pEnc->sStat.iMvCount == 0)  static void
2292                  pEnc->sStat.iMvCount = 1;  FrameCodeB(Encoder * pEnc,
2293                       FRAMEINFO * frame,
2294          fSigma = (float)sqrt((float) pEnc->sStat.iMvSum / pEnc->sStat.iMvCount);                     Bitstream * bs)
   
         iSearchRange = 1 << (3 + pEnc->mbParam.m_fcode);  
   
         if ((fSigma > iSearchRange / 3)  
             && (pEnc->mbParam.m_fcode <= 3))    // maximum search range 128  
         {  
                 pEnc->mbParam.m_fcode++;  
                 iSearchRange *= 2;  
         }  
         else if ((fSigma < iSearchRange / 6)  
                  && (pEnc->sStat.fMvPrevSigma >= 0)  
                  && (pEnc->sStat.fMvPrevSigma < iSearchRange / 6)  
                  && (pEnc->mbParam.m_fcode >= 2))       // minimum search range 16  
2295          {          {
2296                  pEnc->mbParam.m_fcode--;          int bits = BitstreamPos(bs);
2297                  iSearchRange /= 2;          int k = 0, bound = 0, num_slices = pEnc->num_slices;
2298          }          int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
2299    #ifdef HAVE_PTHREAD
2300            void * status = NULL;
2301            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
2302    #endif
2303            int slices_per_thread = (num_slices*1024 / num_threads);
2304    
2305          pEnc->sStat.fMvPrevSigma = fSigma;          IMAGE *f_ref = &pEnc->reference->image;
2306            IMAGE *b_ref = &pEnc->current->image;
2307    
2308          *pBits = BitstreamPos(bs) - *pBits;          MBParam * const pParam = &pEnc->mbParam;
2309            int mb_height = pParam->mb_height;
2310    
2311          return 0;                                        // inter          #ifdef BFRAMES_DEC_DEBUG
2312            FILE *fp;
2313            static char first=0;
2314    #define BFRAME_DEBUG    if (!first && fp){ \
2315                    fprintf(fp,"Y=%3d   X=%3d   MB=%2d   CBP=%02X\n",y,x,mb->mode,mb->cbp); \
2316  }  }
2317    
2318            if (!first){
2319                    fp=fopen("C:\\XVIDDBGE.TXT","w");
2320            }
2321    #endif
2322    
2323  #ifdef BFRAMES          /* forward  */
2324  static void FrameCodeB(Encoder * pEnc, FRAMEINFO * frame, Bitstream * bs, uint32_t *pBits)          if (!pEnc->reference->is_edged) {
2325  {                  image_setedges(f_ref, pEnc->mbParam.edged_width,
2326      int16_t dct_codes[6*64];                                             pEnc->mbParam.edged_height, pEnc->mbParam.width,
2327      int16_t qcoeff[6*64];                                             pEnc->mbParam.height, XVID_BS_VERSION);
2328      uint32_t x, y;                  pEnc->reference->is_edged = 1;
2329          VECTOR forward;          }
         VECTOR backward;  
   
     IMAGE *f_ref = &pEnc->reference->image;  
         IMAGE *b_ref = &pEnc->current->image;  
2330    
2331          // forward          if (pEnc->reference->is_interpolated != 0) {
         image_setedges(f_ref, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height, pEnc->mbParam.width, pEnc->mbParam.height, frame->global_flags & XVID_INTERLACING);  
2332          start_timer();          start_timer();
2333          image_interpolate(f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,                  image_interpolate(f_ref->y, pEnc->f_refh.y, pEnc->f_refv.y, pEnc->f_refhv.y,
2334                  pEnc->mbParam.edged_width, pEnc->mbParam.edged_height, 0);                                                    pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2335                                                      (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2336          stop_inter_timer();          stop_inter_timer();
2337                    pEnc->reference->is_interpolated = 0;
2338            }
2339    
2340            /* backward */
2341            if (!pEnc->current->is_edged) {
2342                    image_setedges(b_ref, pEnc->mbParam.edged_width,
2343                                               pEnc->mbParam.edged_height, pEnc->mbParam.width,
2344                                               pEnc->mbParam.height, XVID_BS_VERSION);
2345                    pEnc->current->is_edged = 1;
2346            }
2347    
2348          // backward          if (pEnc->current->is_interpolated != 0) {
         image_setedges(b_ref, pEnc->mbParam.edged_width, pEnc->mbParam.edged_height, pEnc->mbParam.width, pEnc->mbParam.height, frame->global_flags & XVID_INTERLACING);  
2349      start_timer();      start_timer();
2350          image_interpolate(b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                  image_interpolate(b_ref->y, pEnc->vInterH.y, pEnc->vInterV.y, pEnc->vInterHV.y,
2351                  pEnc->mbParam.edged_width, pEnc->mbParam.edged_height, 0);                                                  pEnc->mbParam.edged_width, pEnc->mbParam.edged_height,
2352                                                    (pEnc->mbParam.vol_flags & XVID_VOL_QUARTERPEL), 0);
2353          stop_inter_timer();          stop_inter_timer();
2354                    pEnc->current->is_interpolated = 0;
2355            }
2356    
2357          start_timer();          frame->coding_type = B_VOP;
         MotionEstimationBVOP(&pEnc->mbParam, frame,  
                 pEnc->reference->mbs, f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,  
                 pEnc->current->mbs, b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV);  
2358    
2359            if ((frame->vop_flags & XVID_VOP_RD_PSNRHVSM) && (frame->vop_flags & XVID_VOP_RD_BVOP)) {
2360                    image_block_variance(&frame->image, pEnc->mbParam.edged_width, frame->mbs,
2361                                         pEnc->mbParam.mb_width, pEnc->mbParam.mb_height);
2362            }
2363    
2364          stop_motion_timer();          call_plugins(pEnc, frame, NULL, XVID_PLG_FRAME, NULL, NULL, NULL);
2365    
2366          /*if (test_quant_type(&pEnc->mbParam, pEnc->current))          frame->fcode = frame->bcode = pEnc->current->fcode;
         {  
                 BitstreamWriteVolHeader(bs, pEnc->mbParam.width, pEnc->mbParam.height, pEnc->mbParam.quant_type);  
         }*/  
2367    
2368      frame->coding_type = B_VOP;          start_timer();
     BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame);  
2369    
2370      *pBits = BitstreamPos(bs);  #ifdef HAVE_PTHREAD
2371            if (pEnc->num_threads > 0) {
2372    
2373      pEnc->sStat.iTextBits = 0;                  /* multithreaded motion estimation - dispatch threads */
2374      pEnc->sStat.iMvSum = 0;                  while (k < pEnc->num_threads) {
2375      pEnc->sStat.iMvCount = 0;                          int i, add_s = (slices_per_thread + 512) >> 10;
2376          pEnc->sStat.kblks = pEnc->sStat.mblks = pEnc->sStat.ublks = 0;                          int add_t = (threads_per_slice + 512) >> 10;
2377    
2378                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2379                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2380                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2381    
2382      for (y = 0; y < pEnc->mbParam.mb_height; y++)                          slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2383          {                          threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
                 // reset prediction  
2384    
2385                  forward.x = 0;                          for (i = 0; i < add_t; i++) {
2386                  forward.y = 0;                                  memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
                 backward.x = 0;  
                 backward.y = 0;  
2387    
2388                  for (x = 0; x < pEnc->mbParam.mb_width; x++)                                  pEnc->smpData[k+i].pEnc = (void *) pEnc;
2389                  {                                  pEnc->smpData[k+i].current = frame;
                         MACROBLOCK * f_mb = &pEnc->reference->mbs[x + y * pEnc->mbParam.mb_width];  
                         MACROBLOCK * b_mb = &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
                         MACROBLOCK * mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];  
2390    
2391                          // decoder ignores mb when refence block is INTER(0,0), CBP=0                                  pEnc->smpData[k+i].y_row = i;
2392                          if (mb->mode == MODE_NOT_CODED)                                  pEnc->smpData[k+i].y_step = add_t;
2393                          {                                  pEnc->smpData[k+i].stop_y = stop_y;
2394                                  mb->mvs[0].x = 0;                                  pEnc->smpData[k+i].start_y = start_y;
                                 mb->mvs[0].y = 0;  
                                 continue;  
                         }  
2395    
2396                          MBMotionCompensationBVOP(&pEnc->mbParam, mb, x, y, &frame->image,                                  /* todo: sort out temp space once and for all */
2397                                          f_ref, &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2398                                          b_ref, &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                                                                                          16*((k+i)>>1)*pParam->edged_width;
2399                                          dct_codes);                          }
2400    
2401                          mb->quant = frame->quant;                          pEnc->smpData[k].complete_count_above =
2402                          mb->cbp = MBTransQuantInter(&pEnc->mbParam, frame, mb, x, y, dct_codes, qcoeff);                                  pEnc->smpData[k+add_t-1].complete_count_self - 1;
                         //mb->cbp = MBTransQuantBVOP(&pEnc->mbParam, x, y, dct_codes, qcoeff, &frame->image, frame->quant);  
2403    
2404                            bound += add_s;
2405                            k += add_t;
2406                    }
2407    
2408                          if ((mb->mode == MODE_INTERPOLATE || mb->mode == MODE_DIRECT) &&                  for (k = 1; k < pEnc->num_threads; k++) {
2409                                  mb->cbp == 0 &&                          pthread_create(&pEnc->smpData[k].handle, NULL,
2410                                  mb->mvs[0].x == 0 &&                                  (void*)SMPMotionEstimationBVOP, (void*)&pEnc->smpData[k]);
                                 mb->mvs[0].y == 0)  
                         {  
                                 mb->mode = 5;  // skipped  
2411                          }                          }
2412    
2413                          if (mb->mode == MODE_INTERPOLATE || mb->mode == MODE_FORWARD)                  SMPMotionEstimationBVOP(&pEnc->smpData[0]);
2414                          {  
2415                                  mb->pmvs[0].x = mb->mvs[0].x - forward.x;                  for (k = 1; k < pEnc->num_threads; k++) {
2416                                  mb->pmvs[0].y = mb->mvs[0].y - forward.y;                          pthread_join(pEnc->smpData[k].handle, &status);
                                 forward.x = mb->mvs[0].x;  
                                 forward.y = mb->mvs[0].y;  
2417                          }                          }
2418    
2419                          if (mb->mode == MODE_INTERPOLATE || mb->mode == MODE_BACKWARD)                  frame->fcode = frame->bcode = 0;
2420                    for (k = 0; k < pEnc->num_threads; k++) {
2421                            if (pEnc->smpData[k].minfcode > frame->fcode)
2422                                    frame->fcode = pEnc->smpData[k].minfcode;
2423                            if (pEnc->smpData[k].minbcode > frame->bcode)
2424                                    frame->bcode = pEnc->smpData[k].minbcode;
2425                    }
2426            } else
2427    #endif
2428                          {                          {
2429                                  mb->b_pmvs[0].x = mb->b_mvs[0].x - backward.x;  
2430                                  mb->b_pmvs[0].y = mb->b_mvs[0].y - backward.y;                  MotionEstimationBVOP(&pEnc->mbParam, frame,
2431                                  backward.x = mb->b_mvs[0].x;                                                           ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */
2432                                  backward.y = mb->b_mvs[0].y;                                                           ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */
2433                                                             pEnc->reference->mbs, f_ref,
2434                                                             &pEnc->f_refh, &pEnc->f_refv, &pEnc->f_refhv,
2435                                                             pEnc->current, b_ref, &pEnc->vInterH,
2436                                                             &pEnc->vInterV, &pEnc->vInterHV,
2437                                                             pEnc->num_slices);
2438                          }                          }
2439            stop_motion_timer();
2440    
2441  //                      printf("[%i %i] M=%i CBP=%i MVX=%i MVY=%i %i,%i  %i,%i\n", x, y, pMB->mode, pMB->cbp, pMB->mvs[0].x, bmb->pmvs[0].x, bmb->pmvs[0].y, forward.x, forward.y);          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);
2442            BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1, frame->quant);
2443    
2444                          start_timer();          /* reset stats */
2445                          MBCodingBVOP(mb, qcoeff, frame->fcode, frame->bcode, bs, &pEnc->sStat);          frame->sStat.iTextBits = 0;
2446                          stop_coding_timer();          frame->sStat.iMVBits = 0;
2447            frame->sStat.iMvSum = 0;
2448            frame->sStat.iMvCount = 0;
2449            frame->sStat.kblks = frame->sStat.mblks = frame->sStat.ublks = 0;
2450            frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
2451            frame->sStat.kblks = frame->sStat.ublks = 0;
2452    
2453            /* multithreaded inter coding - dispatch threads */
2454            bound = 0;
2455            slices_per_thread = (num_slices*1024 / num_threads);
2456    
2457            for (k = 0; k < num_threads; k++) {
2458                    int add = ((slices_per_thread + 512) >> 10);
2459    
2460                    slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
2461    
2462                    pEnc->smpData[k].pEnc = (void *) pEnc;
2463                    pEnc->smpData[k].current = frame;
2464                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2465                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2466                    bound += add;
2467    
2468                    /* todo: sort out temp space once and for all */
2469                    pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2470    
2471                    if (k > 0) {
2472                            BitstreamReset(pEnc->smpData[k].bs);
2473                            pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2474                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks = pEnc->smpData[k].sStat->iMVBits = 0;
2475                  }                  }
2476          }          }
2477    
2478          emms();  #ifdef HAVE_PTHREAD
2479            for (k = 1; k < num_threads; k++) {
2480                    pthread_create(&pEnc->smpData[k].handle, NULL,
2481                            (void*)SliceCodeB, (void*)&pEnc->smpData[k]);
2482            }
2483    #endif
2484    
2485            pEnc->smpData[0].bs = bs;
2486            pEnc->smpData[0].sStat = &frame->sStat;
2487            SliceCodeB(&pEnc->smpData[0]);
2488    
2489    #ifdef HAVE_PTHREAD
2490            for (k = 1; k < num_threads; k++) {
2491                    pthread_join(pEnc->smpData[k].handle, &status);
2492            }
2493    #endif
2494    
2495          // TODO: dynamic fcode/bcode ???          frame->length = BitstreamLength(bs) - (bits/8);
2496    
2497          *pBits = BitstreamPos(bs) - *pBits;          /* reassemble the pieces together */
2498            SerializeBitstreams(pEnc, frame, bs, num_threads);
2499    
2500    #ifdef BFRAMES_DEC_DEBUG
2501            if (!first){
2502                    first=1;
2503                    if (fp)
2504                            fclose(fp);
2505  }  }
2506  #endif  #endif
2507    }

Legend:
Removed from v.1.40  
changed lines
  Added in v.1.135.2.6

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4