[cvs] / xvidcore / src / motion / motion_est.h Repository:
ViewVC logotype

Diff of /xvidcore/src/motion/motion_est.h

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.1.2.9, Sun Dec 8 14:57:09 2002 UTC revision 1.3.2.19, Thu Sep 4 18:40:02 2003 UTC
# Line 1  Line 1 
1  /**************************************************************************  /*****************************************************************************
2   *   *
3   *  XVID MPEG-4 VIDEO CODEC   *  XVID MPEG-4 VIDEO CODEC
4   *  -  Motion estimation header  -   *  - Motion Estimation related header -
5   *   *
6   *  This program is an implementation of a part of one or more MPEG-4   *  Copyright(C) 2002 Christoph Lampert <gruel@web.de>
7   *  Video tools as specified in ISO/IEC 14496-2 standard.  Those intending   *               2002 Michael Militzer <michael@xvid.org>
8   *  to use this software module in hardware or software products are   *               2002-2003 Radoslaw Czyz <xvid@syskin.cjb.net>
  *  advised that its use may infringe existing patents or copyrights, and  
  *  any such use would be at such party's own risk.  The original  
  *  developer of this software module and his/her company, and subsequent  
  *  editors and their companies, will have no liability for use of this  
  *  software or modifications or derivatives thereof.  
9   *   *
10   *  This program is free software; you can redistribute it and/or modify   *  This program is free software; you can redistribute it and/or modify
11   *  it under the terms of the GNU General Public License as published by   *  it under the terms of the GNU General Public License as published by
# Line 28  Line 23 
23   *   *
24   *  $Id$   *  $Id$
25   *   *
26   ***************************************************************************/   ****************************************************************************/
27    
28  #ifndef _MOTION_EST_H_  #ifndef _MOTION_EST_H_
29  #define _MOTION_EST_H_  #define _MOTION_EST_H_
30    
31  #include "../portab.h"  #include "../portab.h"
32  #include "../global.h"  #include "../global.h"
33    #include "../image/reduced.h"
34    
35  /* hard coded motion search parameters for motion_est and smp_motion_est */  /* hard coded motion search parameters for motion_est and smp_motion_est */
36    
37  // very large value  /* very large value */
38  #define MV_MAX_ERROR    (4096 * 256)  #define MV_MAX_ERROR    (4096 * 256)
39    
40  /* INTER bias for INTER/INTRA decision; mpeg4 spec suggests 2*nb */  /* INTER bias for INTER/INTRA decision; mpeg4 spec suggests 2*nb */
# Line 46  Line 42 
42    
43  /* vector map (vlc delta size) smoother parameters ! float !*/  /* vector map (vlc delta size) smoother parameters ! float !*/
44  #define NEIGH_TEND_16X16        10.5  #define NEIGH_TEND_16X16        10.5
45  #define NEIGH_TEND_8X8          4.0  #define NEIGH_TEND_8X8          40.0
46  #define NEIGH_8X8_BIAS          30  #define NEIGH_8X8_BIAS          30
47    
48    #define BITS_MULT                       16
49    
50  /* Parameters which control inter/inter4v decision */  /* Parameters which control inter/inter4v decision */
51  #define IMV16X16                        2  #define IMV16X16                        2
52    
# Line 88  Line 86 
86          (int)(21.2656*NEIGH_TEND_8X8 + 0.5), (int)(24.8580*NEIGH_TEND_8X8 + 0.5),          (int)(21.2656*NEIGH_TEND_8X8 + 0.5), (int)(24.8580*NEIGH_TEND_8X8 + 0.5),
87          (int)(29.6436*NEIGH_TEND_8X8 + 0.5), (int)(36.4949*NEIGH_TEND_8X8 + 0.5)        };          (int)(29.6436*NEIGH_TEND_8X8 + 0.5), (int)(36.4949*NEIGH_TEND_8X8 + 0.5)        };
88    
89  // mv.length table  /* mv.length table */
90  static const uint32_t mvtab[33] = {  static const int mvtab[64] = {
91          1, 2, 3, 4, 6, 7, 7, 7,          1, 2, 3, 4, 6, 7, 7, 7,
92          9, 9, 9, 10, 10, 10, 10, 10,          9, 9, 9, 10, 10, 10, 10, 10,
93          10, 10, 10, 10, 10, 10, 10, 10,          10, 10, 10, 10, 10, 10, 10, 10,
94          10, 11, 11, 11, 11, 11, 11, 12, 12                  10, 11, 11, 11, 11, 11, 11, 12,
95  };                  12, 12, 12, 12, 12, 12, 12, 12,
96                    12, 12, 12, 12, 12, 12, 12, 12,
97                    12, 12, 12, 12, 12, 12, 12, 12, 12 };
98    
99  static const int DQtab[4] = {  static const int DQtab[4] = {
100          -1, -2, 1, 2          -1, -2, 1, 2
101  };  };
102    
103    #define RRV_MV_SCALEDOWN(a)     ( (a)>=0 ? (a+1)/2 : (a-1)/2 )
104    
105  typedef struct  typedef struct
106          {          {
107  // general fields          /* general fields */
108                  int max_dx, min_dx, max_dy, min_dy;                  int max_dx, min_dx, max_dy, min_dy;
109                  uint32_t rounding;                  uint32_t rounding;
110                  VECTOR predMV;                  VECTOR predMV;
111                  VECTOR *currentMV;                  VECTOR *currentMV;
112                  VECTOR *currentQMV;                  VECTOR *currentQMV;
113            VECTOR * currentMV2;
114            VECTOR * currentQMV2;
115                  int32_t *iMinSAD;                  int32_t *iMinSAD;
116                  const uint8_t * Ref;          int32_t * iMinSAD2;
117                  const uint8_t * RefH;          const uint8_t * RefP[6]; /* N, V, H, HV, cU, cV */
                 const uint8_t * RefV;  
                 const uint8_t * RefHV;  
                 const uint8_t * RefCU;  
                 const uint8_t * RefCV;  
118                  const uint8_t * CurU;                  const uint8_t * CurU;
119                  const uint8_t * CurV;                  const uint8_t * CurV;
120                  uint8_t * RefQ;                  uint8_t * RefQ;
# Line 125  Line 124 
124                  uint32_t iEdgedWidth;                  uint32_t iEdgedWidth;
125                  uint32_t iFcode;                  uint32_t iFcode;
126                  int * temp;                  int * temp;
127            int * dir;
128                  int qpel, qpel_precision;                  int qpel, qpel_precision;
129                  int chroma;                  int chroma;
130  //fields for interpolate and direct mode          int rrv;
131                  const uint8_t *bRef;  
132                  const uint8_t *bRefH;          /* fields for interpolate and direct modes */
133                  const uint8_t *bRefV;          const uint8_t * b_RefP[6]; /* N, V, H, HV, cU, cV */
                 const uint8_t *bRefHV;  
134                  VECTOR bpredMV;                  VECTOR bpredMV;
135                  uint32_t bFcode;                  uint32_t bFcode;
136  // fields for direct mode  
137            /* fields for direct mode */
138                  VECTOR directmvF[4];                  VECTOR directmvF[4];
139                  VECTOR directmvB[4];                  VECTOR directmvB[4];
140                  const VECTOR * referencemv;                  const VECTOR * referencemv;
         }  
         SearchData;  
141    
142            /* BITS/R-D stuff */
143            int16_t * dctSpace;
144            uint32_t iQuant;
145            uint32_t quant_type;
146            int * cbp;
147    
148  typedef void(CheckFunc)(const int x, const int y,  } SearchData;
                                                 const int Direction, int * const dir,  
                                                 const SearchData * const Data);  
149    
150  static CheckFunc CheckCandidate16, CheckCandidate16no4v, CheckCandidateInt,  
151                          CheckCandidateDirect, CheckCandidateDirectno4v,  typedef void(CheckFunc)(const int x, const int y,
152                          CheckCandidate8;                                                  const SearchData * const Data,
153  CheckFunc *CheckCandidate;                                                  const int Direction);
154    
155  /*  /*
156   * Calculate the min/max range (in halfpixels)   * Calculate the min/max range
157   * relative to the _MACROBLOCK_ position   * relative to the _MACROBLOCK_ position
158   */   */
159  static void __inline  static void __inline
# Line 162  Line 163 
163                    int32_t * const max_dy,                    int32_t * const max_dy,
164                    const uint32_t x,                    const uint32_t x,
165                    const uint32_t y,                    const uint32_t y,
166                    const uint32_t block_sz,      /* block dimension, 8 or 16 */                    uint32_t block_sz, /* block dimension, 3(8) or 4(16) */
167                    const uint32_t width,                    const uint32_t width,
168                    const uint32_t height,                    const uint32_t height,
169                    const uint32_t fcode)                    const uint32_t fcode,
170                      const int precision, /* 2 for qpel, 1 for halfpel */
171                      const int rrv)
172  {  {
173          int k;          int k;
174          const int search_range = 32 << (fcode - 1);          const int search_range = 16 << fcode;
175          const int high = search_range - 1;          int high = search_range - 1;
176          const int low = -search_range;          int low = -search_range;
177    
178          k = 2 * (int)(width - x*block_sz);          if (rrv) {
179          *max_dx = MIN(high, k);                  high = RRV_MV_SCALEUP(high);
180          k = 2 * (int)(height -  y*block_sz);                  low = RRV_MV_SCALEUP(low);
181          *max_dy = MIN(high, k);                  block_sz++;
   
         k = -2 * (int)((x+1) * block_sz);  
         *min_dx = MAX(low, k);  
         k = -2 * (int)((y+1) * block_sz);  
         *min_dy = MAX(low, k);  
182  }  }
183    
184  static void __inline          k = (int)(width - (x<<block_sz))<<precision;
 get_range_qpel(int32_t * const min_dx,  
                   int32_t * const max_dx,  
                   int32_t * const min_dy,  
                   int32_t * const max_dy,  
                   const uint32_t x,  
                   const uint32_t y,  
                   const uint32_t block_sz,      /* block dimension, 8 or 16 */  
                   const uint32_t width,  
                   const uint32_t height,  
                   const uint32_t fcode)  
 {  
         int k;  
         const int search_range = 32 << (fcode - 1);  
         const int high = search_range - 1;  
         const int low = -search_range;  
   
         k = 4 * (int)(width - x*block_sz);  
185          *max_dx = MIN(high, k);          *max_dx = MIN(high, k);
186          k = 4 * (int)(height -  y*block_sz);          k = (int)(height -  (y<<block_sz))<<precision;
187          *max_dy = MIN(high, k);          *max_dy = MIN(high, k);
188    
189          k = -4 * (int)((x+1) * block_sz);          k = (-(int)((x+1)<<block_sz))<<precision;
190          *min_dx = MAX(low, k);          *min_dx = MAX(low, k);
191          k = -4 * (int)((y+1) * block_sz);          k = (-(int)((y+1)<<block_sz))<<precision;
192          *min_dy = MAX(low, k);          *min_dy = MAX(low, k);
193  }  }
194    
195    typedef void
196  typedef void MainSearchFunc(int x, int y, const SearchData * const Data, int bDirection);  MainSearchFunc(int x, int y, const SearchData * const Data,
197                               int bDirection, CheckFunc * const CheckCandidate);
198    
199  static MainSearchFunc DiamondSearch, AdvDiamondSearch, SquareSearch;  static MainSearchFunc DiamondSearch, AdvDiamondSearch, SquareSearch;
200    
# Line 232  Line 214 
214                                   const IMAGE * const pRefH,                                   const IMAGE * const pRefH,
215                                   const IMAGE * const pRefV,                                   const IMAGE * const pRefV,
216                                   const IMAGE * const pRefHV,                                   const IMAGE * const pRefHV,
217                                    const IMAGE * const pGMC,
218                                   const uint32_t iLimit);                                   const uint32_t iLimit);
219    
220  static void  static void
# Line 243  Line 226 
226                  const int x,                  const int x,
227                  const int y,                  const int y,
228                  const uint32_t MotionFlags,                  const uint32_t MotionFlags,
229                  const uint32_t iQuant,                  const uint32_t VopFlags,
230                    const uint32_t VolFlags,
231                  SearchData * const Data,                  SearchData * const Data,
232                  const MBParam * const pParam,                  const MBParam * const pParam,
233                  const MACROBLOCK * const pMBs,                  const MACROBLOCK * const pMBs,
234                  const MACROBLOCK * const prevMBs,                  const MACROBLOCK * const prevMBs,
                 int inter4v,  
235                  MACROBLOCK * const pMB);                  MACROBLOCK * const pMB);
236    
237    static __inline void
238    GMEanalyzeMB (const uint8_t * const pCur,
239                  const uint8_t * const pRef,
240                  const uint8_t * const pRefH,
241                  const uint8_t * const pRefV,
242                  const uint8_t * const pRefHV,
243                  const int x,
244                  const int y,
245                  const MBParam * const pParam,
246                  MACROBLOCK * const pMBs,
247                  SearchData * const Data);
248    
249  #ifdef _SMP  void
250  bool  GMEanalysis(const MBParam * const pParam,
251  SMP_MotionEstimation(MBParam * const pParam,              const FRAMEINFO * const current,
252                                   FRAMEINFO * const current,              const FRAMEINFO * const reference,
                                  FRAMEINFO * const reference,  
253                                   const IMAGE * const pRefH,                                   const IMAGE * const pRefH,
254                                   const IMAGE * const pRefV,                                   const IMAGE * const pRefV,
255                                   const IMAGE * const pRefHV,              const IMAGE * const pRefHV);
256                                   const uint32_t iLimit);  
257  #endif  
258    
259    WARPPOINTS
260    GlobalMotionEst(MACROBLOCK * const pMBs,
261                                    const MBParam * const pParam,
262                                    const FRAMEINFO * const current,
263                                    const FRAMEINFO * const reference,
264                                    const IMAGE * const pRefH,
265                                    const IMAGE * const pRefV,
266                                    const IMAGE * const pRefHV      );
267    
268    
269    int
270    GlobalMotionEstRefine(WARPPOINTS *const startwp,
271                          MACROBLOCK * const pMBs,
272                          const MBParam * const pParam,
273                          const FRAMEINFO * const current,
274                          const FRAMEINFO * const reference,
275                          const IMAGE * const pCurr,
276                          const IMAGE * const pRef,
277                          const IMAGE * const pRefH,
278                          const IMAGE * const pRefV,
279                          const IMAGE * const pRefHV);
280    
281    
282    
283    
284    int
285    globalSAD(const WARPPOINTS *const wp,
286                    const MBParam * const pParam,
287                    const MACROBLOCK * const pMBs,
288                    const FRAMEINFO * const current,
289                    const IMAGE * const pRef,
290                    const IMAGE * const pCurr,
291                    uint8_t *const GMCblock);
292    
293    #define iDiamondSize 2
294    
295    static __inline uint32_t
296    MakeGoodMotionFlags(const uint32_t MotionFlags, const uint32_t VopFlags, const uint32_t VolFlags)
297    {
298            uint32_t Flags = MotionFlags;
299    
300            if (!(VopFlags & XVID_VOP_MODEDECISION_RD))
301                    Flags &= ~(XVID_ME_QUARTERPELREFINE16_RD+XVID_ME_QUARTERPELREFINE8_RD+XVID_ME_HALFPELREFINE16_RD+XVID_ME_HALFPELREFINE8_RD+XVID_ME_EXTSEARCH_RD);
302    
303            if (Flags & XVID_ME_EXTSEARCH_RD)
304                    Flags |= XVID_ME_HALFPELREFINE16_RD;
305    
306            if (Flags & XVID_ME_EXTSEARCH_RD && MotionFlags & XVID_ME_EXTSEARCH8)
307                    Flags |= XVID_ME_HALFPELREFINE8_RD;
308    
309            if (Flags & XVID_ME_HALFPELREFINE16_RD)
310                    Flags |= XVID_ME_QUARTERPELREFINE16_RD;
311    
312            if (Flags & XVID_ME_HALFPELREFINE8_RD) {
313                    Flags |= XVID_ME_QUARTERPELREFINE8_RD;
314                    Flags &= ~XVID_ME_HALFPELREFINE8;
315            }
316    
317            if (Flags & XVID_ME_QUARTERPELREFINE8_RD)
318                    Flags &= ~XVID_ME_QUARTERPELREFINE8;
319    
320            if (!(VolFlags & XVID_VOL_QUARTERPEL))
321                    Flags &= ~(XVID_ME_QUARTERPELREFINE16+XVID_ME_QUARTERPELREFINE8+XVID_ME_QUARTERPELREFINE16_RD+XVID_ME_QUARTERPELREFINE8_RD);
322    
323            if (!(VopFlags & XVID_VOP_HALFPEL))
324                    Flags &= ~(XVID_ME_EXTSEARCH16+XVID_ME_HALFPELREFINE16+XVID_ME_HALFPELREFINE8+XVID_ME_HALFPELREFINE16_RD+XVID_ME_HALFPELREFINE8_RD);
325    
326            if ((VopFlags & XVID_VOP_GREYSCALE) || (VopFlags & XVID_VOP_REDUCED))
327                    Flags &= ~(XVID_ME_CHROMA_PVOP + XVID_ME_CHROMA_BVOP);
328    
329            return Flags;
330    }
331    
332    /* RD mode decision and search */
333    
334    #include "../bitstream/zigzag.h"
335    #include "../quant/quant_mpeg4.h"
336    #include "../quant/quant_h263.h"
337    #include "../bitstream/vlc_codes.h"
338    #include "../dct/fdct.h"
339    
340    static int
341    findRDinter(SearchData * const Data,
342                            const MACROBLOCK * const pMBs, const int x, const int y,
343                            const MBParam * const pParam,
344                            const uint32_t MotionFlags);
345    
346    static int
347    findRDinter4v(const SearchData * const Data,
348                                    MACROBLOCK * const pMB, const MACROBLOCK * const pMBs,
349                                    const int x, const int y,
350                                    const MBParam * const pParam, const uint32_t MotionFlags,
351                                    const VECTOR * const backup);
352    
353    static int
354    findRDintra(const SearchData * const Data);
355    
356    static int
357    findRDgmc(const SearchData * const Data, const IMAGE * const vGMC, const int x, const int y);
358    
359    int CodeCoeffIntra_CalcBits(const int16_t qcoeff[64], const uint16_t * zigzag);
360    int CodeCoeffInter_CalcBits(const int16_t qcoeff[64], const uint16_t * zigzag);
361    
362    /* one over lambda for R-D mode decision and motion search */
363    #define LAMBDA          ( (int)(BITS_MULT/1.0) )
364    
365    static __inline unsigned int
366    Block_CalcBits( int16_t * const coeff,
367                                    int16_t * const data,
368                                    int16_t * const dqcoeff,
369                                    const uint32_t quant, const int quant_type,
370                                    uint32_t * cbp,
371                                    const int block)
372    {
373            int sum;
374            int bits;
375            int distortion = 0;
376            int i;
377    
378            fdct(data);
379    
380            if (quant_type) sum = quant_inter(coeff, data, quant);
381            else sum = quant4_inter(coeff, data, quant);
382    
383            if (sum > 0) {
384                    *cbp |= 1 << (5 - block);
385                    bits = BITS_MULT * CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
386    
387                    if (quant_type) dequant_inter(dqcoeff, coeff, quant);
388                    else dequant4_inter(dqcoeff, coeff, quant);
389    
390                    for (i = 0; i < 64; i++)
391                            distortion += (data[i] - dqcoeff[i])*(data[i] - dqcoeff[i]);
392    
393            } else {
394                    bits = 0;
395                    for (i = 0; i < 64; i++)
396                            distortion += data[i]*data[i];
397            }
398    
399            return bits + (LAMBDA*distortion)/(quant*quant);
400    }
401    
402    static __inline unsigned int
403    Block_CalcBitsIntra(int16_t * const coeff,
404                                            int16_t * const data,
405                                            int16_t * const dqcoeff,
406                                            const uint32_t quant, const int quant_type,
407                                            uint32_t * cbp,
408                                            const int block,
409                                            int * dcpred)
410    {
411            int bits, i;
412            int distortion = 0;
413            uint32_t iDcScaler = get_dc_scaler(quant, block < 4);
414            int b_dc;
415    
416            fdct(data);
417            data[0] -= 1024;
418    
419            if (quant_type) quant_intra(coeff, data, quant, iDcScaler);
420            else quant4_intra(coeff, data, quant, iDcScaler);
421    
422            b_dc = coeff[0];
423            if (block < 4) {
424                    coeff[0] -= *dcpred;
425                    *dcpred = b_dc;
426            }
427    
428            bits = BITS_MULT*CodeCoeffIntra_CalcBits(coeff, scan_tables[0]);
429            if (bits != 0) *cbp |= 1 << (5 - block);
430    
431            if (block < 4) bits += BITS_MULT*dcy_tab[coeff[0] + 255].len;
432            else bits += BITS_MULT*dcc_tab[coeff[0] + 255].len;
433    
434            coeff[0] = b_dc;
435            if (quant_type) dequant_intra(dqcoeff, coeff, quant, iDcScaler);
436            else dequant4_intra(dqcoeff, coeff, quant, iDcScaler);
437    
438            for (i = 0; i < 64; i++)
439                    distortion += (data[i] - dqcoeff[i])*(data[i] - dqcoeff[i]);
440    
441            return bits + (LAMBDA*distortion)/(quant*quant);
442    }
443    
444  #endif                                                  /* _MOTION_EST_H_ */  #endif                                                  /* _MOTION_EST_H_ */

Legend:
Removed from v.1.1.2.9  
changed lines
  Added in v.1.3.2.19

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4