[cvs] / xvidcore / src / motion / motion_est.c Repository:
ViewVC logotype

Diff of /xvidcore/src/motion/motion_est.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.58.2.14, Wed May 14 18:46:28 2003 UTC revision 1.64, Tue Apr 8 11:12:07 2003 UTC
# Line 200  Line 200 
200  GetReferenceB(const int x, const int y, const uint32_t dir, const SearchData * const data)  GetReferenceB(const int x, const int y, const uint32_t dir, const SearchData * const data)
201  {  {
202  //      dir : 0 = forward, 1 = backward  //      dir : 0 = forward, 1 = backward
203          const uint8_t *const *const direction = ( dir == 0 ? data->RefP : data->b_RefP );          const uint8_t* const *direction = ( dir == 0 ? data->RefP : data->b_RefP );
204          const int picture = ((x&1)<<1) | (y&1);          const int picture = ((x&1)<<1) | (y&1);
205          const int offset = (x>>1) + (y>>1)*data->iEdgedWidth;          const int offset = (x>>1) + (y>>1)*data->iEdgedWidth;
206          return direction[picture] + offset;          return direction[picture] + offset;
# Line 351  Line 351 
351                  data->iMinSAD[3] = data->temp[3]; current[3].x = x; current[3].y = y; }                  data->iMinSAD[3] = data->temp[3]; current[3].x = x; current[3].y = y; }
352          if (data->temp[4] < data->iMinSAD[4]) {          if (data->temp[4] < data->iMinSAD[4]) {
353                  data->iMinSAD[4] = data->temp[4]; current[4].x = x; current[4].y = y; }                  data->iMinSAD[4] = data->temp[4]; current[4].x = x; current[4].y = y; }
354    
355  }  }
356    
357  static void  static void
# Line 383  Line 384 
384          }          }
385  }  }
386    
387    
388  static void  static void
389  CheckCandidate32(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)  CheckCandidate32(const int x, const int y, const int Direction, int * const dir, const SearchData * const data)
390  {  {
# Line 463  Line 465 
465          if ( (x > data->max_dx) || (x < data->min_dx)          if ( (x > data->max_dx) || (x < data->min_dx)
466                  || (y > data->max_dy) || (y < data->min_dy) ) return;                  || (y > data->max_dy) || (y < data->min_dy) ) return;
467    
468          sad = sad32v_c(data->Cur, data->RefP[0] + (x>>1) + (y>>1)*(data->iEdgedWidth),          sad = sad32v_c(data->Cur, data->RefP[0] + x/2 + (y/2)*(data->iEdgedWidth),
469                                          data->iEdgedWidth, data->temp+1);                                          data->iEdgedWidth, data->temp+1);
470    
471          if (sad < *(data->iMinSAD)) {          if (sad < *(data->iMinSAD)) {
# Line 646  Line 648 
648  {  {
649    
650          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;
651          int32_t bits = 0;          int32_t bits = 0, sum;
652          VECTOR * current;          VECTOR * current;
653          const uint8_t * ptr;          const uint8_t * ptr;
654          int i, cbp = 0, t, xc, yc;          int i, cbp = 0, t, xc, yc;
# Line 667  Line 669 
669          for(i = 0; i < 4; i++) {          for(i = 0; i < 4; i++) {
670                  int s = 8*((i&1) + (i>>1)*data->iEdgedWidth);                  int s = 8*((i&1) + (i>>1)*data->iEdgedWidth);
671                  transfer_8to16subro(in, data->Cur + s, ptr + s, data->iEdgedWidth);                  transfer_8to16subro(in, data->Cur + s, ptr + s, data->iEdgedWidth);
672                  bits += data->temp[i] = Block_CalcBits(coeff, in, data->iQuant, data->quant_type, &cbp, i, 0);                  fdct(in);
673                    if (data->lambda8 == 0) sum = quant_inter(coeff, in, data->lambda16);
674                    else sum = quant4_inter(coeff, in, data->lambda16);
675                    if (sum > 0) {
676                            cbp |= 1 << (5 - i);
677                            bits += data->temp[i] = CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
678                    } else data->temp[i] = 0;
679          }          }
680    
681          bits += t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);          bits += t = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
682    
683          bits += xvid_cbpy_tab[15-(cbp>>2)].len;          if (bits < data->iMinSAD[0]) { // there is still a chance, adding chroma
   
         if (bits >= data->iMinSAD[0]) return;  
   
         //chroma  
684          xc = (xc >> 1) + roundtab_79[xc & 0x3];          xc = (xc >> 1) + roundtab_79[xc & 0x3];
685          yc = (yc >> 1) + roundtab_79[yc & 0x3];          yc = (yc >> 1) + roundtab_79[yc & 0x3];
686    
687          //chroma U          //chroma U
688          ptr = interpolate8x8_switch2(data->RefQ + 64, data->RefP[4], 0, 0, xc, yc,  data->iEdgedWidth/2, data->rounding);          ptr = interpolate8x8_switch2(data->RefQ + 64, data->RefP[4], 0, 0, xc, yc,  data->iEdgedWidth/2, data->rounding);
689          transfer_8to16subro(in, ptr, data->CurU, data->iEdgedWidth/2);          transfer_8to16subro(in, ptr, data->CurU, data->iEdgedWidth/2);
690          bits += Block_CalcBits(coeff, in, data->iQuant, data->quant_type, &cbp, 4, 0);                  fdct(in);
691          if (bits >= data->iMinSAD[0]) return;                  if (data->lambda8 == 0) sum = quant_inter(coeff, in, data->lambda16);
692                    else sum = quant4_inter(coeff, in, data->lambda16);
693                    if (sum > 0) {
694                            cbp |= 1 << (5 - 4);
695                            bits += CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
696                    }
697    
698                    if (bits < data->iMinSAD[0]) {
699          //chroma V          //chroma V
700          ptr = interpolate8x8_switch2(data->RefQ + 64, data->RefP[5], 0, 0, xc, yc,  data->iEdgedWidth/2, data->rounding);          ptr = interpolate8x8_switch2(data->RefQ + 64, data->RefP[5], 0, 0, xc, yc,  data->iEdgedWidth/2, data->rounding);
701          transfer_8to16subro(in, ptr, data->CurV, data->iEdgedWidth/2);          transfer_8to16subro(in, ptr, data->CurV, data->iEdgedWidth/2);
702          bits += Block_CalcBits(coeff, in, data->iQuant, data->quant_type, &cbp, 5, 0);                          fdct(in);
703                            if (data->lambda8 == 0) sum = quant_inter(coeff, in, data->lambda16);
704                            else sum = quant4_inter(coeff, in, data->lambda16);
705                            if (sum > 0) {
706                                    cbp |= 1 << (5 - 5);
707                                    bits += CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
708                            }
709                    }
710            }
711    
712            bits += xvid_cbpy_tab[15-(cbp>>2)].len;
713          bits += mcbpc_inter_tab[(MODE_INTER & 7) | ((cbp & 3) << 3)].len;          bits += mcbpc_inter_tab[(MODE_INTER & 7) | ((cbp & 3) << 3)].len;
714    
715          if (bits < data->iMinSAD[0]) {          if (bits < data->iMinSAD[0]) {
# Line 714  Line 733 
733  {  {
734    
735          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;          int16_t *in = data->dctSpace, *coeff = data->dctSpace + 64;
736          int32_t bits;          int32_t sum, bits;
737          VECTOR * current;          VECTOR * current;
738          const uint8_t * ptr;          const uint8_t * ptr;
739          int cbp = 0;          int cbp;
740    
741          if ( (x > data->max_dx) || (x < data->min_dx)          if ( (x > data->max_dx) || (x < data->min_dx)
742                  || (y > data->max_dy) || (y < data->min_dy) ) return;                  || (y > data->max_dy) || (y < data->min_dy) ) return;
# Line 731  Line 750 
750          }          }
751    
752          transfer_8to16subro(in, data->Cur, ptr, data->iEdgedWidth);          transfer_8to16subro(in, data->Cur, ptr, data->iEdgedWidth);
753          bits = Block_CalcBits(coeff, in, data->iQuant, data->quant_type, &cbp, 5, 0);          fdct(in);
754          bits += d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);          if (data->lambda8 == 0) sum = quant_inter(coeff, in, data->lambda16);
755            else sum = quant4_inter(coeff, in, data->lambda16);
756            if (sum > 0) {
757                    bits = CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
758                    cbp = 1;
759            } else cbp = bits = 0;
760    
761            bits += sum = d_mv_bits(x, y, data->predMV, data->iFcode, data->qpel^data->qpel_precision, 0);
762    
763          if (bits < data->iMinSAD[0]) {          if (bits < data->iMinSAD[0]) {
764                  data->temp[0] = cbp;                  data->temp[0] = cbp;
# Line 942  Line 968 
968          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;          pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = sad;
969  }  }
970    
 static __inline void  
 ModeDecision(SearchData * const Data,  
                         MACROBLOCK * const pMB,  
                         const MACROBLOCK * const pMBs,  
                         const int x, const int y,  
                         const MBParam * const pParam,  
                         const uint32_t MotionFlags,  
                         const uint32_t VopFlags,  
                         const uint32_t VolFlags,  
                         const IMAGE * const pCurrent,  
                         const IMAGE * const pRef)  
 {  
         int mode = MODE_INTER;  
         int inter4v = (VopFlags & XVID_VOP_INTER4V) && (pMB->dquant == 0);  
         const uint32_t iQuant = pMB->quant;  
   
         const int skip_possible = (!(VolFlags & XVID_VOL_GMC)) && (pMB->dquant == 0);  
   
         if (!(VopFlags & XVID_VOP_MODEDECISION_BITS)) { //normal, fast, SAD-based mode decision  
                 int sad;  
                 int InterBias = MV16_INTER_BIAS;  
                 if (inter4v == 0 || Data->iMinSAD[0] < Data->iMinSAD[1] + Data->iMinSAD[2] +  
                         Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant) {  
                         mode = MODE_INTER;  
                         sad = Data->iMinSAD[0];  
                 } else {  
                         mode = MODE_INTER4V;  
                         sad = Data->iMinSAD[1] + Data->iMinSAD[2] +  
                                                 Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant;  
                         Data->iMinSAD[0] = sad;  
                 }  
   
                 /* final skip decision, a.k.a. "the vector you found, really that good?" */  
                 if (skip_possible && (pMB->sad16 < (int)iQuant * MAX_SAD00_FOR_SKIP))  
                         if ( (100*sad)/(pMB->sad16+1) > FINAL_SKIP_THRESH)  
                                 if (Data->chroma || SkipDecisionP(pCurrent, pRef, x, y, Data->iEdgedWidth/2, iQuant, Data->rrv)) {  
                                         mode = MODE_NOT_CODED;  
                                         sad = 0;  
                                 }  
   
                 /* intra decision */  
   
                 if (iQuant > 8) InterBias += 100 * (iQuant - 8); // to make high quants work  
                 if (y != 0)  
                         if ((pMB - pParam->mb_width)->mode == MODE_INTRA ) InterBias -= 80;  
                 if (x != 0)  
                         if ((pMB - 1)->mode == MODE_INTRA ) InterBias -= 80;  
   
                 if (Data->chroma) InterBias += 50; // dev8(chroma) ???  
                 if (Data->rrv) InterBias *= 4;  
   
                 if (InterBias < pMB->sad16) {  
                         int32_t deviation;  
                         if (!Data->rrv) deviation = dev16(Data->Cur, Data->iEdgedWidth);  
                         else deviation = dev16(Data->Cur, Data->iEdgedWidth) +  
                                 dev16(Data->Cur+16, Data->iEdgedWidth) +  
                                 dev16(Data->Cur + 16*Data->iEdgedWidth, Data->iEdgedWidth) +  
                                 dev16(Data->Cur+16+16*Data->iEdgedWidth, Data->iEdgedWidth);  
   
                         if (deviation < (sad - InterBias)) mode = MODE_INTRA;  
                 }  
   
         } else { // BITS  
   
                 int bits, intra, i;  
                 VECTOR backup[5], *v;  
                 Data->iQuant = iQuant;  
   
                 v = Data->qpel ? Data->currentQMV : Data->currentMV;  
                 for (i = 0; i < 5; i++) {  
                         Data->iMinSAD[i] = 256*4096;  
                         backup[i] = v[i];  
                 }  
   
                 bits = CountMBBitsInter(Data, pMBs, x, y, pParam, MotionFlags);  
                 if (bits == 0)  
                         mode = MODE_INTER; // quick stop  
                 else {  
                         if (inter4v) {  
                                 int bits_inter4v = CountMBBitsInter4v(Data, pMB, pMBs, x, y, pParam, MotionFlags, backup);  
                                 if (bits_inter4v < bits) { Data->iMinSAD[0] = bits = bits_inter4v; mode = MODE_INTER4V; }  
                         }  
   
                         intra = CountMBBitsIntra(Data);  
   
                         if (intra < bits) { *Data->iMinSAD = bits = intra; mode = MODE_INTRA; }  
                 }  
         }  
   
         if (Data->rrv) {  
                         Data->currentMV[0].x = RRV_MV_SCALEDOWN(Data->currentMV[0].x);  
                         Data->currentMV[0].y = RRV_MV_SCALEDOWN(Data->currentMV[0].y);  
         }  
   
         if (mode == MODE_INTER) {  
                 pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = Data->currentMV[0];  
                 pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = Data->iMinSAD[0];  
   
                 if(Data->qpel) {  
                         pMB->qmvs[0] = pMB->qmvs[1]  
                                 = pMB->qmvs[2] = pMB->qmvs[3] = Data->currentQMV[0];  
                         pMB->pmvs[0].x = Data->currentQMV[0].x - Data->predMV.x;  
                         pMB->pmvs[0].y = Data->currentQMV[0].y - Data->predMV.y;  
                 } else {  
                         pMB->pmvs[0].x = Data->currentMV[0].x - Data->predMV.x;  
                         pMB->pmvs[0].y = Data->currentMV[0].y - Data->predMV.y;  
                 }  
   
         } else if (mode == MODE_INTER4V)  
                 pMB->sad16 = Data->iMinSAD[0];  
         else // INTRA, NOT_CODED  
                 SkipMacroblockP(pMB, 0);  
   
         pMB->mode = mode;  
 }  
   
971  bool  bool
972  MotionEstimation(MBParam * const pParam,  MotionEstimation(MBParam * const pParam,
973                                   FRAMEINFO * const current,                                   FRAMEINFO * const current,
# Line 1074  Line 984 
984          uint32_t mb_width = pParam->mb_width;          uint32_t mb_width = pParam->mb_width;
985          uint32_t mb_height = pParam->mb_height;          uint32_t mb_height = pParam->mb_height;
986          const uint32_t iEdgedWidth = pParam->edged_width;          const uint32_t iEdgedWidth = pParam->edged_width;
987          const uint32_t MotionFlags = MakeGoodMotionFlags(current->motion_flags, current->vop_flags, current->vol_flags);          const uint32_t MotionFlags = MakeGoodMotionFlags(current->motion_flags, current->global_flags);
988    
989          uint32_t x, y;          uint32_t x, y;
990          uint32_t iIntra = 0;          uint32_t iIntra = 0;
991          int32_t quant = current->quant, sad00;          int32_t quant = current->quant, sad00;
992          int skip_thresh = \          int skip_thresh = INITIAL_SKIP_THRESH *
993                  INITIAL_SKIP_THRESH * \                  (current->global_flags & XVID_REDUCED ? 4:1) *
994                  (current->vop_flags & XVID_VOP_REDUCED ? 4:1) * \                  (current->global_flags & XVID_MODEDECISION_BITS ? 2:1);
                 (current->vop_flags & XVID_VOP_MODEDECISION_BITS ? 2:1);  
995    
996          // some pre-initialized thingies for SearchP          // some pre-initialized thingies for SearchP
997          int32_t temp[8];          int32_t temp[8];
# Line 1099  Line 1008 
1008          Data.temp = temp;          Data.temp = temp;
1009          Data.iFcode = current->fcode;          Data.iFcode = current->fcode;
1010          Data.rounding = pParam->m_rounding_type;          Data.rounding = pParam->m_rounding_type;
1011          Data.qpel = (current->vol_flags & XVID_VOL_QUARTERPEL ? 1:0);          Data.qpel = pParam->m_quarterpel;
1012          Data.chroma = MotionFlags & XVID_ME_CHROMA16;          Data.chroma = MotionFlags & PMV_CHROMA16;
1013          Data.rrv = (current->vop_flags & XVID_VOP_REDUCED ? 1:0);          Data.rrv = current->global_flags & XVID_REDUCED;
1014          Data.dctSpace = dct_space;          Data.dctSpace = dct_space;
         Data.quant_type = !(pParam->vol_flags & XVID_VOL_MPEGQUANT);  
1015    
1016          if ((current->vop_flags & XVID_VOP_REDUCED)) {          if ((current->global_flags & XVID_REDUCED)) {
1017                  mb_width = (pParam->width + 31) / 32;                  mb_width = (pParam->width + 31) / 32;
1018                  mb_height = (pParam->height + 31) / 32;                  mb_height = (pParam->height + 31) / 32;
1019                  Data.qpel = 0;                  Data.qpel = 0;
# Line 1138  Line 1046 
1046    
1047                          sad00 = pMB->sad16;                          sad00 = pMB->sad16;
1048    
1049                          if (pMB->dquant != 0) {                          if (!(current->global_flags & XVID_LUMIMASKING)) {
1050                                    pMB->dquant = NO_CHANGE;
1051                            } else {
1052                                    if (pMB->dquant != NO_CHANGE) {
1053                                  quant += DQtab[pMB->dquant];                                  quant += DQtab[pMB->dquant];
1054                                  if (quant > 31) quant = 31;                                  if (quant > 31) quant = 31;
1055                                  else if (quant < 1) quant = 1;                                  else if (quant < 1) quant = 1;
1056                          }                          }
1057                          pMB->quant = quant;                          }
1058                            pMB->quant = current->quant;
1059    
1060  //initial skip decision  //initial skip decision
1061  /* no early skip for GMC (global vector = skip vector is unknown!)  */  /* no early skip for GMC (global vector = skip vector is unknown!)  */
1062                          if (!(current->vol_flags & XVID_VOL_GMC))       { /* no fast SKIP for S(GMC)-VOPs */                          if (!(current->global_flags & XVID_GMC))        { /* no fast SKIP for S(GMC)-VOPs */
1063                                  if (pMB->dquant == 0 && sad00 < pMB->quant * skip_thresh)                                  if (pMB->dquant == NO_CHANGE && sad00 < pMB->quant * skip_thresh)
1064                                          if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, iEdgedWidth/2, pMB->quant, Data.rrv)) {                                          if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, iEdgedWidth/2, pMB->quant, Data.rrv)) {
1065                                                  SkipMacroblockP(pMB, sad00);                                                  SkipMacroblockP(pMB, sad00);
1066                                                  continue;                                                  continue;
# Line 1156  Line 1068 
1068                          }                          }
1069    
1070                          SearchP(pRef, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,                          SearchP(pRef, pRefH->y, pRefV->y, pRefHV->y, pCurrent, x,
1071                                          y, MotionFlags, current->vop_flags, current->vol_flags,                                                  y, MotionFlags, current->global_flags, pMB->quant,
1072                                          &Data, pParam, pMBs, reference->mbs, pMB);                                                  &Data, pParam, pMBs, reference->mbs,
1073                                                    current->global_flags & XVID_INTER4V, pMB);
                         ModeDecision(&Data, pMB, pMBs, x, y, pParam,  
                                                  MotionFlags, current->vop_flags, current->vol_flags,  
                                                  pCurrent, pRef);  
1074    
1075    /* final skip decision, a.k.a. "the vector you found, really that good?" */
1076                            if (!(current->global_flags & XVID_GMC || current->global_flags & XVID_MODEDECISION_BITS)) {
1077                                    if ( pMB->dquant == NO_CHANGE && sad00 < pMB->quant * MAX_SAD00_FOR_SKIP) {
1078                                            if ( (100*pMB->sad16)/(sad00+1) > FINAL_SKIP_THRESH * (Data.rrv ? 4:1) )
1079                                                    if (Data.chroma || SkipDecisionP(pCurrent, pRef, x, y, iEdgedWidth/2, pMB->quant, Data.rrv))
1080                                                            SkipMacroblockP(pMB, sad00);
1081                                    }
1082                            }
1083                          if (pMB->mode == MODE_INTRA)                          if (pMB->mode == MODE_INTRA)
1084                                  if (++iIntra > iLimit) return 1;                                  if (++iIntra > iLimit) return 1;
1085                  }                  }
1086          }          }
1087    
1088          if (current->vol_flags & XVID_VOL_GMC ) /* GMC only for S(GMC)-VOPs */          if (current->global_flags & XVID_GMC )  /* GMC only for S(GMC)-VOPs */
1089          {          {
1090                  current->warp = GlobalMotionEst( pMBs, pParam, current, reference, pRefH, pRefV, pRefHV);                  current->warp = GlobalMotionEst( pMBs, pParam, current, reference, pRefH, pRefV, pRefHV);
1091          }          }
# Line 1235  Line 1152 
1152          }          }
1153  }  }
1154    
1155    static int
1156    ModeDecision(const uint32_t iQuant, SearchData * const Data,
1157                    int inter4v,
1158                    MACROBLOCK * const pMB,
1159                    const MACROBLOCK * const pMBs,
1160                    const int x, const int y,
1161                    const MBParam * const pParam,
1162                    const uint32_t MotionFlags,
1163                    const uint32_t GlobalFlags)
1164    {
1165    
1166            int mode = MODE_INTER;
1167    
1168            if (!(GlobalFlags & XVID_MODEDECISION_BITS)) { //normal, fast, SAD-based mode decision
1169                    int sad;
1170                    int InterBias = MV16_INTER_BIAS;
1171                    if (inter4v == 0 || Data->iMinSAD[0] < Data->iMinSAD[1] + Data->iMinSAD[2] +
1172                            Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant) {
1173                            mode = MODE_INTER;
1174                            sad = Data->iMinSAD[0];
1175                    } else {
1176                            mode = MODE_INTER4V;
1177                            sad = Data->iMinSAD[1] + Data->iMinSAD[2] +
1178                                                    Data->iMinSAD[3] + Data->iMinSAD[4] + IMV16X16 * (int32_t)iQuant;
1179                            Data->iMinSAD[0] = sad;
1180                    }
1181    
1182                    /* intra decision */
1183    
1184                    if (iQuant > 8) InterBias += 100 * (iQuant - 8); // to make high quants work
1185                    if (y != 0)
1186                            if ((pMB - pParam->mb_width)->mode == MODE_INTRA ) InterBias -= 80;
1187                    if (x != 0)
1188                            if ((pMB - 1)->mode == MODE_INTRA ) InterBias -= 80;
1189    
1190                    if (Data->chroma) InterBias += 50; // to compensate bigger SAD
1191                    if (Data->rrv) InterBias *= 4;
1192    
1193                    if (InterBias < pMB->sad16) {
1194                            int32_t deviation;
1195                            if (!Data->rrv) deviation = dev16(Data->Cur, Data->iEdgedWidth);
1196                            else deviation = dev16(Data->Cur, Data->iEdgedWidth) +
1197                                    dev16(Data->Cur+8, Data->iEdgedWidth) +
1198                                    dev16(Data->Cur + 8*Data->iEdgedWidth, Data->iEdgedWidth) +
1199                                    dev16(Data->Cur+8+8*Data->iEdgedWidth, Data->iEdgedWidth);
1200    
1201                            if (deviation < (sad - InterBias)) return MODE_INTRA;
1202                    }
1203                    return mode;
1204    
1205            } else {
1206    
1207                    int bits, intra, i;
1208                    VECTOR backup[5], *v;
1209                    Data->lambda16 = iQuant;
1210                    Data->lambda8 = pParam->m_quant_type;
1211    
1212                    v = Data->qpel ? Data->currentQMV : Data->currentMV;
1213                    for (i = 0; i < 5; i++) {
1214                            Data->iMinSAD[i] = 256*4096;
1215                            backup[i] = v[i];
1216                    }
1217    
1218                    bits = CountMBBitsInter(Data, pMBs, x, y, pParam, MotionFlags);
1219                    if (bits == 0) return MODE_INTER; // quick stop
1220    
1221                    if (inter4v) {
1222                            int bits_inter4v = CountMBBitsInter4v(Data, pMB, pMBs, x, y, pParam, MotionFlags, backup);
1223                            if (bits_inter4v < bits) { Data->iMinSAD[0] = bits = bits_inter4v; mode = MODE_INTER4V; }
1224                    }
1225    
1226    
1227                    intra = CountMBBitsIntra(Data);
1228    
1229                    if (intra < bits) { *Data->iMinSAD = bits = intra; return MODE_INTRA; }
1230    
1231                    return mode;
1232            }
1233    }
1234    
1235  static void  static void
1236  SearchP(const IMAGE * const pRef,  SearchP(const IMAGE * const pRef,
1237                  const uint8_t * const pRefH,                  const uint8_t * const pRefH,
# Line 1244  Line 1241 
1241                  const int x,                  const int x,
1242                  const int y,                  const int y,
1243                  const uint32_t MotionFlags,                  const uint32_t MotionFlags,
1244                  const uint32_t VopFlags,                  const uint32_t GlobalFlags,
1245                  const uint32_t VolFlags,                  const uint32_t iQuant,
1246                  SearchData * const Data,                  SearchData * const Data,
1247                  const MBParam * const pParam,                  const MBParam * const pParam,
1248                  const MACROBLOCK * const pMBs,                  const MACROBLOCK * const pMBs,
1249                  const MACROBLOCK * const prevMBs,                  const MACROBLOCK * const prevMBs,
1250                    int inter4v,
1251                  MACROBLOCK * const pMB)                  MACROBLOCK * const pMB)
1252  {  {
1253    
1254          int i, iDirection = 255, mask, threshA;          int i, iDirection = 255, mask, threshA;
1255          VECTOR pmv[7];          VECTOR pmv[7];
         int inter4v = (VopFlags & XVID_VOP_INTER4V) && (pMB->dquant == 0);  
1256    
1257          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1258                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 0, Data->rrv);                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 0, Data->rrv);
# Line 1275  Line 1272 
1272          Data->RefP[4] = pRef->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;          Data->RefP[4] = pRef->u + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1273          Data->RefP[5] = pRef->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;          Data->RefP[5] = pRef->v + (x + y * (Data->iEdgedWidth/2)) * 8*i;
1274    
1275          Data->lambda16 = lambda_vec16[pMB->quant];          Data->lambda16 = lambda_vec16[iQuant];
1276          Data->lambda8 = lambda_vec8[pMB->quant];          Data->lambda8 = lambda_vec8[iQuant];
1277          Data->qpel_precision = 0;          Data->qpel_precision = 0;
1278    
1279            if (pMB->dquant != NO_CHANGE) inter4v = 0;
1280    
1281          memset(Data->currentMV, 0, 5*sizeof(VECTOR));          memset(Data->currentMV, 0, 5*sizeof(VECTOR));
1282    
1283          if (Data->qpel) Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x, y, 0);          if (Data->qpel) Data->predMV = get_qpmv2(pMBs, pParam->mb_width, 0, x, y, 0);
# Line 1291  Line 1290 
1290          Data->iMinSAD[3] = pMB->sad8[2];          Data->iMinSAD[3] = pMB->sad8[2];
1291          Data->iMinSAD[4] = pMB->sad8[3];          Data->iMinSAD[4] = pMB->sad8[3];
1292    
1293          if ((!(VopFlags & XVID_VOP_MODEDECISION_BITS)) || (x | y)) {          if ((!(GlobalFlags & XVID_MODEDECISION_BITS)) || (x | y)) {
1294                  threshA = Data->temp[0]; // that's where we keep this SAD atm                  threshA = Data->temp[0]; // that's where we keep this SAD atm
1295                  if (threshA < 512) threshA = 512;                  if (threshA < 512) threshA = 512;
1296                  else if (threshA > 1024) threshA = 1024;                  else if (threshA > 1024) threshA = 1024;
# Line 1316  Line 1315 
1315    
1316          if ((Data->iMinSAD[0] <= threshA) ||          if ((Data->iMinSAD[0] <= threshA) ||
1317                          (MVequal(Data->currentMV[0], (prevMBs+x+y*pParam->mb_width)->mvs[0]) &&                          (MVequal(Data->currentMV[0], (prevMBs+x+y*pParam->mb_width)->mvs[0]) &&
1318                          (Data->iMinSAD[0] < (prevMBs+x+y*pParam->mb_width)->sad16)))                          (Data->iMinSAD[0] < (prevMBs+x+y*pParam->mb_width)->sad16))) {
1319                  inter4v = 0;                  if (!(GlobalFlags & XVID_MODEDECISION_BITS)) inter4v = 0;       }
1320          else {          else {
1321    
1322                  MainSearchFunc * MainSearchPtr;                  MainSearchFunc * MainSearchPtr;
1323                  if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;                  if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1324                  else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;                  else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1325                          else MainSearchPtr = DiamondSearch;                          else MainSearchPtr = DiamondSearch;
1326    
1327                  MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, iDirection);                  MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, iDirection);
# Line 1331  Line 1330 
1330          note that this search is/might be done in halfpel positions,          note that this search is/might be done in halfpel positions,
1331          which makes it more different than the diamond above */          which makes it more different than the diamond above */
1332    
1333                  if (MotionFlags & XVID_ME_EXTSEARCH16) {                  if (MotionFlags & PMV_EXTSEARCH16) {
1334                          int32_t bSAD;                          int32_t bSAD;
1335                          VECTOR startMV = Data->predMV, backupMV = Data->currentMV[0];                          VECTOR startMV = Data->predMV, backupMV = Data->currentMV[0];
1336                          if (Data->rrv) {                          if (Data->rrv) {
# Line 1362  Line 1361 
1361                  }                  }
1362          }          }
1363    
1364          if (MotionFlags & XVID_ME_HALFPELREFINE16)          if (MotionFlags & PMV_HALFPELREFINE16)
1365                    if ((!(MotionFlags & HALFPELREFINE16_BITS)) || Data->iMinSAD[0] < 200*(int)iQuant)
1366                          SubpelRefine(Data);                          SubpelRefine(Data);
1367    
1368          for(i = 0; i < 5; i++) {          for(i = 0; i < 5; i++) {
# Line 1370  Line 1370 
1370                  Data->currentQMV[i].y = 2 * Data->currentMV[i].y;                  Data->currentQMV[i].y = 2 * Data->currentMV[i].y;
1371          }          }
1372    
1373          if (MotionFlags & XVID_ME_QUARTERPELREFINE16) {          if (MotionFlags & PMV_QUARTERPELREFINE16) {
1374    
1375                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
1376                                  pParam->width, pParam->height, Data->iFcode, 1, 0);                                  pParam->width, pParam->height, Data->iFcode, 1, 0);
1377    
1378                    if ((!(MotionFlags & QUARTERPELREFINE16_BITS)) || (Data->iMinSAD[0] < 200*(int)iQuant)) {
1379                  Data->qpel_precision = 1;                  Data->qpel_precision = 1;
1380                  SubpelRefine(Data);                  SubpelRefine(Data);
1381          }          }
1382            }
1383    
1384          if ((!(VopFlags & XVID_VOP_MODEDECISION_BITS)) && (Data->iMinSAD[0] < (int32_t)pMB->quant * 30))          if ((!(GlobalFlags & XVID_MODEDECISION_BITS)) && (Data->iMinSAD[0] < (int32_t)iQuant * 30)) inter4v = 0;
1385                  inter4v = 0;  
1386            if (inter4v && (!(GlobalFlags & XVID_MODEDECISION_BITS) ||
1387                            (!(MotionFlags & QUARTERPELREFINE8_BITS)) || (!(MotionFlags & HALFPELREFINE8_BITS)) ||
1388                            ((!(MotionFlags & EXTSEARCH_BITS)) && (!(MotionFlags&PMV_EXTSEARCH8)) ))) {
1389                    // if decision is BITS-based and all refinement steps will be done in BITS domain, there is no reason to call this loop
1390    
         if (inter4v) {  
1391                  SearchData Data8;                  SearchData Data8;
1392                  memcpy(&Data8, Data, sizeof(SearchData)); //quick copy of common data                  memcpy(&Data8, Data, sizeof(SearchData)); //quick copy of common data
1393    
# Line 1390  Line 1396 
1396                  Search8(Data, 2*x, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 2, &Data8);                  Search8(Data, 2*x, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 2, &Data8);
1397                  Search8(Data, 2*x + 1, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 3, &Data8);                  Search8(Data, 2*x + 1, 2*y + 1, MotionFlags, pParam, pMB, pMBs, 3, &Data8);
1398    
1399                  if ((Data->chroma) && (!(VopFlags & XVID_VOP_MODEDECISION_BITS))) {                  if ((Data->chroma) && (!(GlobalFlags & XVID_MODEDECISION_BITS))) {
1400                          // chroma is only used for comparsion to INTER. if the comparsion will be done in BITS domain, there is no reason to compute it                          // chroma is only used for comparsion to INTER. if the comparsion will be done in BITS domain, there is no reason to compute it
1401                          int sumx = 0, sumy = 0;                          int sumx = 0, sumy = 0;
1402                            const int div = 1 + Data->qpel;
1403                            const VECTOR * const mv = Data->qpel ? pMB->qmvs : pMB->mvs;
1404    
1405                          if (Data->qpel)                          for (i = 0; i < 4; i++) {
1406                                  for (i = 1; i < 5; i++) {                                  sumx += mv[i].x / div;
1407                                          sumx += Data->currentQMV[i].x/2;                                  sumy += mv[i].y / div;
                                         sumy += Data->currentQMV[i].y/2;  
                                 }  
                         else  
                                 for (i = 1; i < 5; i++) {  
                                         sumx += Data->currentMV[i].x;  
                                         sumy += Data->currentMV[i].y;  
1408                                  }                                  }
1409    
1410                          Data->iMinSAD[1] += ChromaSAD(  (sumx >> 3) + roundtab_76[sumx & 0xf],                          Data->iMinSAD[1] += ChromaSAD(  (sumx >> 3) + roundtab_76[sumx & 0xf],
1411                                                                                          (sumy >> 3) + roundtab_76[sumy & 0xf], Data);                                                                                          (sumy >> 3) + roundtab_76[sumy & 0xf], Data);
1412                  }                  }
1413          } else Data->iMinSAD[1] = 4096*256;          }
1414    
1415            inter4v = ModeDecision(iQuant, Data, inter4v, pMB, pMBs, x, y, pParam, MotionFlags, GlobalFlags);
1416    
1417            if (Data->rrv) {
1418                            Data->currentMV[0].x = RRV_MV_SCALEDOWN(Data->currentMV[0].x);
1419                            Data->currentMV[0].y = RRV_MV_SCALEDOWN(Data->currentMV[0].y);
1420            }
1421    
1422            if (inter4v == MODE_INTER) {
1423                    pMB->mode = MODE_INTER;
1424                    pMB->mvs[0] = pMB->mvs[1] = pMB->mvs[2] = pMB->mvs[3] = Data->currentMV[0];
1425                    pMB->sad16 = pMB->sad8[0] = pMB->sad8[1] = pMB->sad8[2] = pMB->sad8[3] = Data->iMinSAD[0];
1426    
1427                    if(Data->qpel) {
1428                            pMB->qmvs[0] = pMB->qmvs[1]
1429                                    = pMB->qmvs[2] = pMB->qmvs[3] = Data->currentQMV[0];
1430                            pMB->pmvs[0].x = Data->currentQMV[0].x - Data->predMV.x;
1431                            pMB->pmvs[0].y = Data->currentQMV[0].y - Data->predMV.y;
1432                    } else {
1433                            pMB->pmvs[0].x = Data->currentMV[0].x - Data->predMV.x;
1434                            pMB->pmvs[0].y = Data->currentMV[0].y - Data->predMV.y;
1435                    }
1436    
1437            } else if (inter4v == MODE_INTER4V) {
1438                    pMB->mode = MODE_INTER4V;
1439                    pMB->sad16 = Data->iMinSAD[0];
1440            } else { // INTRA mode
1441                    SkipMacroblockP(pMB, 0); // not skip, but similar enough
1442                    pMB->mode = MODE_INTRA;
1443            }
1444    
1445  }  }
1446    
1447  static void  static void
# Line 1438  Line 1471 
1471    
1472          *(Data->iMinSAD) += (Data->lambda8 * i * (*Data->iMinSAD + NEIGH_8X8_BIAS))>>10;          *(Data->iMinSAD) += (Data->lambda8 * i * (*Data->iMinSAD + NEIGH_8X8_BIAS))>>10;
1473    
1474          if (MotionFlags & (XVID_ME_EXTSEARCH8|XVID_ME_HALFPELREFINE8|XVID_ME_QUARTERPELREFINE8)) {          if (MotionFlags & (PMV_EXTSEARCH8|PMV_HALFPELREFINE8|PMV_QUARTERPELREFINE8)) {
1475    
1476                  if (Data->rrv) i = 16; else i = 8;                  if (Data->rrv) i = 16; else i = 8;
1477    
# Line 1456  Line 1489 
1489                  if (!Data->rrv) CheckCandidate = CheckCandidate8;                  if (!Data->rrv) CheckCandidate = CheckCandidate8;
1490                  else CheckCandidate = CheckCandidate16no4v;                  else CheckCandidate = CheckCandidate16no4v;
1491    
1492                  if (MotionFlags & XVID_ME_EXTSEARCH8 && (!(MotionFlags & XVID_ME_EXTSEARCH_BITS))) {                  if (MotionFlags & PMV_EXTSEARCH8 && (!(MotionFlags & EXTSEARCH_BITS))) {
1493                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD
1494    
1495                          MainSearchFunc *MainSearchPtr;                          MainSearchFunc *MainSearchPtr;
1496                          if (MotionFlags & XVID_ME_USESQUARES8) MainSearchPtr = SquareSearch;                          if (MotionFlags & PMV_USESQUARES8) MainSearchPtr = SquareSearch;
1497                                  else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;                                  else if (MotionFlags & PMV_ADVANCEDDIAMOND8) MainSearchPtr = AdvDiamondSearch;
1498                                          else MainSearchPtr = DiamondSearch;                                          else MainSearchPtr = DiamondSearch;
1499    
1500                          MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, 255);                          MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, 255);
# Line 1472  Line 1505 
1505                          }                          }
1506                  }                  }
1507    
1508                  if (MotionFlags & XVID_ME_HALFPELREFINE8) {                  if (MotionFlags & PMV_HALFPELREFINE8) {
1509                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD                          int32_t temp_sad = *(Data->iMinSAD); // store current MinSAD
1510    
1511                          SubpelRefine(Data); // perform halfpel refine of current best vector                          SubpelRefine(Data); // perform halfpel refine of current best vector
# Line 1483  Line 1516 
1516                          }                          }
1517                  }                  }
1518    
1519                  if (Data->qpel && MotionFlags & XVID_ME_QUARTERPELREFINE8) {                  if (Data->qpel && MotionFlags & PMV_QUARTERPELREFINE8) {
1520                                  Data->qpel_precision = 1;                                  Data->qpel_precision = 1;
1521                                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 8,                                  get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 8,
1522                                          pParam->width, pParam->height, Data->iFcode, 1, 0);                                          pParam->width, pParam->height, Data->iFcode, 1, 0);
# Line 1607  Line 1640 
1640                  CheckCandidate16no4v(pmv[i].x, pmv[i].y, mask, &iDirection, Data);                  CheckCandidate16no4v(pmv[i].x, pmv[i].y, mask, &iDirection, Data);
1641          }          }
1642    
1643          if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;          if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1644          else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;          else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1645                  else MainSearchPtr = DiamondSearch;                  else MainSearchPtr = DiamondSearch;
1646    
1647          MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, iDirection);          MainSearchPtr(Data->currentMV->x, Data->currentMV->y, Data, iDirection);
# Line 1791  Line 1824 
1824  //      DIRECT MODE DELTA VECTOR SEARCH.  //      DIRECT MODE DELTA VECTOR SEARCH.
1825  //      This has to be made more effective, but at the moment I'm happy it's running at all  //      This has to be made more effective, but at the moment I'm happy it's running at all
1826    
1827          if (MotionFlags & XVID_ME_USESQUARES16) MainSearchPtr = SquareSearch;          if (MotionFlags & PMV_USESQUARES16) MainSearchPtr = SquareSearch;
1828                  else if (MotionFlags & XVID_ME_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;                  else if (MotionFlags & PMV_ADVANCEDDIAMOND16) MainSearchPtr = AdvDiamondSearch;
1829                          else MainSearchPtr = DiamondSearch;                          else MainSearchPtr = DiamondSearch;
1830    
1831          MainSearchPtr(0, 0, Data, 255);          MainSearchPtr(0, 0, Data, 255);
# Line 2001  Line 2034 
2034          Data.currentMV = currentMV; Data.currentQMV = currentQMV;          Data.currentMV = currentMV; Data.currentQMV = currentQMV;
2035          Data.iMinSAD = &iMinSAD;          Data.iMinSAD = &iMinSAD;
2036          Data.lambda16 = lambda_vec16[frame->quant];          Data.lambda16 = lambda_vec16[frame->quant];
2037          Data.qpel = pParam->vol_flags & XVID_VOL_QUARTERPEL;          Data.qpel = pParam->m_quarterpel;
2038          Data.rounding = 0;          Data.rounding = 0;
2039          Data.chroma = frame->motion_flags & XVID_ME_CHROMA8;          Data.chroma = frame->motion_flags & PMV_CHROMA8;
2040          Data.temp = temp;          Data.temp = temp;
2041    
2042          Data.RefQ = f_refV->u; // a good place, also used in MC (for similar purpose)          Data.RefQ = f_refV->u; // a good place, also used in MC (for similar purpose)
# Line 2111  Line 2144 
2144  {  {
2145    
2146          int i, mask;          int i, mask;
         int quarterpel = (pParam->vol_flags & XVID_VOL_QUARTERPEL)? 1: 0;  
2147          VECTOR pmv[3];          VECTOR pmv[3];
2148          MACROBLOCK * const pMB = &pMBs[x + y * pParam->mb_width];          MACROBLOCK * const pMB = &pMBs[x + y * pParam->mb_width];
2149    
# Line 2127  Line 2159 
2159                          else Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0); //else median                          else Data->predMV = get_pmv2(pMBs, pParam->mb_width, 0, x, y, 0); //else median
2160    
2161          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
2162          pParam->width, pParam->height, Data->iFcode - quarterpel, 0, 0);                                  pParam->width, pParam->height, Data->iFcode - pParam->m_quarterpel, 0, 0);
2163    
2164          Data->Cur = pCur + (x + y * pParam->edged_width) * 16;          Data->Cur = pCur + (x + y * pParam->edged_width) * 16;
2165          Data->RefP[0] = pRef + (x + y * pParam->edged_width) * 16;          Data->RefP[0] = pRef + (x + y * pParam->edged_width) * 16;
# Line 2159  Line 2191 
2191          }          }
2192  }  }
2193    
2194  #define INTRA_THRESH    1800  #define INTRA_THRESH    2400
2195  #define INTER_THRESH    1200  #define INTER_THRESH    1300
2196    
2197  int  int
2198  MEanalysis(     const IMAGE * const pRef,  MEanalysis(     const IMAGE * const pRef,
# Line 2189  Line 2221 
2221          CheckCandidate = CheckCandidate32I;          CheckCandidate = CheckCandidate32I;
2222    
2223          if (intraCount != 0 && intraCount < 10) // we're right after an I frame          if (intraCount != 0 && intraCount < 10) // we're right after an I frame
2224                  IntraThresh += 15 * (intraCount - 10) * (intraCount - 10);                  IntraThresh += 8 * (intraCount - 10) * (intraCount - 10);
2225          else          else
2226                  if ( 5*(maxIntra - intraCount) < maxIntra) // we're close to maximum. 2 sec when max is 10 sec                  if ( 5*(maxIntra - intraCount) < maxIntra) // we're close to maximum. 2 sec when max is 10 sec
2227                          IntraThresh -= (IntraThresh * (maxIntra - 8*(maxIntra - intraCount)))/maxIntra;                          IntraThresh -= (IntraThresh * (maxIntra - 5*(maxIntra - intraCount)))/maxIntra;
2228    
2229          InterThresh -= (350 - 8*b_thresh) * bCount;          InterThresh -= (350 - 8*b_thresh) * bCount;
2230          if (InterThresh < 300 + 5*b_thresh) InterThresh = 300 + 5*b_thresh;          if (InterThresh < 300 + 5*b_thresh) InterThresh = 300 + 5*b_thresh;
# Line 2235  Line 2267 
2267          sSAD /= blocks;          sSAD /= blocks;
2268          s = (10*s) / blocks;          s = (10*s) / blocks;
2269    
2270          if (s > 4) sSAD += (s - 2) * (60 - 2*b_thresh); //static block - looks bad when in bframe...          if (s > 4) sSAD += (s - 3) * (300 - 2*b_thresh); //static block - looks bad when in bframe...
2271    
2272          if (sSAD > InterThresh ) return P_VOP;          if (sSAD > InterThresh ) return P_VOP;
2273          emms();          emms();
# Line 2289  Line 2321 
2321                  if (pMB->mode == MODE_INTRA || pMB->mode == MODE_NOT_CODED)                  if (pMB->mode == MODE_INTRA || pMB->mode == MODE_NOT_CODED)
2322                          continue;                          continue;
2323    
2324                  if ( ( (abs(mv.x -   (pMB-1)->mvs[0].x) < deltax) && (abs(mv.y -   (pMB-1)->mvs[0].y) < deltay) )                  if ( ( (ABS(mv.x -   (pMB-1)->mvs[0].x) < deltax) && (ABS(mv.y -   (pMB-1)->mvs[0].y) < deltay) )
2325                  &&   ( (abs(mv.x -   (pMB+1)->mvs[0].x) < deltax) && (abs(mv.y -   (pMB+1)->mvs[0].y) < deltay) )                  &&   ( (ABS(mv.x -   (pMB+1)->mvs[0].x) < deltax) && (ABS(mv.y -   (pMB+1)->mvs[0].y) < deltay) )
2326                  &&   ( (abs(mv.x - (pMB-MBw)->mvs[0].x) < deltax) && (abs(mv.y - (pMB-MBw)->mvs[0].y) < deltay) )                  &&   ( (ABS(mv.x - (pMB-MBw)->mvs[0].x) < deltax) && (ABS(mv.y - (pMB-MBw)->mvs[0].y) < deltay) )
2327                  &&   ( (abs(mv.x - (pMB+MBw)->mvs[0].x) < deltax) && (abs(mv.y - (pMB+MBw)->mvs[0].y) < deltay) ) )                  &&   ( (ABS(mv.x - (pMB+MBw)->mvs[0].x) < deltax) && (ABS(mv.y - (pMB+MBw)->mvs[0].y) < deltay) ) )
2328                          MBmask[mbnum]=1;                          MBmask[mbnum]=1;
2329          }          }
2330    
# Line 2367  Line 2399 
2399                                  continue;                                  continue;
2400    
2401                          oldnum++;                          oldnum++;
2402                          meanx += fabs(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - mv.x );                          meanx += ABS(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - mv.x );
2403                          meany += fabs(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - mv.y );                          meany += ABS(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - mv.y );
2404                  }                  }
2405    
2406          if (4*meanx > oldnum)   /* better fit than 0.25 is useless */          if (4*meanx > oldnum)   /* better fit than 0.25 is useless */
# Line 2395  Line 2427 
2427                          if (!MBmask[mbnum])                          if (!MBmask[mbnum])
2428                                  continue;                                  continue;
2429    
2430                          if  ( ( fabs(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - mv.x ) > meanx )                          if  ( ( ABS(( sol[0] + (16*mx+8)*sol[1] + (16*my+8)*sol[2] ) - mv.x ) > meanx )
2431                                  || ( fabs(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - mv.y ) > meany ) )                                  || ( ABS(( sol[3] - (16*mx+8)*sol[2] + (16*my+8)*sol[1] ) - mv.y ) > meany ) )
2432                                  MBmask[mbnum]=0;                                  MBmask[mbnum]=0;
2433                          else                          else
2434                                  num++;                                  num++;
# Line 2450  Line 2482 
2482                  if (Data->temp[0] == 0 && Data->temp[1] == 0 && Data->temp[2] == 0 && Data->temp[3] == 0)                  if (Data->temp[0] == 0 && Data->temp[1] == 0 && Data->temp[2] == 0 && Data->temp[3] == 0)
2483                          return 0; //quick stop                          return 0; //quick stop
2484    
2485                  if (MotionFlags & (XVID_ME_HALFPELREFINE16_BITS | XVID_ME_EXTSEARCH_BITS)) { //we have to prepare for halfpixel-precision search                  if (MotionFlags & (HALFPELREFINE16_BITS | EXTSEARCH_BITS)) { //we have to prepare for halfpixel-precision search
2486                          for(i = 0; i < 5; i++) bsad[i] = Data->iMinSAD[i];                          for(i = 0; i < 5; i++) bsad[i] = Data->iMinSAD[i];
2487                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
2488                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 0, Data->rrv);                                                  pParam->width, pParam->height, Data->iFcode - Data->qpel, 0, Data->rrv);
# Line 2468  Line 2500 
2500                  }                  }
2501          }          }
2502    
2503          if (MotionFlags&XVID_ME_EXTSEARCH_BITS) SquareSearch(Data->currentMV->x, Data->currentMV->y, Data, iDirection);          if (MotionFlags&EXTSEARCH_BITS) SquareSearch(Data->currentMV->x, Data->currentMV->y, Data, iDirection);
2504    
2505          if (MotionFlags&XVID_ME_HALFPELREFINE16_BITS) SubpelRefine(Data);          if (MotionFlags&HALFPELREFINE16_BITS) SubpelRefine(Data);
2506    
2507          if (Data->qpel) {          if (Data->qpel) {
2508                  if (MotionFlags&(XVID_ME_EXTSEARCH_BITS | XVID_ME_HALFPELREFINE16_BITS)) { // there was halfpel-precision search                  if (MotionFlags&(EXTSEARCH_BITS | HALFPELREFINE16_BITS)) { // there was halfpel-precision search
2509                          for(i = 0; i < 5; i++) if (bsad[i] > Data->iMinSAD[i]) {                          for(i = 0; i < 5; i++) if (bsad[i] > Data->iMinSAD[i]) {
2510                                  Data->currentQMV[i].x = 2 * Data->currentMV[i].x; // we have found a better match                                  Data->currentQMV[i].x = 2 * Data->currentMV[i].x; // we have found a better match
2511                                  Data->currentQMV[i].y = 2 * Data->currentMV[i].y;                                  Data->currentQMV[i].y = 2 * Data->currentMV[i].y;
# Line 2484  Line 2516 
2516                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,                          get_range(&Data->min_dx, &Data->max_dx, &Data->min_dy, &Data->max_dy, x, y, 16,
2517                                          pParam->width, pParam->height, Data->iFcode, 1, 0);                                          pParam->width, pParam->height, Data->iFcode, 1, 0);
2518                  }                  }
2519                  if (MotionFlags&XVID_ME_QUARTERPELREFINE16_BITS) SubpelRefine(Data);                  if (MotionFlags&QUARTERPELREFINE16_BITS) SubpelRefine(Data);
2520          }          }
2521    
2522          if (MotionFlags&XVID_ME_CHECKPREDICTION_BITS) { //let's check vector equal to prediction          if (MotionFlags&CHECKPREDICTION_BITS) { //let's check vector equal to prediction
2523                  VECTOR * v = Data->qpel ? Data->currentQMV : Data->currentMV;                  VECTOR * v = Data->qpel ? Data->currentQMV : Data->currentMV;
2524                  if (!(Data->predMV.x == v->x && Data->predMV.y == v->y))                  if (!(Data->predMV.x == v->x && Data->predMV.y == v->y))
2525                          CheckCandidateBits16(Data->predMV.x, Data->predMV.y, 255, &iDirection, Data);                          CheckCandidateBits16(Data->predMV.x, Data->predMV.y, 255, &iDirection, Data);
# Line 2508  Line 2540 
2540          SearchData Data2, *Data8 = &Data2;          SearchData Data2, *Data8 = &Data2;
2541          int sumx = 0, sumy = 0;          int sumx = 0, sumy = 0;
2542          int16_t *in = Data->dctSpace, *coeff = Data->dctSpace + 64;          int16_t *in = Data->dctSpace, *coeff = Data->dctSpace + 64;
         uint8_t * ptr;  
2543    
2544          memcpy(Data8, Data, sizeof(SearchData));          memcpy(Data8, Data, sizeof(SearchData));
2545          CheckCandidate = CheckCandidateBits8;          CheckCandidate = CheckCandidateBits8;
2546    
2547          for (i = 0; i < 4; i++) { //for all luma blocks          for (i = 0; i < 4; i++) {
   
2548                  Data8->iMinSAD = Data->iMinSAD + i + 1;                  Data8->iMinSAD = Data->iMinSAD + i + 1;
2549                  Data8->currentMV = Data->currentMV + i + 1;                  Data8->currentMV = Data->currentMV + i + 1;
2550                  Data8->currentQMV = Data->currentQMV + i + 1;                  Data8->currentQMV = Data->currentQMV + i + 1;
# Line 2541  Line 2571 
2571    
2572                  Data8->qpel_precision = Data8->qpel;                  Data8->qpel_precision = Data8->qpel;
2573                  // checking the vector which has been found by SAD-based 8x8 search (if it's different than the one found so far)                  // checking the vector which has been found by SAD-based 8x8 search (if it's different than the one found so far)
2574                  {                  if (Data8->qpel) {
2575                          VECTOR *v = Data8->qpel ? Data8->currentQMV : Data8->currentMV;                          if (!(Data8->currentQMV->x == backup[i+1].x && Data8->currentQMV->y == backup[i+1].y))
2576                          if (!MVequal (*v, backup[i+1]) )                                  CheckCandidateBits8(backup[i+1].x, backup[i+1].y, 255, &iDirection, Data8);
2577                    } else {
2578                            if (!(Data8->currentMV->x == backup[i+1].x && Data8->currentMV->y == backup[i+1].y))
2579                                  CheckCandidateBits8(backup[i+1].x, backup[i+1].y, 255, &iDirection, Data8);                                  CheckCandidateBits8(backup[i+1].x, backup[i+1].y, 255, &iDirection, Data8);
2580                  }                  }
2581    
2582                  if (Data8->qpel) {                  if (Data8->qpel) {
2583                          if (MotionFlags&XVID_ME_HALFPELREFINE8_BITS || (MotionFlags&XVID_ME_EXTSEARCH8 && MotionFlags&XVID_ME_EXTSEARCH_BITS)) { // halfpixel motion search follows                          if (MotionFlags&HALFPELREFINE8_BITS || (MotionFlags&PMV_EXTSEARCH8 && MotionFlags&EXTSEARCH_BITS)) { // halfpixel motion search follows
2584                                  int32_t s = *Data8->iMinSAD;                                  int32_t s = *Data8->iMinSAD;
2585                                  Data8->currentMV->x = Data8->currentQMV->x/2;                                  Data8->currentMV->x = Data8->currentQMV->x/2;
2586                                  Data8->currentMV->y = Data8->currentQMV->y/2;                                  Data8->currentMV->y = Data8->currentQMV->y/2;
# Line 2559  Line 2591 
2591                                  if (Data8->currentQMV->x & 1 || Data8->currentQMV->y & 1)                                  if (Data8->currentQMV->x & 1 || Data8->currentQMV->y & 1)
2592                                          CheckCandidateBits8(Data8->currentMV->x, Data8->currentMV->y, 255, &iDirection, Data8);                                          CheckCandidateBits8(Data8->currentMV->x, Data8->currentMV->y, 255, &iDirection, Data8);
2593    
2594                                  if (MotionFlags & XVID_ME_EXTSEARCH8 && MotionFlags & XVID_ME_EXTSEARCH_BITS)                                  if (MotionFlags & PMV_EXTSEARCH8 && MotionFlags & EXTSEARCH_BITS)
2595                                          SquareSearch(Data8->currentMV->x, Data8->currentMV->x, Data8, 255);                                          SquareSearch(Data8->currentMV->x, Data8->currentMV->x, Data8, 255);
2596    
2597                                  if (MotionFlags & XVID_ME_HALFPELREFINE8_BITS)                                  if (MotionFlags & HALFPELREFINE8_BITS) SubpelRefine(Data8);
                                         SubpelRefine(Data8);  
2598    
2599                                  if(s > *Data8->iMinSAD) { //we have found a better match                                  if(s > *Data8->iMinSAD) { //we have found a better match
2600                                          Data8->currentQMV->x = 2*Data8->currentMV->x;                                          Data8->currentQMV->x = 2*Data8->currentMV->x;
# Line 2575  Line 2606 
2606                                                          pParam->width, pParam->height, Data8->iFcode, 1, 0);                                                          pParam->width, pParam->height, Data8->iFcode, 1, 0);
2607    
2608                          }                          }
2609                          if (MotionFlags & XVID_ME_QUARTERPELREFINE8_BITS) SubpelRefine(Data8);                          if (MotionFlags & QUARTERPELREFINE8_BITS) SubpelRefine(Data8);
   
                 } else { // not qpel  
   
                         if (MotionFlags & XVID_ME_EXTSEARCH8 && MotionFlags & XVID_ME_EXTSEARCH_BITS) //extsearch  
                                 SquareSearch(Data8->currentMV->x, Data8->currentMV->x, Data8, 255);  
2610    
2611                          if (MotionFlags & XVID_ME_HALFPELREFINE8_BITS)                  } else // not qpel
2612                                  SubpelRefine(Data8); //halfpel refinement                          if (MotionFlags & HALFPELREFINE8_BITS) SubpelRefine(Data8); //halfpel mode, halfpel refinement
                 }  
2613    
2614                  //checking vector equal to predicion                  //checking vector equal to predicion
2615                  if (i != 0 && MotionFlags & XVID_ME_CHECKPREDICTION_BITS) {                  if (i != 0 && MotionFlags & CHECKPREDICTION_BITS) {
2616                          const VECTOR * v = Data->qpel ? Data8->currentQMV : Data8->currentMV;                          const VECTOR * v = Data->qpel ? Data8->currentQMV : Data8->currentMV;
2617                          if (!MVequal(*v, Data8->predMV))                          if (!(Data8->predMV.x == v->x && Data8->predMV.y == v->y))
2618                                  CheckCandidateBits8(Data8->predMV.x, Data8->predMV.y, 255, &iDirection, Data8);                                  CheckCandidateBits8(Data8->predMV.x, Data8->predMV.y, 255, &iDirection, Data8);
2619                  }                  }
2620    
2621                  bits += *Data8->iMinSAD;                  bits += *Data8->iMinSAD;
2622                  if (bits >= Data->iMinSAD[0]) return bits; // no chances for INTER4V                  if (bits >= Data->iMinSAD[0]) break; // no chances for INTER4V
2623    
2624                  // MB structures for INTER4V mode; we have to set them here, we don't have predictor anywhere else                  // MB structures for INTER4V mode; we have to set them here, we don't have predictor anywhere else
2625                  if(Data->qpel) {                  if(Data->qpel) {
# Line 2612  Line 2637 
2637                  pMB->mvs[i] = *Data8->currentMV;                  pMB->mvs[i] = *Data8->currentMV;
2638                  pMB->sad8[i] = 4 * *Data8->iMinSAD;                  pMB->sad8[i] = 4 * *Data8->iMinSAD;
2639                  if (Data8->temp[0]) cbp |= 1 << (5 - i);                  if (Data8->temp[0]) cbp |= 1 << (5 - i);
2640            }
2641    
2642          } // /for all luma blocks          if (bits < *Data->iMinSAD) { // there is still a chance for inter4v mode. let's check chroma
2643                    const uint8_t * ptr;
         bits += xvid_cbpy_tab[15-(cbp>>2)].len;  
   
         // let's check chroma  
2644          sumx = (sumx >> 3) + roundtab_76[sumx & 0xf];          sumx = (sumx >> 3) + roundtab_76[sumx & 0xf];
2645          sumy = (sumy >> 3) + roundtab_76[sumy & 0xf];          sumy = (sumy >> 3) + roundtab_76[sumy & 0xf];
2646    
2647          //chroma U          //chroma U
2648          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[4], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[4], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);
2649          transfer_8to16subro(in, Data->CurU, ptr, Data->iEdgedWidth/2);          transfer_8to16subro(in, Data->CurU, ptr, Data->iEdgedWidth/2);
2650          bits += Block_CalcBits(coeff, in, Data->iQuant, Data->quant_type, &cbp, 4, 0);                  fdct(in);
2651                    if (Data->lambda8 == 0) i = quant_inter(coeff, in, Data->lambda16);
2652          if (bits >= *Data->iMinSAD) return bits;                  else i = quant4_inter(coeff, in, Data->lambda16);
2653                    if (i > 0) {
2654                            bits += CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
2655                            cbp |= 1 << (5 - 4);
2656                    }
2657    
2658                    if (bits < *Data->iMinSAD) { // still possible
2659          //chroma V          //chroma V
2660          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[5], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);          ptr = interpolate8x8_switch2(Data->RefQ + 64, Data->RefP[5], 0, 0, sumx, sumy, Data->iEdgedWidth/2, Data->rounding);
2661          transfer_8to16subro(in, Data->CurV, ptr, Data->iEdgedWidth/2);          transfer_8to16subro(in, Data->CurV, ptr, Data->iEdgedWidth/2);
2662          bits += Block_CalcBits(coeff, in, Data->iQuant, Data->quant_type, &cbp, 5, 0);                          fdct(in);
2663                            if (Data->lambda8 == 0) i = quant_inter(coeff, in, Data->lambda16);
2664                            else i = quant4_inter(coeff, in, Data->lambda16);
2665                            if (i > 0) {
2666                                    bits += CodeCoeffInter_CalcBits(coeff, scan_tables[0]);
2667                                    cbp |= 1 << (5 - 5);
2668                            }
2669                            bits += xvid_cbpy_tab[15-(cbp>>2)].len;
2670          bits += mcbpc_inter_tab[(MODE_INTER4V & 7) | ((cbp & 3) << 3)].len;          bits += mcbpc_inter_tab[(MODE_INTER4V & 7) | ((cbp & 3) << 3)].len;
2671                    }
2672            }
2673    
2674          return bits;          return bits;
2675  }  }
# Line 2644  Line 2680 
2680  {  {
2681          int bits = 1; //this one is ac/dc prediction flag. always 1.          int bits = 1; //this one is ac/dc prediction flag. always 1.
2682          int cbp = 0, i, t, dc = 1024, b_dc;          int cbp = 0, i, t, dc = 1024, b_dc;
2683            const uint32_t iQuant = Data->lambda16;
2684          int16_t *in = Data->dctSpace, * coeff = Data->dctSpace + 64;          int16_t *in = Data->dctSpace, * coeff = Data->dctSpace + 64;
2685          uint32_t iDcScaler = get_dc_scaler(Data->iQuant, 1);          uint32_t iDcScaler = get_dc_scaler(iQuant, 1);;
2686    
2687          for(i = 0; i < 4; i++) {          for(i = 0; i < 4; i++) {
2688                  int s = 8*((i&1) + (i>>1)*Data->iEdgedWidth);                  int s = 8*((i&1) + (i>>1)*Data->iEdgedWidth);
# Line 2654  Line 2691 
2691                  b_dc = in[0];                  b_dc = in[0];
2692                  in[0] -= dc;                  in[0] -= dc;
2693                  dc = b_dc;                  dc = b_dc;
2694                  if (Data->quant_type == 0) quant_intra(coeff, in, Data->iQuant, iDcScaler);                  if (Data->lambda8 == 0) quant_intra(coeff, in, iQuant, iDcScaler);
2695                  else quant4_intra(coeff, in, Data->iQuant, iDcScaler);                  else quant4_intra(coeff, in, iQuant, iDcScaler);
2696    
2697                  bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcy_tab[coeff[0] + 255].len;                  bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcy_tab[coeff[0] + 255].len;;
2698                  Data->temp[i] = t;                  Data->temp[i] = t;
2699                  if (t != 0)  cbp |= 1 << (5 - i);                  if (t != 0)  cbp |= 1 << (5 - i);
2700                  if (bits >= Data->iMinSAD[0]) return bits;                  if (bits >= Data->iMinSAD[0]) break;
2701          }          }
2702    
2703          bits += xvid_cbpy_tab[cbp>>2].len;          if (bits < Data->iMinSAD[0]) { // INTRA still looks good, let's add chroma
2704                    iDcScaler = get_dc_scaler(iQuant, 0);
         iDcScaler = get_dc_scaler(Data->iQuant, 0);  
   
2705          //chroma U          //chroma U
2706          transfer_8to16copy(in, Data->CurU, Data->iEdgedWidth/2);          transfer_8to16copy(in, Data->CurU, Data->iEdgedWidth/2);
2707          fdct(in);          fdct(in);
2708          in[0] -= 1024;          in[0] -= 1024;
2709          if (Data->quant_type == 0) quant_intra(coeff, in, Data->iQuant, iDcScaler);                  if (Data->lambda8 == 0) quant_intra(coeff, in, iQuant, iDcScaler);
2710          else quant4_intra(coeff, in, Data->iQuant, iDcScaler);                  else quant4_intra(coeff, in, iQuant, iDcScaler);
2711    
2712          bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcc_tab[coeff[0] + 255].len;          bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcc_tab[coeff[0] + 255].len;
2713          if (t != 0) cbp |= 1 << (5 - 4);          if (t != 0) cbp |= 1 << (5 - 4);
2714    
2715          if (bits >= Data->iMinSAD[0]) return bits;                  if (bits < Data->iMinSAD[0]) {
   
2716          //chroma V          //chroma V
2717          transfer_8to16copy(in, Data->CurV, Data->iEdgedWidth/2);          transfer_8to16copy(in, Data->CurV, Data->iEdgedWidth/2);
2718          fdct(in);          fdct(in);
2719          in[0] -= 1024;          in[0] -= 1024;
2720          if (Data->quant_type == 0) quant_intra(coeff, in, Data->iQuant, iDcScaler);                          if (Data->lambda8 == 0) quant_intra(coeff, in, iQuant, iDcScaler);
2721          else quant4_intra(coeff, in, Data->iQuant, iDcScaler);                          else quant4_intra(coeff, in, iQuant, iDcScaler);
2722    
2723          bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcc_tab[coeff[0] + 255].len;          bits += t = CodeCoeffIntra_CalcBits(coeff, scan_tables[0]) + dcc_tab[coeff[0] + 255].len;
2724          if (t != 0) cbp |= 1 << (5 - 5);          if (t != 0) cbp |= 1 << (5 - 5);
2725    
2726                            bits += xvid_cbpy_tab[cbp>>2].len;
2727          bits += mcbpc_inter_tab[(MODE_INTRA & 7) | ((cbp & 3) << 3)].len;          bits += mcbpc_inter_tab[(MODE_INTRA & 7) | ((cbp & 3) << 3)].len;
2728                    }
2729            }
2730          return bits;          return bits;
2731  }  }

Legend:
Removed from v.1.58.2.14  
changed lines
  Added in v.1.64

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4