[cvs] / xvidcore / src / utils / mbtransquant.c Repository:
ViewVC logotype

Diff of /xvidcore/src/utils/mbtransquant.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.7, Wed Jun 12 20:38:41 2002 UTC revision 1.22, Sat Mar 22 14:04:48 2003 UTC
# Line 42  Line 42 
42    *                                                                            *    *                                                                            *
43    *  Revision history:                                                         *    *  Revision history:                                                         *
44    *                                                                            *    *                                                                            *
45    *  29.03.2002 interlacing speedup - used transfer strides instead of    *  29.03.2002 interlacing speedup - used transfer strides instead of             *
46    *             manual field-to-frame conversion    *             manual field-to-frame conversion                                                           *
47    *  26.03.2002 interlacing support - moved transfers outside loops    *  26.03.2002 interlacing support - moved transfers outside loops                        *
48    *  22.12.2001 get_dc_scaler() moved to common.h    *  22.12.2001 get_dc_scaler() moved to common.h                                                          *
49    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *
50    *  17.11.2001 initial version                                                *    *  17.11.2001 initial version                                                *
51    *                                                                            *    *                                                                            *
# Line 65  Line 65 
65  #include "../quant/quant_h263.h"  #include "../quant/quant_h263.h"
66  #include "../encoder.h"  #include "../encoder.h"
67    
68  #define MIN(X, Y) ((X)<(Y)?(X):(Y))  #include "../image/reduced.h"
69  #define MAX(X, Y) ((X)>(Y)?(X):(Y))  
70    MBFIELDTEST_PTR MBFieldTest;
71    
72  #define TOOSMALL_LIMIT 1                /* skip blocks having a coefficient sum below this value */  #define TOOSMALL_LIMIT 1                /* skip blocks having a coefficient sum below this value */
73    
74  /* this isnt pretty, but its better than 20 ifdefs */  static __inline void
75    MBfDCT(int16_t data[6 * 64])
76    {
77            start_timer();
78            fdct(&data[0 * 64]);
79            fdct(&data[1 * 64]);
80            fdct(&data[2 * 64]);
81            fdct(&data[3 * 64]);
82            fdct(&data[4 * 64]);
83            fdct(&data[5 * 64]);
84            stop_dct_timer();
85    }
86    
87    
88    static __inline uint32_t
89    QuantizeInterBlock(     int16_t qcoeff[64],
90                                            const int16_t data[64],
91                                            const uint32_t iQuant,
92                                            const uint32_t quant_type)
93    {
94            uint32_t sum;
95    
96            start_timer();
97            if (quant_type == H263_QUANT)
98                    sum = quant_inter(qcoeff, data, iQuant);
99            else
100                    sum = quant4_inter(qcoeff, data, iQuant);
101    
102            stop_quant_timer();
103            return sum;
104    }
105    
106  void  void
107  MBTransQuantIntra(const MBParam * pParam,  MBTransQuantIntra(const MBParam * const pParam,
108                                    FRAMEINFO * frame,                                  FRAMEINFO * const frame,
109                                    MACROBLOCK * pMB,                                  MACROBLOCK * const pMB,
110                                    const uint32_t x_pos,                                    const uint32_t x_pos,
111                                    const uint32_t y_pos,                                    const uint32_t y_pos,
112                                    int16_t data[6 * 64],                                    int16_t data[6 * 64],
# Line 83  Line 114 
114  {  {
115    
116          uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
117          uint32_t stride2 = stride / 2;          const uint32_t stride2 = stride / 2;
118          uint32_t next_block = stride * 8;          uint32_t next_block = stride * ((frame->global_flags & XVID_REDUCED)?16:8);
119          uint32_t i;          int i;
120          uint32_t iQuant = frame->quant;          const uint32_t iQuant = pMB->quant;
121          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
122          IMAGE *pCurrent = &frame->image;          const IMAGE * const pCurrent = &frame->image;
123    
124            start_timer();
125            if ((frame->global_flags & XVID_REDUCED))
126            {
127                    pY_Cur = pCurrent->y + (y_pos << 5) * stride + (x_pos << 5);
128                    pU_Cur = pCurrent->u + (y_pos << 4) * stride2 + (x_pos << 4);
129                    pV_Cur = pCurrent->v + (y_pos << 4) * stride2 + (x_pos << 4);
130    
131                    filter_18x18_to_8x8(&data[0 * 64], pY_Cur, stride);
132                    filter_18x18_to_8x8(&data[1 * 64], pY_Cur + 16, stride);
133                    filter_18x18_to_8x8(&data[2 * 64], pY_Cur + next_block, stride);
134                    filter_18x18_to_8x8(&data[3 * 64], pY_Cur + next_block + 16, stride);
135                    filter_18x18_to_8x8(&data[4 * 64], pU_Cur, stride2);
136                    filter_18x18_to_8x8(&data[5 * 64], pV_Cur, stride2);
137            } else {
138          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
139          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
140          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
141    
         start_timer();  
142          transfer_8to16copy(&data[0 * 64], pY_Cur, stride);          transfer_8to16copy(&data[0 * 64], pY_Cur, stride);
143          transfer_8to16copy(&data[1 * 64], pY_Cur + 8, stride);          transfer_8to16copy(&data[1 * 64], pY_Cur + 8, stride);
144          transfer_8to16copy(&data[2 * 64], pY_Cur + next_block, stride);          transfer_8to16copy(&data[2 * 64], pY_Cur + next_block, stride);
145          transfer_8to16copy(&data[3 * 64], pY_Cur + next_block + 8, stride);          transfer_8to16copy(&data[3 * 64], pY_Cur + next_block + 8, stride);
146          transfer_8to16copy(&data[4 * 64], pU_Cur, stride2);          transfer_8to16copy(&data[4 * 64], pU_Cur, stride2);
147          transfer_8to16copy(&data[5 * 64], pV_Cur, stride2);          transfer_8to16copy(&data[5 * 64], pV_Cur, stride2);
148            }
149          stop_transfer_timer();          stop_transfer_timer();
150    
151            /* XXX: rrv+interlacing is buggy */
152          start_timer();          start_timer();
153          pMB->field_dct = 0;          pMB->field_dct = 0;
154          if ((frame->global_flags & XVID_INTERLACING)) {          if ((frame->global_flags & XVID_INTERLACING) &&
155                    (x_pos>0) && (x_pos<pParam->mb_width-1) &&
156                    (y_pos>0) && (y_pos<pParam->mb_height-1)) {
157                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
158          }          }
159          stop_interlacing_timer();          stop_interlacing_timer();
160    
161          for (i = 0; i < 6; i++) {          MBfDCT(data);
                 uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);  
162    
163                  start_timer();          for (i = 0; i < 6; i++) {
164                  fdct(&data[i * 64]);                  const uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
                 stop_dct_timer();  
165    
                 if (pParam->m_quant_type == H263_QUANT) {  
166                          start_timer();                          start_timer();
167                    if (pParam->m_quant_type == H263_QUANT)
168                          quant_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);                          quant_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
169                          stop_quant_timer();                  else
   
                         start_timer();  
                         dequant_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);  
                         stop_iquant_timer();  
                 } else {  
                         start_timer();  
170                          quant4_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);                          quant4_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
171                          stop_quant_timer();                          stop_quant_timer();
172    
173                    /* speedup: dont decode when encoding only ivops */
174                    if (pParam->iMaxKeyInterval != 1 || pParam->max_bframes > 0)
175                    {
176                          start_timer();                          start_timer();
177                            if (pParam->m_quant_type == H263_QUANT)
178                                    dequant_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
179                            else
180                          dequant4_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);                          dequant4_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
181                          stop_iquant_timer();                          stop_iquant_timer();
                 }  
182    
183                  start_timer();                  start_timer();
184                  idct(&data[i * 64]);                  idct(&data[i * 64]);
185                  stop_idct_timer();                  stop_idct_timer();
186          }          }
187            }
188    
189            /* speedup: dont decode when encoding only ivops */
190            if (pParam->iMaxKeyInterval != 1 || pParam->max_bframes > 0)
191            {
192    
193          if (pMB->field_dct) {          if (pMB->field_dct) {
194                  next_block = stride;                  next_block = stride;
# Line 146  Line 196 
196          }          }
197    
198          start_timer();          start_timer();
199                    if ((frame->global_flags & XVID_REDUCED)) {
200                            copy_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
201                            copy_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
202                            copy_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
203                            copy_upsampled_8x8_16to8(pY_Cur + next_block + 16, &data[3 * 64], stride);
204                            copy_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
205                            copy_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
206                    } else {
207          transfer_16to8copy(pY_Cur, &data[0 * 64], stride);          transfer_16to8copy(pY_Cur, &data[0 * 64], stride);
208          transfer_16to8copy(pY_Cur + 8, &data[1 * 64], stride);          transfer_16to8copy(pY_Cur + 8, &data[1 * 64], stride);
209          transfer_16to8copy(pY_Cur + next_block, &data[2 * 64], stride);          transfer_16to8copy(pY_Cur + next_block, &data[2 * 64], stride);
210          transfer_16to8copy(pY_Cur + next_block + 8, &data[3 * 64], stride);          transfer_16to8copy(pY_Cur + next_block + 8, &data[3 * 64], stride);
211          transfer_16to8copy(pU_Cur, &data[4 * 64], stride2);          transfer_16to8copy(pU_Cur, &data[4 * 64], stride2);
212          transfer_16to8copy(pV_Cur, &data[5 * 64], stride2);          transfer_16to8copy(pV_Cur, &data[5 * 64], stride2);
213                    }
214          stop_transfer_timer();          stop_transfer_timer();
   
215  }  }
216    
217    }
218    
219  uint8_t  uint8_t
220  MBTransQuantInter(const MBParam * pParam,  MBTransQuantInter(const MBParam * const pParam,
221                                    FRAMEINFO * frame,                                  FRAMEINFO * const frame,
222                                    MACROBLOCK * pMB,                                  MACROBLOCK * const pMB,
223                                    const uint32_t x_pos,                                    const uint32_t x_pos,
224                                    const uint32_t y_pos,                                    const uint32_t y_pos,
225                                    int16_t data[6 * 64],                                    int16_t data[6 * 64],
226                                    int16_t qcoeff[6 * 64])                                    int16_t qcoeff[6 * 64])
227  {  {
   
228          uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
229          uint32_t stride2 = stride / 2;          const uint32_t stride2 = stride / 2;
230          uint32_t next_block = stride * 8;          uint32_t next_block = stride * ((frame->global_flags & XVID_REDUCED)?16:8);
231          uint32_t i;          int i;
232          uint32_t iQuant = frame->quant;          const uint32_t iQuant = pMB->quant;
233          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
234          uint8_t cbp = 0;          int cbp = 0;
235          uint32_t sum;          uint32_t sum;
236          IMAGE *pCurrent = &frame->image;          const IMAGE * const pCurrent = &frame->image;
237    
238            if ((frame->global_flags & XVID_REDUCED)) {
239                    pY_Cur = pCurrent->y + (y_pos << 5) * stride + (x_pos << 5);
240                    pU_Cur = pCurrent->u + (y_pos << 4) * stride2 + (x_pos << 4);
241                    pV_Cur = pCurrent->v + (y_pos << 4) * stride2 + (x_pos << 4);
242            } else {
243          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
244          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
245          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
246            }
247    
248          start_timer();          start_timer();
249          pMB->field_dct = 0;          pMB->field_dct = 0;
250          if ((frame->global_flags & XVID_INTERLACING)) {          if ((frame->global_flags & XVID_INTERLACING) &&
251                    (x_pos>0) && (x_pos<pParam->mb_width-1) &&
252                    (y_pos>0) && (y_pos<pParam->mb_height-1)) {
253                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
254          }          }
255          stop_interlacing_timer();          stop_interlacing_timer();
256    
257            MBfDCT(data);
258    
259          for (i = 0; i < 6; i++) {          for (i = 0; i < 6; i++) {
260                    const uint32_t limit = TOOSMALL_LIMIT + ((iQuant == 1) ? 1 : 0);
261                  /*                  /*
262                   *  no need to transfer 8->16-bit                   *  no need to transfer 8->16-bit
263                   * (this is performed already in motion compensation)                   * (this is performed already in motion compensation)
264                   */                   */
                 start_timer();  
                 fdct(&data[i * 64]);  
                 stop_dct_timer();  
265    
266                  if (pParam->m_quant_type == 0) {                  sum = QuantizeInterBlock(&qcoeff[i * 64], &data[i * 64], iQuant, pParam->m_quant_type);
                         start_timer();  
                         sum = quant_inter(&qcoeff[i * 64], &data[i * 64], iQuant);  
                         stop_quant_timer();  
                 } else {  
                         start_timer();  
                         sum = quant4_inter(&qcoeff[i * 64], &data[i * 64], iQuant);  
                         stop_quant_timer();  
                 }  
267    
268                  if (sum >= TOOSMALL_LIMIT) {    // skip block ?                  if (sum >= limit) {
269    
                         if (pParam->m_quant_type == H263_QUANT) {  
270                                  start_timer();                                  start_timer();
271                            if (pParam->m_quant_type == H263_QUANT)
272                                  dequant_inter(&data[i * 64], &qcoeff[i * 64], iQuant);                                  dequant_inter(&data[i * 64], &qcoeff[i * 64], iQuant);
273                                  stop_iquant_timer();                          else
                         } else {  
                                 start_timer();  
274                                  dequant4_inter(&data[i * 64], &qcoeff[i * 64], iQuant);                                  dequant4_inter(&data[i * 64], &qcoeff[i * 64], iQuant);
275                                  stop_iquant_timer();                                  stop_iquant_timer();
                         }  
276    
277                          cbp |= 1 << (5 - i);                          cbp |= 1 << (5 - i);
278    
# Line 233  Line 288 
288          }          }
289    
290          start_timer();          start_timer();
291            if ((frame->global_flags & XVID_REDUCED)) {
292                    if (cbp & 32)
293                            add_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
294                    if (cbp & 16)
295                            add_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
296                    if (cbp & 8)
297                            add_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
298                    if (cbp & 4)
299                            add_upsampled_8x8_16to8(pY_Cur + 16 + next_block, &data[3 * 64], stride);
300                    if (cbp & 2)
301                            add_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
302                    if (cbp & 1)
303                            add_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
304            } else {
305          if (cbp & 32)          if (cbp & 32)
306                  transfer_16to8add(pY_Cur, &data[0 * 64], stride);                  transfer_16to8add(pY_Cur, &data[0 * 64], stride);
307          if (cbp & 16)          if (cbp & 16)
# Line 245  Line 314 
314                  transfer_16to8add(pU_Cur, &data[4 * 64], stride2);                  transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
315          if (cbp & 1)          if (cbp & 1)
316                  transfer_16to8add(pV_Cur, &data[5 * 64], stride2);                  transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
317            }
318          stop_transfer_timer();          stop_transfer_timer();
319    
320          return cbp;          return (uint8_t) cbp;
321    }
322    
323    uint8_t
324    MBTransQuantInterBVOP(const MBParam * pParam,
325                                      FRAMEINFO * frame,
326                                      MACROBLOCK * pMB,
327                                      int16_t data[6 * 64],
328                                      int16_t qcoeff[6 * 64])
329    {
330            int cbp = 0;
331            int i;
332    
333    /* there is no MBTrans for Inter block, that's done in motion compensation already */
334    
335            start_timer();
336            pMB->field_dct = 0;
337            if ((frame->global_flags & XVID_INTERLACING)) {
338                    pMB->field_dct = MBDecideFieldDCT(data);
339  }  }
340            stop_interlacing_timer();
341    
342            MBfDCT(data);
343    
344  /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */          for (i = 0; i < 6; i++) {
345                    int codedecision = 0;
346    
347                    int sum = QuantizeInterBlock(&qcoeff[i * 64], &data[i * 64], pMB->quant, pParam->m_quant_type);
348    
349  uint32_t                  if ((sum > 2) || (qcoeff[i*64+1] != 0) || (qcoeff[i*64+8] != 0) ) codedecision = 1;
350                    else {
351                            if (pMB->mode == MODE_DIRECT || pMB->mode == MODE_DIRECT_NO4V) {
352                                    // dark blocks prevention for direct mode
353                                    if ( (qcoeff[i*64] < -1) || (qcoeff[i*64] > 0) ) codedecision = 1;
354                            } else
355                                    if (qcoeff[i*64] != 0) codedecision = 1; // not direct mode
356                    }
357    
358                    if (codedecision) cbp |= 1 << (5 - i);
359            }
360    
361    /* we don't have to DeQuant, iDCT and Transfer back data for B-frames if we don't reconstruct this frame */
362    /* warning: reconstruction not supported yet */
363            return (uint8_t) cbp;
364    }
365    
366    /* permute block and return field dct choice */
367    
368    static uint32_t
369  MBDecideFieldDCT(int16_t data[6 * 64])  MBDecideFieldDCT(int16_t data[6 * 64])
370  {  {
371            const uint32_t field = MBFieldTest(data);
372            if (field) MBFrameToField(data);
373    
374            return field;
375    }
376    
377    /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */
378    
379    uint32_t
380    MBFieldTest_c(int16_t data[6 * 64])
381    {
382          const uint8_t blocks[] =          const uint8_t blocks[] =
383                  { 0 * 64, 0 * 64, 0 * 64, 0 * 64, 2 * 64, 2 * 64, 2 * 64, 2 * 64 };                  { 0 * 64, 0 * 64, 0 * 64, 0 * 64, 2 * 64, 2 * 64, 2 * 64, 2 * 64 };
384          const uint8_t lines[] = { 0, 16, 32, 48, 0, 16, 32, 48 };          const uint8_t lines[] = { 0, 16, 32, 48, 0, 16, 32, 48 };
# Line 292  Line 412 
412                  }                  }
413          }          }
414    
415          if (frame > field) {          return (frame >= (field + 350));
                 MBFrameToField(data);  
         }  
   
         return (frame > field);  
416  }  }
417    
418    

Legend:
Removed from v.1.7  
changed lines
  Added in v.1.22

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4