[cvs] / xvidcore / src / utils / mbtransquant.c Repository:
ViewVC logotype

Diff of /xvidcore/src/utils/mbtransquant.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.5, Sat Apr 13 16:30:02 2002 UTC revision 1.21, Sat Feb 15 15:22:19 2003 UTC
# Line 42  Line 42 
42    *                                                                            *    *                                                                            *
43    *  Revision history:                                                         *    *  Revision history:                                                         *
44    *                                                                            *    *                                                                            *
45    *  29.03.2002 interlacing speedup - used transfer strides instead of    *  29.03.2002 interlacing speedup - used transfer strides instead of             *
46    *             manual field-to-frame conversion    *             manual field-to-frame conversion                                                           *
47    *  26.03.2002 interlacing support - moved transfers outside loops    *  26.03.2002 interlacing support - moved transfers outside loops                        *
48    *  22.12.2001 get_dc_scaler() moved to common.h    *  22.12.2001 get_dc_scaler() moved to common.h                                                          *
49    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *
50    *  17.11.2001 initial version                                                *    *  17.11.2001 initial version                                                *
51    *                                                                            *    *                                                                            *
# Line 65  Line 65 
65  #include "../quant/quant_h263.h"  #include "../quant/quant_h263.h"
66  #include "../encoder.h"  #include "../encoder.h"
67    
68  #define MIN(X, Y) ((X)<(Y)?(X):(Y))  #include "../image/reduced.h"
 #define MAX(X, Y) ((X)>(Y)?(X):(Y))  
69    
70  #define TOOSMALL_LIMIT 1 /* skip blocks having a coefficient sum below this value */  MBFIELDTEST_PTR MBFieldTest;
71    
72  /* this isnt pretty, but its better than 20 ifdefs */  #define TOOSMALL_LIMIT  1       /* skip blocks having a coefficient sum below this value */
73    
74  void MBTransQuantIntra(const MBParam *pParam,  void
75    MBTransQuantIntra(const MBParam * pParam,
76                                      FRAMEINFO * frame,
77                         MACROBLOCK * pMB,                         MACROBLOCK * pMB,
78                         const uint32_t x_pos,                         const uint32_t x_pos,
79                         const uint32_t y_pos,                         const uint32_t y_pos,
80                         int16_t data[6*64],                         int16_t data[6*64],
81                         int16_t qcoeff[6*64],                                    int16_t qcoeff[6 * 64])
                        IMAGE * const pCurrent)  
   
82  {  {
83    
84          uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
85          uint32_t stride2 = stride / 2;          uint32_t stride2 = stride / 2;
86          uint32_t next_block = stride * 8;          uint32_t next_block = stride * ((frame->global_flags & XVID_REDUCED)?16:8);
87          uint32_t i;          uint32_t i;
88          uint32_t iQuant = pParam->quant;          uint32_t iQuant = frame->quant;
89          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
90            IMAGE *pCurrent = &frame->image;
91    
92            start_timer();
93            if ((frame->global_flags & XVID_REDUCED))
94            {
95                    pY_Cur = pCurrent->y + (y_pos << 5) * stride + (x_pos << 5);
96                    pU_Cur = pCurrent->u + (y_pos << 4) * stride2 + (x_pos << 4);
97                    pV_Cur = pCurrent->v + (y_pos << 4) * stride2 + (x_pos << 4);
98    
99                    filter_18x18_to_8x8(&data[0 * 64], pY_Cur, stride);
100                    filter_18x18_to_8x8(&data[1 * 64], pY_Cur + 16, stride);
101                    filter_18x18_to_8x8(&data[2 * 64], pY_Cur + next_block, stride);
102                    filter_18x18_to_8x8(&data[3 * 64], pY_Cur + next_block + 16, stride);
103                    filter_18x18_to_8x8(&data[4 * 64], pU_Cur, stride2);
104                    filter_18x18_to_8x8(&data[5 * 64], pV_Cur, stride2);
105            }else{
106          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
107          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
108          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
109    
         start_timer();  
110          transfer_8to16copy(&data[0*64], pY_Cur,                                 stride);          transfer_8to16copy(&data[0*64], pY_Cur,                                 stride);
111          transfer_8to16copy(&data[1*64], pY_Cur + 8,                             stride);          transfer_8to16copy(&data[1*64], pY_Cur + 8,                             stride);
112          transfer_8to16copy(&data[2*64], pY_Cur + next_block,    stride);          transfer_8to16copy(&data[2*64], pY_Cur + next_block,    stride);
113          transfer_8to16copy(&data[3*64], pY_Cur + next_block + 8,stride);          transfer_8to16copy(&data[3*64], pY_Cur + next_block + 8,stride);
114          transfer_8to16copy(&data[4*64], pU_Cur,                                 stride2);          transfer_8to16copy(&data[4*64], pU_Cur,                                 stride2);
115          transfer_8to16copy(&data[5*64], pV_Cur,                                 stride2);          transfer_8to16copy(&data[5*64], pV_Cur,                                 stride2);
116            }
117          stop_transfer_timer();          stop_transfer_timer();
118    
119            /* XXX: rrv+interlacing is buggy */
120          start_timer();          start_timer();
121          pMB->field_dct = 0;          pMB->field_dct = 0;
122          if (pParam->global_flags & XVID_INTERLACING)          if ((frame->global_flags & XVID_INTERLACING) &&
123          {                  (x_pos>0) && (x_pos<pParam->mb_width-1) &&
124                    (y_pos>0) && (y_pos<pParam->mb_height-1)) {
125                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
126          }          }
127          stop_interlacing_timer();          stop_interlacing_timer();
128    
129          for(i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
130                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
131    
132                  start_timer();                  start_timer();
133                  fdct(&data[i*64]);                  fdct(&data[i*64]);
134                  stop_dct_timer();                  stop_dct_timer();
135    
136                  if (pParam->quant_type == H263_QUANT)                  if (pParam->m_quant_type == H263_QUANT) {
                 {  
137                          start_timer();                          start_timer();
138                          quant_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);                          quant_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);
139                          stop_quant_timer();                          stop_quant_timer();
140                    } else {
                         start_timer();  
                         dequant_intra(&data[i*64], &qcoeff[i*64], iQuant, iDcScaler);  
                         stop_iquant_timer();  
                 }  
                 else  
                 {  
141                          start_timer();                          start_timer();
142                          quant4_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);                          quant4_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);
143                          stop_quant_timer();                          stop_quant_timer();
144                    }
145    
146                    /* speedup: dont decode when encoding only ivops */
147                    if (pParam->iMaxKeyInterval != 1 || pParam->max_bframes > 0)
148                    {
149                            if (pParam->m_quant_type == H263_QUANT) {
150                                    start_timer();
151                                    dequant_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
152                                    stop_iquant_timer();
153                            } else {
154                          start_timer();                          start_timer();
155                          dequant4_intra(&data[i*64], &qcoeff[i*64], iQuant, iDcScaler);                          dequant4_intra(&data[i*64], &qcoeff[i*64], iQuant, iDcScaler);
156                          stop_iquant_timer();                          stop_iquant_timer();
# Line 143  Line 160 
160                  idct(&data[i*64]);                  idct(&data[i*64]);
161                  stop_idct_timer();                  stop_idct_timer();
162          }          }
163            }
164    
165          if (pMB->field_dct)          /* speedup: dont decode when encoding only ivops */
166            if (pParam->iMaxKeyInterval != 1 || pParam->max_bframes > 0)
167          {          {
168    
169                    if (pMB->field_dct) {
170                  next_block = stride;                  next_block = stride;
171                  stride *= 2;                  stride *= 2;
172          }          }
173    
174          start_timer();          start_timer();
175                    if ((frame->global_flags & XVID_REDUCED))
176                    {
177                            copy_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
178                            copy_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
179                            copy_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
180                            copy_upsampled_8x8_16to8(pY_Cur + next_block + 16, &data[3 * 64], stride);
181                            copy_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
182                            copy_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
183    
184                    }else{
185          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);
186          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);
187          transfer_16to8copy(pY_Cur + next_block,     &data[2*64], stride);          transfer_16to8copy(pY_Cur + next_block,     &data[2*64], stride);
188          transfer_16to8copy(pY_Cur + next_block + 8, &data[3*64], stride);          transfer_16to8copy(pY_Cur + next_block + 8, &data[3*64], stride);
189          transfer_16to8copy(pU_Cur,                  &data[4*64], stride2);          transfer_16to8copy(pU_Cur,                  &data[4*64], stride2);
190          transfer_16to8copy(pV_Cur,                  &data[5*64], stride2);          transfer_16to8copy(pV_Cur,                  &data[5*64], stride2);
191                    }
192          stop_transfer_timer();          stop_transfer_timer();
193            }
194    
195  }  }
196    
197    
198  uint8_t MBTransQuantInter(const MBParam *pParam,  uint8_t
199    MBTransQuantInter(const MBParam * pParam,
200                                      FRAMEINFO * frame,
201                            MACROBLOCK * pMB,                            MACROBLOCK * pMB,
202                            const uint32_t x_pos, const uint32_t y_pos,                                    const uint32_t x_pos,
203                                      const uint32_t y_pos,
204                            int16_t data[6*64],                            int16_t data[6*64],
205                            int16_t qcoeff[6*64],                                    int16_t qcoeff[6 * 64])
                           IMAGE * const pCurrent)  
   
206  {  {
207    
208          uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
209          uint32_t stride2 = stride / 2;          uint32_t stride2 = stride / 2;
210          uint32_t next_block = stride * 8;          uint32_t next_block = stride * ((frame->global_flags & XVID_REDUCED)?16:8);
211          uint32_t i;          uint32_t i;
212          uint32_t iQuant = pParam->quant;          uint32_t iQuant = frame->quant;
213          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
214          uint8_t cbp = 0;          uint8_t cbp = 0;
215          uint32_t sum;          uint32_t sum;
216            IMAGE *pCurrent = &frame->image;
217    
218            if ((frame->global_flags & XVID_REDUCED))
219            {
220                    pY_Cur = pCurrent->y + (y_pos << 5) * stride + (x_pos << 5);
221                    pU_Cur = pCurrent->u + (y_pos << 4) * stride2 + (x_pos << 4);
222                    pV_Cur = pCurrent->v + (y_pos << 4) * stride2 + (x_pos << 4);
223            }else{
224          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
225          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
226          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
227            }
228    
229          start_timer();          start_timer();
230          pMB->field_dct = 0;          pMB->field_dct = 0;
231          if (pParam->global_flags & XVID_INTERLACING)          if ((frame->global_flags & XVID_INTERLACING) &&
232          {                  (x_pos>0) && (x_pos<pParam->mb_width-1) &&
233                    (y_pos>0) && (y_pos<pParam->mb_height-1)) {
234                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
235          }          }
236          stop_interlacing_timer();          stop_interlacing_timer();
237    
238          for(i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
239          {                  uint32_t increase_limit = (iQuant == 1) ? 1 : 0;
240    
241                  /*                  /*
242                   *  no need to transfer 8->16-bit                   *  no need to transfer 8->16-bit
243                   * (this is performed already in motion compensation)                   * (this is performed already in motion compensation)
# Line 202  Line 246 
246                  fdct(&data[i*64]);                  fdct(&data[i*64]);
247                  stop_dct_timer();                  stop_dct_timer();
248    
249                  if (pParam->quant_type == 0)                  if (pParam->m_quant_type == 0) {
                 {  
250                          start_timer();                          start_timer();
251                          sum = quant_inter(&qcoeff[i*64], &data[i*64], iQuant);                          sum = quant_inter(&qcoeff[i*64], &data[i*64], iQuant);
252                          stop_quant_timer();                          stop_quant_timer();
253                    } else {
254                            start_timer();
255                            sum = quant4_inter(&qcoeff[i * 64], &data[i * 64], iQuant);
256                            stop_quant_timer();
257                    }
258    
259                    if ((sum >= TOOSMALL_LIMIT + increase_limit) || (qcoeff[i*64] != 0) ||
260                            (qcoeff[i*64+1] != 0) || (qcoeff[i*64+8] != 0)) {
261    
262                            if (pParam->m_quant_type == H263_QUANT) {
263                                    start_timer();
264                                    dequant_inter(&data[i * 64], &qcoeff[i * 64], iQuant);
265                                    stop_iquant_timer();
266                            } else {
267                                    start_timer();
268                                    dequant4_inter(&data[i * 64], &qcoeff[i * 64], iQuant);
269                                    stop_iquant_timer();
270                            }
271    
272                            cbp |= 1 << (5 - i);
273    
274                            start_timer();
275                            idct(&data[i * 64]);
276                            stop_idct_timer();
277                    }
278            }
279    
280            if (pMB->field_dct) {
281                    next_block = stride;
282                    stride *= 2;
283            }
284    
285            start_timer();
286            if ((frame->global_flags & XVID_REDUCED))
287            {
288                    if (cbp & 32)
289                            add_upsampled_8x8_16to8(pY_Cur, &data[0 * 64], stride);
290                    if (cbp & 16)
291                            add_upsampled_8x8_16to8(pY_Cur + 16, &data[1 * 64], stride);
292                    if (cbp & 8)
293                            add_upsampled_8x8_16to8(pY_Cur + next_block, &data[2 * 64], stride);
294                    if (cbp & 4)
295                            add_upsampled_8x8_16to8(pY_Cur + 16 + next_block, &data[3 * 64], stride);
296                    if (cbp & 2)
297                            add_upsampled_8x8_16to8(pU_Cur, &data[4 * 64], stride2);
298                    if (cbp & 1)
299                            add_upsampled_8x8_16to8(pV_Cur, &data[5 * 64], stride2);
300            }else{
301                    if (cbp & 32)
302                            transfer_16to8add(pY_Cur, &data[0 * 64], stride);
303                    if (cbp & 16)
304                            transfer_16to8add(pY_Cur + 8, &data[1 * 64], stride);
305                    if (cbp & 8)
306                            transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
307                    if (cbp & 4)
308                            transfer_16to8add(pY_Cur + next_block + 8, &data[3 * 64], stride);
309                    if (cbp & 2)
310                            transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
311                    if (cbp & 1)
312                            transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
313            }
314            stop_transfer_timer();
315    
316            return cbp;
317    
318    }
319    
320    void
321    MBTransQuantIntra2(const MBParam * pParam,
322                                      FRAMEINFO * frame,
323                                      MACROBLOCK * pMB,
324                                      const uint32_t x_pos,
325                                      const uint32_t y_pos,
326                                      int16_t data[6 * 64],
327                                      int16_t qcoeff[6 * 64])
328    {
329            MBTrans(pParam,frame,pMB,x_pos,y_pos,data);
330            MBfDCT(pParam,frame,pMB,data);
331            MBQuantIntra(pParam,frame,pMB,data,qcoeff);
332            MBDeQuantIntra(pParam,frame->quant,data,qcoeff);
333            MBiDCT(data,0x3F);
334            MBTransAdd(pParam,frame,pMB,x_pos,y_pos,data,0x3F);
335    }
336    
337    
338    uint8_t
339    MBTransQuantInter2(const MBParam * pParam,
340                                      FRAMEINFO * frame,
341                                      MACROBLOCK * pMB,
342                                      const uint32_t x_pos,
343                                      const uint32_t y_pos,
344                                      int16_t data[6 * 64],
345                                      int16_t qcoeff[6 * 64])
346    {
347            uint8_t cbp;
348    
349    /* there is no MBTrans for Inter block, that's done in motion compensation already */
350    
351            MBfDCT(pParam,frame,pMB,data);
352            cbp = MBQuantInter(pParam,frame->quant,data,qcoeff);
353            MBDeQuantInter(pParam,frame->quant,data,qcoeff,cbp);
354            MBiDCT(data,cbp);
355            MBTransAdd(pParam,frame,pMB,x_pos,y_pos,data,cbp);
356    
357            return cbp;
358    }
359    
360    uint8_t
361    MBTransQuantInterBVOP(const MBParam * pParam,
362                                      FRAMEINFO * frame,
363                                      MACROBLOCK * pMB,
364                                      int16_t data[6 * 64],
365                                      int16_t qcoeff[6 * 64])
366    {
367            uint8_t cbp;
368    
369    /* there is no MBTrans for Inter block, that's done in motion compensation already */
370    
371            MBfDCT(pParam,frame,pMB,data);
372            cbp = MBQuantInter(pParam,frame->quant,data,qcoeff);
373    
374    /* we don't have to DeQuant, iDCT and Transfer back data for B-frames */
375    
376            return cbp;
377    }
378    
379    
380    void
381    MBfDCT(const MBParam * pParam,
382                                      FRAMEINFO * frame,
383                                      MACROBLOCK * pMB,
384                                      int16_t data[6 * 64])
385    {
386            int i;
387    
388            start_timer();
389            pMB->field_dct = 0;
390            if ((frame->global_flags & XVID_INTERLACING)) {
391                    pMB->field_dct = MBDecideFieldDCT(data);
392            }
393            stop_interlacing_timer();
394    
395            for (i = 0; i < 6; i++) {
396                    start_timer();
397                    fdct(&data[i * 64]);
398                    stop_dct_timer();
399            }
400    }
401    
402    void
403    MBQuantDeQuantIntra(const MBParam * pParam,
404                                            FRAMEINFO * frame,
405                                            MACROBLOCK * pMB,
406                                            int16_t qcoeff[6 * 64],
407                                            int16_t data[6*64])
408    {
409            int i;
410            int iQuant = frame->quant;
411    
412            start_timer();
413            pMB->field_dct = 0;
414            if ((frame->global_flags & XVID_INTERLACING)) {
415                    pMB->field_dct = MBDecideFieldDCT(data);
416            }
417            stop_interlacing_timer();
418    
419            for (i = 0; i < 6; i++) {
420                    uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
421    
422                    if (pParam->m_quant_type == H263_QUANT) {
423                            start_timer();
424                            quant_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
425                            stop_quant_timer();
426    
427                            start_timer();
428                            dequant_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
429                            stop_iquant_timer();
430                    } else {
431                            start_timer();
432                            quant4_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
433                            stop_quant_timer();
434    
435                            start_timer();
436                            dequant4_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
437                            stop_iquant_timer();
438                    }
439            }
440    }
441    
442    void
443    MBQuantIntra(const MBParam * pParam,
444                             FRAMEINFO * frame,
445                             MACROBLOCK *pMB,
446                         int16_t qcoeff[6 * 64],
447                             int16_t data[6*64])
448    {
449            int i;
450            int iQuant = frame->quant;
451    
452            start_timer();
453            pMB->field_dct = 0;
454            if ((frame->global_flags & XVID_INTERLACING)) {
455                    pMB->field_dct = MBDecideFieldDCT(data);
456            }
457            stop_interlacing_timer();
458    
459            for (i = 0; i < 6; i++) {
460                    uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
461    
462                    if (pParam->m_quant_type == H263_QUANT) {
463                            start_timer();
464                            quant_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
465                            stop_quant_timer();
466                    } else {
467                            start_timer();
468                            quant4_intra(&qcoeff[i * 64], &data[i * 64], iQuant, iDcScaler);
469                            stop_quant_timer();
470                    }
471            }
472    }
473    
474    void
475    MBDeQuantIntra(const MBParam * pParam,
476                               const int iQuant,
477                                      int16_t qcoeff[6 * 64],
478                                      int16_t data[6*64])
479    {
480            int i;
481    
482            for (i = 0; i < 6; i++) {
483                    uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
484    
485                    if (pParam->m_quant_type == H263_QUANT) {
486                            start_timer();
487                            dequant_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
488                            stop_iquant_timer();
489                    } else {
490                            start_timer();
491                            dequant4_intra(&data[i * 64], &qcoeff[i * 64], iQuant, iDcScaler);
492                            stop_iquant_timer();
493                    }
494                  }                  }
495                  else  }
496    
497    uint8_t
498    MBQuantInter(const MBParam * pParam,
499                             const int iQuant,
500                                      int16_t data[6 * 64],
501                                      int16_t qcoeff[6 * 64])
502                  {                  {
503    
504            int i;
505            uint8_t cbp = 0;
506            int sum;
507    
508            for (i = 0; i < 6; i++) {
509    
510                    if (pParam->m_quant_type == 0) {
511                            start_timer();
512                            sum = quant_inter(&qcoeff[i * 64], &data[i * 64], iQuant);
513                            stop_quant_timer();
514                    } else {
515                          start_timer();                          start_timer();
516                          sum = quant4_inter(&qcoeff[i*64], &data[i*64], iQuant);                          sum = quant4_inter(&qcoeff[i*64], &data[i*64], iQuant);
517                          stop_quant_timer();                          stop_quant_timer();
518                  }                  }
519    
520                  if(sum >= TOOSMALL_LIMIT) { // skip block ?                  if(sum >= TOOSMALL_LIMIT) { // skip block ?
521                            cbp |= 1 << (5 - i);
522                    }
523            }
524            return cbp;
525    }
526    
527                          if (pParam->quant_type == H263_QUANT)  void
528    MBDeQuantInter( const MBParam * pParam,
529                                    const int iQuant,
530                                      int16_t data[6 * 64],
531                                      int16_t qcoeff[6 * 64],
532                                      const uint8_t cbp)
533                          {                          {
534            int i;
535    
536            for (i = 0; i < 6; i++) {
537                    if (cbp & (1 << (5 - i)))
538                    {
539                            if (pParam->m_quant_type == H263_QUANT) {
540                                  start_timer();                                  start_timer();
541                                  dequant_inter(&data[i*64], &qcoeff[i*64], iQuant);                                  dequant_inter(&data[i*64], &qcoeff[i*64], iQuant);
542                                  stop_iquant_timer();                                  stop_iquant_timer();
543                          }                          } else {
                         else  
                         {  
544                                  start_timer();                                  start_timer();
545                                  dequant4_inter(&data[i*64], &qcoeff[i*64], iQuant);                                  dequant4_inter(&data[i*64], &qcoeff[i*64], iQuant);
546                                  stop_iquant_timer();                                  stop_iquant_timer();
547                          }                          }
548                    }
549            }
550    }
551    
552                          cbp |= 1 << (5 - i);  void
553    MBiDCT( int16_t data[6 * 64],
554                    const uint8_t cbp)
555    {
556            int i;
557    
558            for (i = 0; i < 6; i++) {
559                    if (cbp & (1 << (5 - i)))
560                    {
561                          start_timer();                          start_timer();
562                          idct(&data[i*64]);                          idct(&data[i*64]);
563                          stop_idct_timer();                          stop_idct_timer();
564    
565                    }
566                  }                  }
567          }          }
568    
569          if (pMB->field_dct)  
570    void
571    MBTrans(const MBParam * pParam,
572                                      FRAMEINFO * frame,
573                                      MACROBLOCK * pMB,
574                                      const uint32_t x_pos,
575                                      const uint32_t y_pos,
576                                      int16_t data[6 * 64])
577          {          {
578            uint32_t stride = pParam->edged_width;
579            uint32_t stride2 = stride / 2;
580            uint32_t next_block = stride * 8;
581            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
582            IMAGE *pCurrent = &frame->image;
583    
584            pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
585            pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
586            pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
587    
588            start_timer();
589            transfer_8to16copy(&data[0 * 64], pY_Cur, stride);
590            transfer_8to16copy(&data[1 * 64], pY_Cur + 8, stride);
591            transfer_8to16copy(&data[2 * 64], pY_Cur + next_block, stride);
592            transfer_8to16copy(&data[3 * 64], pY_Cur + next_block + 8, stride);
593            transfer_8to16copy(&data[4 * 64], pU_Cur, stride2);
594            transfer_8to16copy(&data[5 * 64], pV_Cur, stride2);
595            stop_transfer_timer();
596    }
597    
598    void
599    MBTransAdd(const MBParam * pParam,
600                                      FRAMEINFO * frame,
601                                      MACROBLOCK * pMB,
602                                      const uint32_t x_pos,
603                                      const uint32_t y_pos,
604                                      int16_t data[6 * 64],
605                                      const uint8_t cbp)
606    {
607            uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
608            uint32_t stride = pParam->edged_width;
609            uint32_t stride2 = stride / 2;
610            uint32_t next_block = stride * 8;
611            IMAGE *pCurrent = &frame->image;
612    
613            pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
614            pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
615            pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
616    
617            if (pMB->field_dct) {
618                  next_block = stride;                  next_block = stride;
619                  stride *= 2;                  stride *= 2;
620          }          }
# Line 258  Line 633 
633          if (cbp & 1)          if (cbp & 1)
634                  transfer_16to8add(pV_Cur,                  &data[5*64], stride2);                  transfer_16to8add(pV_Cur,                  &data[5*64], stride2);
635          stop_transfer_timer();          stop_transfer_timer();
636    }
637    
         return cbp;  
638    
639    
640    /* permute block and return field dct choice */
641    
642    
643    uint32_t
644    MBDecideFieldDCT(int16_t data[6 * 64])
645    {
646            uint32_t field = MBFieldTest(data);
647    
648            if (field) {
649                    MBFrameToField(data);
650  }  }
651    
652            return field;
653    }
654    
 /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */  
655    
656    /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */
657    
658  uint32_t MBDecideFieldDCT(int16_t data[6*64])  uint32_t
659    MBFieldTest_c(int16_t data[6 * 64])
660  {  {
661            const uint8_t blocks[] =
662          const uint8_t blocks[] = {0*64, 0*64, 0*64, 0*64, 2*64, 2*64, 2*64, 2*64};                  { 0 * 64, 0 * 64, 0 * 64, 0 * 64, 2 * 64, 2 * 64, 2 * 64, 2 * 64 };
663          const uint8_t lines[]  = {0, 16, 32, 48, 0, 16, 32, 48};          const uint8_t lines[]  = {0, 16, 32, 48, 0, 16, 32, 48};
664    
665          int frame = 0, field = 0;          int frame = 0, field = 0;
666          int i, j;          int i, j;
667    
668          for (i=0 ; i<7 ; ++i)          for (i = 0; i < 7; ++i) {
669          {                  for (j = 0; j < 8; ++j) {
670                  for (j=0 ; j<8 ; ++j)                          frame +=
671                  {                                  ABS(data[0 * 64 + (i + 1) * 8 + j] - data[0 * 64 + i * 8 + j]);
672                          frame += ABS(data[0*64 + (i+1)*8 + j] - data[0*64 + i*8 + j]);                          frame +=
673                          frame += ABS(data[1*64 + (i+1)*8 + j] - data[1*64 + i*8 + j]);                                  ABS(data[1 * 64 + (i + 1) * 8 + j] - data[1 * 64 + i * 8 + j]);
674                          frame += ABS(data[2*64 + (i+1)*8 + j] - data[2*64 + i*8 + j]);                          frame +=
675                          frame += ABS(data[3*64 + (i+1)*8 + j] - data[3*64 + i*8 + j]);                                  ABS(data[2 * 64 + (i + 1) * 8 + j] - data[2 * 64 + i * 8 + j]);
676                            frame +=
677                                    ABS(data[3 * 64 + (i + 1) * 8 + j] - data[3 * 64 + i * 8 + j]);
678    
679                          field += ABS(data[blocks[i+1] + lines[i+1] + j] -\                          field +=
680                                    ABS(data[blocks[i + 1] + lines[i + 1] + j] -
681                                       data[blocks[i  ] + lines[i  ] + j]);                                       data[blocks[i  ] + lines[i  ] + j]);
682                          field += ABS(data[blocks[i+1] + lines[i+1] + 8 + j] -\                          field +=
683                                    ABS(data[blocks[i + 1] + lines[i + 1] + 8 + j] -
684                                       data[blocks[i  ] + lines[i  ] + 8 + j]);                                       data[blocks[i  ] + lines[i  ] + 8 + j]);
685                          field += ABS(data[blocks[i+1] + 64 + lines[i+1] + j] -\                          field +=
686                                    ABS(data[blocks[i + 1] + 64 + lines[i + 1] + j] -
687                                       data[blocks[i  ] + 64 + lines[i  ] + j]);                                       data[blocks[i  ] + 64 + lines[i  ] + j]);
688                          field += ABS(data[blocks[i+1] + 64 + lines[i+1] + 8 + j] -\                          field +=
689                                    ABS(data[blocks[i + 1] + 64 + lines[i + 1] + 8 + j] -
690                                       data[blocks[i  ] + 64 + lines[i  ] + 8 + j]);                                       data[blocks[i  ] + 64 + lines[i  ] + 8 + j]);
691                  }                  }
692          }          }
693    
694          if (frame > field)          return (frame >= (field + 350));
         {  
                 MBFrameToField(data);  
         }  
   
         return (frame > field);  
695  }  }
696    
697    
# Line 310  Line 700 
700  #define MOVLINE(X,Y) memcpy(X, Y, sizeof(tmp))  #define MOVLINE(X,Y) memcpy(X, Y, sizeof(tmp))
701  #define LINE(X,Y)    &data[X*64 + Y*8]  #define LINE(X,Y)    &data[X*64 + Y*8]
702    
703  void MBFrameToField(int16_t data[6*64])  void
704    MBFrameToField(int16_t data[6 * 64])
705  {  {
706          int16_t tmp[8];          int16_t tmp[8];
707    

Legend:
Removed from v.1.5  
changed lines
  Added in v.1.21

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4