[cvs] / xvidcore / src / utils / mbtransquant.c Repository:
ViewVC logotype

Diff of /xvidcore/src/utils/mbtransquant.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.3, Thu Mar 28 20:57:25 2002 UTC revision 1.7, Wed Jun 12 20:38:41 2002 UTC
# Line 42  Line 42 
42    *                                                                            *    *                                                                            *
43    *  Revision history:                                                         *    *  Revision history:                                                         *
44    *                                                                            *    *                                                                            *
45      *  29.03.2002 interlacing speedup - used transfer strides instead of
46      *             manual field-to-frame conversion
47    *  26.03.2002 interlacing support - moved transfers outside loops    *  26.03.2002 interlacing support - moved transfers outside loops
48    *  22.12.2001 get_dc_scaler() moved to common.h    *  22.12.2001 get_dc_scaler() moved to common.h
49    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *    *  19.11.2001 introduced coefficient thresholding (Isibaar)                  *
# Line 70  Line 72 
72    
73  /* this isnt pretty, but its better than 20 ifdefs */  /* this isnt pretty, but its better than 20 ifdefs */
74    
75  void MBTransQuantIntra(const MBParam *pParam,  void
76    MBTransQuantIntra(const MBParam * pParam,
77                                      FRAMEINFO * frame,
78                         MACROBLOCK * pMB,                         MACROBLOCK * pMB,
79                         const uint32_t x_pos,                         const uint32_t x_pos,
80                         const uint32_t y_pos,                         const uint32_t y_pos,
81                         int16_t data[6*64],                         int16_t data[6*64],
82                         int16_t qcoeff[6*64],                                    int16_t qcoeff[6 * 64])
                        IMAGE * const pCurrent)  
   
83  {  {
84    
85          const uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
86            uint32_t stride2 = stride / 2;
87            uint32_t next_block = stride * 8;
88          uint32_t i;          uint32_t i;
89          uint32_t iQuant = pParam->quant;          uint32_t iQuant = frame->quant;
90          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
91            IMAGE *pCurrent = &frame->image;
92    
93          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
94          pU_Cur = pCurrent->u + (y_pos << 3) * (stride >> 1) + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
95          pV_Cur = pCurrent->v + (y_pos << 3) * (stride >> 1) + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
96    
97          start_timer();          start_timer();
98          transfer_8to16copy(&data[0*64], pY_Cur, stride);          transfer_8to16copy(&data[0*64], pY_Cur, stride);
99          transfer_8to16copy(&data[1*64], pY_Cur + 8, stride);          transfer_8to16copy(&data[1*64], pY_Cur + 8, stride);
100          transfer_8to16copy(&data[2*64], pY_Cur + 8 * stride, stride);          transfer_8to16copy(&data[2 * 64], pY_Cur + next_block, stride);
101          transfer_8to16copy(&data[3*64], pY_Cur + 8 * stride + 8, stride);          transfer_8to16copy(&data[3 * 64], pY_Cur + next_block + 8, stride);
102          transfer_8to16copy(&data[4*64], pU_Cur, stride / 2);          transfer_8to16copy(&data[4 * 64], pU_Cur, stride2);
103          transfer_8to16copy(&data[5*64], pV_Cur, stride / 2);          transfer_8to16copy(&data[5 * 64], pV_Cur, stride2);
104          stop_transfer_timer();          stop_transfer_timer();
105    
106          start_timer();          start_timer();
107          pMB->field_dct = 0;          pMB->field_dct = 0;
108          if (pParam->global_flags & XVID_INTERLACING)          if ((frame->global_flags & XVID_INTERLACING)) {
         {  
109                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
110          }          }
111          stop_interlacing_timer();          stop_interlacing_timer();
112    
113          for(i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
114                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);                  uint32_t iDcScaler = get_dc_scaler(iQuant, i < 4);
115    
116                  start_timer();                  start_timer();
117                  fdct(&data[i*64]);                  fdct(&data[i*64]);
118                  stop_dct_timer();                  stop_dct_timer();
119    
120                  if (pParam->quant_type == H263_QUANT)                  if (pParam->m_quant_type == H263_QUANT) {
                 {  
121                          start_timer();                          start_timer();
122                          quant_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);                          quant_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);
123                          stop_quant_timer();                          stop_quant_timer();
# Line 123  Line 125 
125                          start_timer();                          start_timer();
126                          dequant_intra(&data[i*64], &qcoeff[i*64], iQuant, iDcScaler);                          dequant_intra(&data[i*64], &qcoeff[i*64], iQuant, iDcScaler);
127                          stop_iquant_timer();                          stop_iquant_timer();
128                  }                  } else {
                 else  
                 {  
129                          start_timer();                          start_timer();
130                          quant4_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);                          quant4_intra(&qcoeff[i*64], &data[i*64], iQuant, iDcScaler);
131                          stop_quant_timer();                          stop_quant_timer();
# Line 140  Line 140 
140                  stop_idct_timer();                  stop_idct_timer();
141          }          }
142    
143          start_timer();          if (pMB->field_dct) {
144          if (pMB->field_dct)                  next_block = stride;
145          {                  stride *= 2;
                 MBFieldToFrame(data);  
146          }          }
         stop_interlacing_timer();  
147    
148          start_timer();          start_timer();
149          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);          transfer_16to8copy(pY_Cur,                  &data[0*64], stride);
150          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);          transfer_16to8copy(pY_Cur + 8,              &data[1*64], stride);
151          transfer_16to8copy(pY_Cur + 8 * stride,     &data[2*64], stride);          transfer_16to8copy(pY_Cur + next_block, &data[2 * 64], stride);
152          transfer_16to8copy(pY_Cur + 8 + 8 * stride, &data[3*64], stride);          transfer_16to8copy(pY_Cur + next_block + 8, &data[3 * 64], stride);
153          transfer_16to8copy(pU_Cur,                  &data[4*64], stride / 2);          transfer_16to8copy(pU_Cur, &data[4 * 64], stride2);
154          transfer_16to8copy(pV_Cur,                  &data[5*64], stride / 2);          transfer_16to8copy(pV_Cur, &data[5 * 64], stride2);
155          stop_transfer_timer();          stop_transfer_timer();
156    
157  }  }
158    
159    
160  uint8_t MBTransQuantInter(const MBParam *pParam,  uint8_t
161    MBTransQuantInter(const MBParam * pParam,
162                                      FRAMEINFO * frame,
163                            MACROBLOCK * pMB,                            MACROBLOCK * pMB,
164                            const uint32_t x_pos, const uint32_t y_pos,                                    const uint32_t x_pos,
165                                      const uint32_t y_pos,
166                            int16_t data[6*64],                            int16_t data[6*64],
167                            int16_t qcoeff[6*64],                                    int16_t qcoeff[6 * 64])
                           IMAGE * const pCurrent)  
   
168  {  {
169    
170          const uint32_t stride = pParam->edged_width;          uint32_t stride = pParam->edged_width;
171            uint32_t stride2 = stride / 2;
172            uint32_t next_block = stride * 8;
173          uint32_t i;          uint32_t i;
174          uint32_t iQuant = pParam->quant;          uint32_t iQuant = frame->quant;
175          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;          uint8_t *pY_Cur, *pU_Cur, *pV_Cur;
176          uint8_t cbp = 0;          uint8_t cbp = 0;
177          uint32_t sum;          uint32_t sum;
178            IMAGE *pCurrent = &frame->image;
179    
180          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);          pY_Cur = pCurrent->y + (y_pos << 4) * stride + (x_pos << 4);
181          pU_Cur = pCurrent->u + (y_pos << 3) * (stride >> 1) + (x_pos << 3);          pU_Cur = pCurrent->u + (y_pos << 3) * stride2 + (x_pos << 3);
182          pV_Cur = pCurrent->v + (y_pos << 3) * (stride >> 1) + (x_pos << 3);          pV_Cur = pCurrent->v + (y_pos << 3) * stride2 + (x_pos << 3);
183    
184          start_timer();          start_timer();
185          pMB->field_dct = 0;          pMB->field_dct = 0;
186          if (pParam->global_flags & XVID_INTERLACING)          if ((frame->global_flags & XVID_INTERLACING)) {
         {  
187                  pMB->field_dct = MBDecideFieldDCT(data);                  pMB->field_dct = MBDecideFieldDCT(data);
188          }          }
189          stop_interlacing_timer();          stop_interlacing_timer();
190    
191          for(i = 0; i < 6; i++)          for (i = 0; i < 6; i++) {
         {  
192                  /*                  /*
193                   *  no need to transfer 8->16-bit                   *  no need to transfer 8->16-bit
194                   * (this is performed already in motion compensation)                   * (this is performed already in motion compensation)
# Line 197  Line 197 
197                  fdct(&data[i*64]);                  fdct(&data[i*64]);
198                  stop_dct_timer();                  stop_dct_timer();
199    
200                  if (pParam->quant_type == 0)                  if (pParam->m_quant_type == 0) {
                 {  
201                          start_timer();                          start_timer();
202                          sum = quant_inter(&qcoeff[i*64], &data[i*64], iQuant);                          sum = quant_inter(&qcoeff[i*64], &data[i*64], iQuant);
203                          stop_quant_timer();                          stop_quant_timer();
204                  }                  } else {
                 else  
                 {  
205                          start_timer();                          start_timer();
206                          sum = quant4_inter(&qcoeff[i*64], &data[i*64], iQuant);                          sum = quant4_inter(&qcoeff[i*64], &data[i*64], iQuant);
207                          stop_quant_timer();                          stop_quant_timer();
# Line 212  Line 209 
209    
210                  if(sum >= TOOSMALL_LIMIT) { // skip block ?                  if(sum >= TOOSMALL_LIMIT) { // skip block ?
211    
212                          if (pParam->quant_type == H263_QUANT)                          if (pParam->m_quant_type == H263_QUANT) {
                         {  
213                                  start_timer();                                  start_timer();
214                                  dequant_inter(&data[i*64], &qcoeff[i*64], iQuant);                                  dequant_inter(&data[i*64], &qcoeff[i*64], iQuant);
215                                  stop_iquant_timer();                                  stop_iquant_timer();
216                          }                          } else {
                         else  
                         {  
217                                  start_timer();                                  start_timer();
218                                  dequant4_inter(&data[i*64], &qcoeff[i*64], iQuant);                                  dequant4_inter(&data[i*64], &qcoeff[i*64], iQuant);
219                                  stop_iquant_timer();                                  stop_iquant_timer();
# Line 233  Line 227 
227                  }                  }
228          }          }
229    
230          start_timer();          if (pMB->field_dct) {
231          if (pMB->field_dct)                  next_block = stride;
232          {                  stride *= 2;
                 MBFieldToFrame(data);  
233          }          }
         stop_interlacing_timer();  
234    
235          start_timer();          start_timer();
236          if (cbp & 32)          if (cbp & 32)
# Line 246  Line 238 
238          if (cbp & 16)          if (cbp & 16)
239                  transfer_16to8add(pY_Cur + 8,              &data[1*64], stride);                  transfer_16to8add(pY_Cur + 8,              &data[1*64], stride);
240          if (cbp & 8)          if (cbp & 8)
241                  transfer_16to8add(pY_Cur + 8 * stride,     &data[2*64], stride);                  transfer_16to8add(pY_Cur + next_block, &data[2 * 64], stride);
242          if (cbp & 4)          if (cbp & 4)
243                  transfer_16to8add(pY_Cur + 8 + 8 * stride, &data[3*64], stride);                  transfer_16to8add(pY_Cur + next_block + 8, &data[3 * 64], stride);
244          if (cbp & 2)          if (cbp & 2)
245                  transfer_16to8add(pU_Cur,                  &data[4*64], stride / 2);                  transfer_16to8add(pU_Cur, &data[4 * 64], stride2);
246          if (cbp & 1)          if (cbp & 1)
247                  transfer_16to8add(pV_Cur,                  &data[5*64], stride / 2);                  transfer_16to8add(pV_Cur, &data[5 * 64], stride2);
248          stop_transfer_timer();          stop_transfer_timer();
249    
250          return cbp;          return cbp;
# Line 262  Line 254 
254    
255  /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */  /* if sum(diff between field lines) < sum(diff between frame lines), use field dct */
256    
 #define ABS(X) (X)<0 ? -(X) : (X)  
257    
258  uint32_t MBDecideFieldDCT(int16_t data[6*64])  uint32_t
259    MBDecideFieldDCT(int16_t data[6 * 64])
260  {  {
261    
262          const uint8_t blocks[] = {0*64, 0*64, 0*64, 0*64, 2*64, 2*64, 2*64, 2*64};          const uint8_t blocks[] =
263                    { 0 * 64, 0 * 64, 0 * 64, 0 * 64, 2 * 64, 2 * 64, 2 * 64, 2 * 64 };
264          const uint8_t lines[]  = {0, 16, 32, 48, 0, 16, 32, 48};          const uint8_t lines[]  = {0, 16, 32, 48, 0, 16, 32, 48};
265    
266          int frame = 0, field = 0;          int frame = 0, field = 0;
267          int i, j;          int i, j;
268    
269          for (i=0 ; i<7 ; ++i)          for (i = 0; i < 7; ++i) {
270          {                  for (j = 0; j < 8; ++j) {
271                  for (j=0 ; j<8 ; ++j)                          frame +=
272                  {                                  ABS(data[0 * 64 + (i + 1) * 8 + j] - data[0 * 64 + i * 8 + j]);
273                          frame += ABS(data[0*64 + (i+1)*8 + j] - data[0*64 + i*8 + j]);                          frame +=
274                          frame += ABS(data[1*64 + (i+1)*8 + j] - data[1*64 + i*8 + j]);                                  ABS(data[1 * 64 + (i + 1) * 8 + j] - data[1 * 64 + i * 8 + j]);
275                          frame += ABS(data[2*64 + (i+1)*8 + j] - data[2*64 + i*8 + j]);                          frame +=
276                          frame += ABS(data[3*64 + (i+1)*8 + j] - data[3*64 + i*8 + j]);                                  ABS(data[2 * 64 + (i + 1) * 8 + j] - data[2 * 64 + i * 8 + j]);
277                            frame +=
278                                    ABS(data[3 * 64 + (i + 1) * 8 + j] - data[3 * 64 + i * 8 + j]);
279    
280                          field += ABS(data[blocks[i+1] + lines[i+1] + j] -\                          field +=
281                                    ABS(data[blocks[i + 1] + lines[i + 1] + j] -
282                                       data[blocks[i  ] + lines[i  ] + j]);                                       data[blocks[i  ] + lines[i  ] + j]);
283                          field += ABS(data[blocks[i+1] + lines[i+1] + 8 + j] -\                          field +=
284                                    ABS(data[blocks[i + 1] + lines[i + 1] + 8 + j] -
285                                       data[blocks[i  ] + lines[i  ] + 8 + j]);                                       data[blocks[i  ] + lines[i  ] + 8 + j]);
286                          field += ABS(data[blocks[i+1] + 64 + lines[i+1] + j] -\                          field +=
287                                    ABS(data[blocks[i + 1] + 64 + lines[i + 1] + j] -
288                                       data[blocks[i  ] + 64 + lines[i  ] + j]);                                       data[blocks[i  ] + 64 + lines[i  ] + j]);
289                          field += ABS(data[blocks[i+1] + 64 + lines[i+1] + 8 + j] -\                          field +=
290                                    ABS(data[blocks[i + 1] + 64 + lines[i + 1] + 8 + j] -
291                                       data[blocks[i  ] + 64 + lines[i  ] + 8 + j]);                                       data[blocks[i  ] + 64 + lines[i  ] + 8 + j]);
292                  }                  }
293          }          }
294    
295          if (frame > field)          if (frame > field) {
         {  
296                  MBFrameToField(data);                  MBFrameToField(data);
297          }          }
298    
# Line 307  Line 305 
305  #define MOVLINE(X,Y) memcpy(X, Y, sizeof(tmp))  #define MOVLINE(X,Y) memcpy(X, Y, sizeof(tmp))
306  #define LINE(X,Y)    &data[X*64 + Y*8]  #define LINE(X,Y)    &data[X*64 + Y*8]
307    
308  void MBFrameToField(int16_t data[6*64])  void
309    MBFrameToField(int16_t data[6 * 64])
310  {  {
311          int16_t tmp[8];          int16_t tmp[8];
312    
# Line 367  Line 366 
366          MOVLINE(LINE(3,5),      LINE(3,3));          MOVLINE(LINE(3,5),      LINE(3,3));
367          MOVLINE(LINE(3,3),      tmp);          MOVLINE(LINE(3,3),      tmp);
368  }  }
   
   
 /* interlace Y blocks vertically */  
   
 void MBFieldToFrame(int16_t data[6*64])  
 {  
         uint16_t tmp[8];  
   
         /* left blocks */  
   
         // 1=8, 8=4, 4=2, 2=1  
         MOVLINE(tmp,            LINE(0,1));  
         MOVLINE(LINE(0,1),      LINE(2,0));  
         MOVLINE(LINE(2,0),      LINE(0,4));  
         MOVLINE(LINE(0,4),      LINE(0,2));  
         MOVLINE(LINE(0,2),      tmp);  
   
         // 3=9, 9=12, 12=6, 6=3  
         MOVLINE(tmp,            LINE(0,3));  
         MOVLINE(LINE(0,3),      LINE(2,1));  
         MOVLINE(LINE(2,1),      LINE(2,4));  
         MOVLINE(LINE(2,4),      LINE(0,6));  
         MOVLINE(LINE(0,6),      tmp);  
   
         // 5=10, 10=5  
         MOVLINE(tmp,            LINE(0,5));  
         MOVLINE(LINE(0,5),      LINE(2,2));  
         MOVLINE(LINE(2,2),      tmp);  
   
         // 7=11, 11=13, 13=14, 14=7  
         MOVLINE(tmp,            LINE(0,7));  
         MOVLINE(LINE(0,7),      LINE(2,3));  
         MOVLINE(LINE(2,3),      LINE(2,5));  
         MOVLINE(LINE(2,5),      LINE(2,6));  
         MOVLINE(LINE(2,6),      tmp);  
   
         /* right blocks */  
   
         // 1=8, 8=4, 4=2, 2=1  
         MOVLINE(tmp,            LINE(1,1));  
         MOVLINE(LINE(1,1),      LINE(3,0));  
         MOVLINE(LINE(3,0),      LINE(1,4));  
         MOVLINE(LINE(1,4),      LINE(1,2));  
         MOVLINE(LINE(1,2),      tmp);  
   
         // 3=9, 9=12, 12=6, 6=3  
         MOVLINE(tmp,            LINE(1,3));  
         MOVLINE(LINE(1,3),      LINE(3,1));  
         MOVLINE(LINE(3,1),      LINE(3,4));  
         MOVLINE(LINE(3,4),      LINE(1,6));  
         MOVLINE(LINE(1,6),      tmp);  
   
         // 5=10, 10=5  
         MOVLINE(tmp,            LINE(1,5));  
         MOVLINE(LINE(1,5),      LINE(3,2));  
         MOVLINE(LINE(3,2),      tmp);  
   
         // 7=11, 11=13, 13=14, 14=7  
         MOVLINE(tmp,            LINE(1,7));  
         MOVLINE(LINE(1,7),      LINE(3,3));  
         MOVLINE(LINE(3,3),      LINE(3,5));  
         MOVLINE(LINE(3,5),      LINE(3,6));  
         MOVLINE(LINE(3,6),      tmp);  
 }  

Legend:
Removed from v.1.3  
changed lines
  Added in v.1.7

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4