[cvs] / xvidcore / src / xvid.c Repository:
ViewVC logotype

Diff of /xvidcore/src/xvid.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.18, Fri Jun 14 13:27:52 2002 UTC revision 1.33.2.12, Thu Nov 7 15:21:31 2002 UTC
# Line 27  Line 27 
27   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA   *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
28   *   *
29   ****************************************************************************/   ****************************************************************************/
30    
31  /*****************************************************************************  /*****************************************************************************
32   *   *
33   *  History   *  History
34   *   *
35     *      - 23.06.2002    added XVID_CPU_CHKONLY
36   *  - 17.03.2002        Added interpolate8x8_halfpel_hv_xmm   *  - 17.03.2002        Added interpolate8x8_halfpel_hv_xmm
37   *  - 22.12.2001  API change: added xvid_init() - Isibaar   *  - 22.12.2001  API change: added xvid_init() - Isibaar
38   *  - 16.12.2001        inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>   *  - 16.12.2001        inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>
# Line 48  Line 50 
50  #include "image/colorspace.h"  #include "image/colorspace.h"
51  #include "image/interpolate8x8.h"  #include "image/interpolate8x8.h"
52  #include "utils/mem_transfer.h"  #include "utils/mem_transfer.h"
53    #include "utils/mbfunctions.h"
54  #include "quant/quant_h263.h"  #include "quant/quant_h263.h"
55  #include "quant/quant_mpeg4.h"  #include "quant/quant_mpeg4.h"
56    #include "motion/motion.h"
57  #include "motion/sad.h"  #include "motion/sad.h"
58  #include "utils/emms.h"  #include "utils/emms.h"
59  #include "utils/timer.h"  #include "utils/timer.h"
60  #include "bitstream/mbcoding.h"  #include "bitstream/mbcoding.h"
61    
62    #if defined(ARCH_X86) && defined(EXPERIMENTAL_SSE2_CODE)
63    
64    #ifdef WIN32
65    #include <windows.h>
66    #else
67    #include <signal.h>
68    #include <setjmp.h>
69    #endif
70    
71    
72    #ifndef WIN32
73    
74    static jmp_buf mark;
75    
76    static void
77    sigill_handler(int signal)
78    {
79       longjmp(mark, 1);
80    }
81    #endif
82    
83    
84    /*
85    calls the funcptr, and returns whether SIGILL (illegal instruction) was signalled
86    return values:
87    -1 : could not determine
88    0  : SIGILL was *not* signalled
89    1  : SIGILL was signalled
90    */
91    
92    int
93    sigill_check(void (*func)())
94    {
95    #ifdef WIN32
96            _try {
97                    func();
98            }
99            _except(EXCEPTION_EXECUTE_HANDLER) {
100    
101                    if (_exception_code() == STATUS_ILLEGAL_INSTRUCTION)
102                            return 1;
103            }
104            return 0;
105    #else
106        void * old_handler;
107        int jmpret;
108    
109    
110        old_handler = signal(SIGILL, sigill_handler);
111        if (old_handler == SIG_ERR)
112        {
113            return -1;
114        }
115    
116        jmpret = setjmp(mark);
117        if (jmpret == 0)
118        {
119            func();
120        }
121    
122        signal(SIGILL, old_handler);
123    
124        return jmpret;
125    #endif
126    }
127    #endif
128    
129  /*****************************************************************************  /*****************************************************************************
130   * XviD Init Entry point   * XviD Init Entry point
131   *   *
# Line 80  Line 151 
151    
152          init_param = (XVID_INIT_PARAM *) param1;          init_param = (XVID_INIT_PARAM *) param1;
153    
154            /* Inform the client the API version */
155            init_param->api_version = API_VERSION;
156    
157            /* Inform the client the core build - unused because we're still alpha */
158            init_param->core_build = 1000;
159    
160          /* Do we have to force CPU features  ? */          /* Do we have to force CPU features  ? */
161          if ((init_param->cpu_flags & XVID_CPU_FORCE) > 0) {          if ((init_param->cpu_flags & XVID_CPU_FORCE)) {
162    
163                  cpu_flags = init_param->cpu_flags;                  cpu_flags = init_param->cpu_flags;
164    
165          } else {          } else {
166    
 #ifdef ARCH_X86  
167                  cpu_flags = check_cpu_features();                  cpu_flags = check_cpu_features();
168  #else  
169                  cpu_flags = 0;  #if defined(ARCH_X86) && defined(EXPERIMENTAL_SSE2_CODE)
170                    if ((cpu_flags & XVID_CPU_SSE) && sigill_check(sse_os_trigger))
171                            cpu_flags &= ~XVID_CPU_SSE;
172    
173                    if ((cpu_flags & XVID_CPU_SSE2) && sigill_check(sse2_os_trigger))
174                            cpu_flags &= ~XVID_CPU_SSE2;
175  #endif  #endif
176            }
177    
178            if ((init_param->cpu_flags & XVID_CPU_CHKONLY))
179            {
180                  init_param->cpu_flags = cpu_flags;                  init_param->cpu_flags = cpu_flags;
181                    return XVID_ERR_OK;
182          }          }
183    
184            init_param->cpu_flags = cpu_flags;
185    
186    
187          /* Initialize the function pointers */          /* Initialize the function pointers */
188          idct_int32_init();          idct_int32_init();
189          init_vlc_tables();          init_vlc_tables();
# Line 126  Line 217 
217          transfer_16to8add  = transfer_16to8add_c;          transfer_16to8add  = transfer_16to8add_c;
218          transfer8x8_copy   = transfer8x8_copy_c;          transfer8x8_copy   = transfer8x8_copy_c;
219    
220            /* Interlacing functions */
221            MBFieldTest = MBFieldTest_c;
222    
223          /* Image interpolation related functions */          /* Image interpolation related functions */
224          interpolate8x8_halfpel_h  = interpolate8x8_halfpel_h_c;          interpolate8x8_halfpel_h  = interpolate8x8_halfpel_h_c;
225          interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_c;          interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_c;
226          interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_c;          interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_c;
227    
228            interpolate16x16_lowpass_h = interpolate16x16_lowpass_h_c;
229            interpolate16x16_lowpass_v = interpolate16x16_lowpass_v_c;
230            interpolate16x16_lowpass_hv = interpolate16x16_lowpass_hv_c;
231    
232            interpolate8x8_lowpass_h = interpolate8x8_lowpass_h_c;
233            interpolate8x8_lowpass_v = interpolate8x8_lowpass_v_c;
234            interpolate8x8_lowpass_hv = interpolate8x8_lowpass_hv_c;
235    
236            interpolate8x8_6tap_lowpass_h = interpolate8x8_6tap_lowpass_h_c;
237            interpolate8x8_6tap_lowpass_v = interpolate8x8_6tap_lowpass_v_c;
238    
239            interpolate8x8_avg2 = interpolate8x8_avg2_c;
240            interpolate8x8_avg4 = interpolate8x8_avg4_c;
241    
242          /* Initialize internal colorspace transformation tables */          /* Initialize internal colorspace transformation tables */
243          colorspace_init();          colorspace_init();
244    
245          /* All colorspace transformation functions User Format->YV12 */          /* All colorspace transformation functions User Format->YV12 */
246            yv12_to_yv12    = yv12_to_yv12_c;
247          rgb555_to_yv12 = rgb555_to_yv12_c;          rgb555_to_yv12 = rgb555_to_yv12_c;
248          rgb565_to_yv12 = rgb565_to_yv12_c;          rgb565_to_yv12 = rgb565_to_yv12_c;
249          rgb24_to_yv12  = rgb24_to_yv12_c;          bgr_to_yv12     = bgr_to_yv12_c;
250          rgb32_to_yv12  = rgb32_to_yv12_c;          bgra_to_yv12    = bgra_to_yv12_c;
251          yuv_to_yv12    = yuv_to_yv12_c;          abgr_to_yv12    = abgr_to_yv12_c;
252            rgba_to_yv12    = rgba_to_yv12_c;
253          yuyv_to_yv12   = yuyv_to_yv12_c;          yuyv_to_yv12   = yuyv_to_yv12_c;
254          uyvy_to_yv12   = uyvy_to_yv12_c;          uyvy_to_yv12   = uyvy_to_yv12_c;
255    
256            rgb555i_to_yv12 = rgb555i_to_yv12_c;
257            rgb565i_to_yv12 = rgb565i_to_yv12_c;
258            bgri_to_yv12    = bgri_to_yv12_c;
259            bgrai_to_yv12   = bgrai_to_yv12_c;
260            abgri_to_yv12   = abgri_to_yv12_c;
261            rgbai_to_yv12   = rgbai_to_yv12_c;
262            yuyvi_to_yv12   = yuyvi_to_yv12_c;
263            uyvyi_to_yv12   = uyvyi_to_yv12_c;
264    
265    
266          /* All colorspace transformation functions YV12->User format */          /* All colorspace transformation functions YV12->User format */
267          yv12_to_rgb555 = yv12_to_rgb555_c;          yv12_to_rgb555 = yv12_to_rgb555_c;
268          yv12_to_rgb565 = yv12_to_rgb565_c;          yv12_to_rgb565 = yv12_to_rgb565_c;
269          yv12_to_rgb24  = yv12_to_rgb24_c;          yv12_to_bgr     = yv12_to_bgr_c;
270          yv12_to_rgb32  = yv12_to_rgb32_c;          yv12_to_bgra    = yv12_to_bgra_c;
271          yv12_to_yuv    = yv12_to_yuv_c;          yv12_to_abgr    = yv12_to_abgr_c;
272            yv12_to_rgba    = yv12_to_rgba_c;
273          yv12_to_yuyv   = yv12_to_yuyv_c;          yv12_to_yuyv   = yv12_to_yuyv_c;
274          yv12_to_uyvy   = yv12_to_uyvy_c;          yv12_to_uyvy   = yv12_to_uyvy_c;
275    
276            yv12_to_rgb555i = yv12_to_rgb555i_c;
277            yv12_to_rgb565i = yv12_to_rgb565i_c;
278            yv12_to_bgri    = yv12_to_bgri_c;
279            yv12_to_bgrai   = yv12_to_bgrai_c;
280            yv12_to_abgri   = yv12_to_abgri_c;
281            yv12_to_rgbai   = yv12_to_rgbai_c;
282            yv12_to_yuyvi   = yv12_to_yuyvi_c;
283            yv12_to_uyvyi   = yv12_to_uyvyi_c;
284    
285          /* Functions used in motion estimation algorithms */          /* Functions used in motion estimation algorithms */
286          calc_cbp = calc_cbp_c;          calc_cbp = calc_cbp_c;
287          sad16    = sad16_c;          sad16    = sad16_c;
         sad16bi  = sad16bi_c;  
288          sad8     = sad8_c;          sad8     = sad8_c;
289            sad16bi  = sad16bi_c;
290            sad8bi   = sad8bi_c;
291          dev16    = dev16_c;          dev16    = dev16_c;
292            sad16v   = sad16v_c;
293    
294    //      Halfpel8_Refine = Halfpel8_Refine_c;
295    
296  #ifdef ARCH_X86  #ifdef ARCH_X86
297    
298            if ((cpu_flags & XVID_CPU_MMX) || (cpu_flags & XVID_CPU_MMXEXT) ||
299                    (cpu_flags & XVID_CPU_3DNOW) || (cpu_flags & XVID_CPU_3DNOWEXT) ||
300                    (cpu_flags & XVID_CPU_SSE) || (cpu_flags & XVID_CPU_SSE2))
301            {
302                    /* Restore FPU context : emms_c is a nop functions */
303                    emms = emms_mmx;
304            }
305    
306          if ((cpu_flags & XVID_CPU_MMX) > 0) {          if ((cpu_flags & XVID_CPU_MMX) > 0) {
307    
308                  /* Forward and Inverse Discrete Cosine Transformation functions */                  /* Forward and Inverse Discrete Cosine Transformation functions */
309                  fdct = fdct_mmx;                  fdct = fdct_mmx;
310                  idct = idct_mmx;                  idct = idct_mmx;
311    
                 /* To restore FPU context after mmx use */  
                 emms = emms_mmx;  
   
312                  /* Quantization related functions */                  /* Quantization related functions */
313                  quant_intra   = quant_intra_mmx;                  quant_intra   = quant_intra_mmx;
314                  dequant_intra = dequant_intra_mmx;                  dequant_intra = dequant_intra_mmx;
# Line 184  Line 324 
324                  transfer_8to16copy = transfer_8to16copy_mmx;                  transfer_8to16copy = transfer_8to16copy_mmx;
325                  transfer_16to8copy = transfer_16to8copy_mmx;                  transfer_16to8copy = transfer_16to8copy_mmx;
326                  transfer_8to16sub  = transfer_8to16sub_mmx;                  transfer_8to16sub  = transfer_8to16sub_mmx;
327                    transfer_8to16sub2 = transfer_8to16sub2_mmx;
328                  transfer_16to8add  = transfer_16to8add_mmx;                  transfer_16to8add  = transfer_16to8add_mmx;
329                  transfer8x8_copy   = transfer8x8_copy_mmx;                  transfer8x8_copy   = transfer8x8_copy_mmx;
330    
331                    /* Interlacing Functions */
332                    MBFieldTest = MBFieldTest_mmx;
333    
334                  /* Image Interpolation related functions */                  /* Image Interpolation related functions */
335                  interpolate8x8_halfpel_h  = interpolate8x8_halfpel_h_mmx;                  interpolate8x8_halfpel_h  = interpolate8x8_halfpel_h_mmx;
336                  interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_mmx;                  interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_mmx;
337                  interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_mmx;                  interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_mmx;
338    
339                  /* Image RGB->YV12 related functions */                  interpolate8x8_6tap_lowpass_h = interpolate8x8_6tap_lowpass_h_mmx;
340                  rgb24_to_yv12 = rgb24_to_yv12_mmx;                  interpolate8x8_6tap_lowpass_v = interpolate8x8_6tap_lowpass_v_mmx;
341                  rgb32_to_yv12 = rgb32_to_yv12_mmx;  
342                  yuv_to_yv12   = yuv_to_yv12_mmx;  //              interpolate8x8_avg2 = interpolate8x8_avg2_mmx;
343                    interpolate8x8_avg4 = interpolate8x8_avg4_mmx;
344    
345                    /* image input xxx_to_yv12 related functions */
346                    yv12_to_yv12  = yv12_to_yv12_mmx;
347                    bgr_to_yv12   = bgr_to_yv12_mmx;
348                    bgra_to_yv12  = bgra_to_yv12_mmx;
349                  yuyv_to_yv12  = yuyv_to_yv12_mmx;                  yuyv_to_yv12  = yuyv_to_yv12_mmx;
350                  uyvy_to_yv12  = uyvy_to_yv12_mmx;                  uyvy_to_yv12  = uyvy_to_yv12_mmx;
351    
352                  /* Image YV12->RGB related functions */                  /* image output yv12_to_xxx related functions */
353                  yv12_to_rgb24 = yv12_to_rgb24_mmx;                  yv12_to_bgr   = yv12_to_bgr_mmx;
354                  yv12_to_rgb32 = yv12_to_rgb32_mmx;                  yv12_to_bgra  = yv12_to_bgra_mmx;
355                  yv12_to_yuyv  = yv12_to_yuyv_mmx;                  yv12_to_yuyv  = yv12_to_yuyv_mmx;
356                  yv12_to_uyvy  = yv12_to_uyvy_mmx;                  yv12_to_uyvy  = yv12_to_uyvy_mmx;
357    
358                    yv12_to_yuyvi = yv12_to_yuyvi_mmx;
359                    yv12_to_uyvyi = yv12_to_uyvyi_mmx;
360    
361                  /* Motion estimation related functions */                  /* Motion estimation related functions */
362                  calc_cbp = calc_cbp_mmx;                  calc_cbp = calc_cbp_mmx;
363                  sad16    = sad16_mmx;                  sad16    = sad16_mmx;
364                  sad8     = sad8_mmx;                  sad8     = sad8_mmx;
365                    sad16bi = sad16bi_mmx;
366                    sad8bi  = sad8bi_mmx;
367                  dev16    = dev16_mmx;                  dev16    = dev16_mmx;
368                    sad16v   = sad16v_mmx;
369    
370            }
371    
372            /* these 3dnow functions are faster than mmx, but slower than xmm. */
373            if ((cpu_flags & XVID_CPU_3DNOW) > 0) {
374    
375                    /* ME functions */
376                    sad16bi = sad16bi_3dn;
377                    sad8bi  = sad8bi_3dn;
378    
379                    yuyv_to_yv12  = yuyv_to_yv12_3dn;
380                    uyvy_to_yv12  = uyvy_to_yv12_3dn;
381          }          }
382    
383    
384          if ((cpu_flags & XVID_CPU_MMXEXT) > 0) {          if ((cpu_flags & XVID_CPU_MMXEXT) > 0) {
385    
386                  /* Inverse DCT */                  /* Inverse DCT */
# Line 223  Line 391 
391                  interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_xmm;                  interpolate8x8_halfpel_v  = interpolate8x8_halfpel_v_xmm;
392                  interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_xmm;                  interpolate8x8_halfpel_hv = interpolate8x8_halfpel_hv_xmm;
393    
394                    /* Quantization */
395                    dequant_intra = dequant_intra_xmm;
396                    dequant_inter = dequant_inter_xmm;
397    
398                    /* Buffer transfer */
399                    transfer_8to16sub2 = transfer_8to16sub2_xmm;
400    
401                  /* Colorspace transformation */                  /* Colorspace transformation */
402                  yuv_to_yv12 = yuv_to_yv12_xmm;                  yv12_to_yv12  = yv12_to_yv12_xmm;
403                    yuyv_to_yv12  = yuyv_to_yv12_xmm;
404                    uyvy_to_yv12  = uyvy_to_yv12_xmm;
405    
406                  /* ME functions */                  /* ME functions */
407                  sad16 = sad16_xmm;                  sad16 = sad16_xmm;
408                  sad8  = sad8_xmm;                  sad8  = sad8_xmm;
409                    sad16bi = sad16bi_xmm;
410                    sad8bi  = sad8bi_xmm;
411                  dev16 = dev16_xmm;                  dev16 = dev16_xmm;
412                    sad16v   = sad16v_xmm;
413          }          }
414    
415          if ((cpu_flags & XVID_CPU_3DNOW) > 0) {          if ((cpu_flags & XVID_CPU_3DNOW) > 0) {
# Line 244  Line 423 
423          if ((cpu_flags & XVID_CPU_SSE2) > 0) {          if ((cpu_flags & XVID_CPU_SSE2) > 0) {
424  #ifdef EXPERIMENTAL_SSE2_CODE  #ifdef EXPERIMENTAL_SSE2_CODE
425    
426                    calc_cbp = calc_cbp_sse2;
427    
428                  /* Quantization */                  /* Quantization */
429                  quant_intra   = quant_intra_sse2;                  quant_intra   = quant_intra_sse2;
430                  dequant_intra = dequant_intra_sse2;                  dequant_intra = dequant_intra_sse2;
# Line 251  Line 432 
432                  dequant_inter = dequant_inter_sse2;                  dequant_inter = dequant_inter_sse2;
433    
434                  /* ME */                  /* ME */
                 calc_cbp = calc_cbp_sse2;  
435                  sad16    = sad16_sse2;                  sad16    = sad16_sse2;
436                  dev16    = dev16_sse2;                  dev16    = dev16_sse2;
437    
# Line 275  Line 455 
455            sad16bi = sad16bi_ia64;            sad16bi = sad16bi_ia64;
456            sad8 = sad8_ia64;            sad8 = sad8_ia64;
457            dev16 = dev16_ia64;            dev16 = dev16_ia64;
458    //        Halfpel8_Refine = Halfpel8_Refine_ia64;
459            quant_intra = quant_intra_ia64;            quant_intra = quant_intra_ia64;
460            dequant_intra = dequant_intra_ia64;            dequant_intra = dequant_intra_ia64;
461            quant_inter = quant_inter_ia64;            quant_inter = quant_inter_ia64;
# Line 303  Line 484 
484  #endif  #endif
485  #endif  #endif
486    
         /* Inform the client the API version */  
         init_param->api_version = API_VERSION;  
   
         /* Inform the client the core build - unused because we're still alpha */  
         init_param->core_build = 1000;  
   
487          return XVID_ERR_OK;          return XVID_ERR_OK;
488  }  }
489    
# Line 330  Line 505 
505  {  {
506          switch (opt) {          switch (opt) {
507          case XVID_DEC_DECODE:          case XVID_DEC_DECODE:
508                  return decoder_decode((DECODER *) handle, (XVID_DEC_FRAME *) param1);                  return decoder_decode((DECODER *) handle, (XVID_DEC_FRAME *) param1, (XVID_DEC_STATS*) param2);
509    
510          case XVID_DEC_CREATE:          case XVID_DEC_CREATE:
511                  return decoder_create((XVID_DEC_PARAM *) param1);                  return decoder_create((XVID_DEC_PARAM *) param1);
# Line 362  Line 537 
537  {  {
538          switch (opt) {          switch (opt) {
539          case XVID_ENC_ENCODE:          case XVID_ENC_ENCODE:
540    
541                    if (((Encoder *) handle)->mbParam.max_bframes >= 0)
542                    return encoder_encode_bframes((Encoder *) handle, (XVID_ENC_FRAME *) param1,
543                                                              (XVID_ENC_STATS *) param2);
544                    else
545                  return encoder_encode((Encoder *) handle, (XVID_ENC_FRAME *) param1,                  return encoder_encode((Encoder *) handle, (XVID_ENC_FRAME *) param1,
546                                                            (XVID_ENC_STATS *) param2);                                                            (XVID_ENC_STATS *) param2);
547    

Legend:
Removed from v.1.18  
changed lines
  Added in v.1.33.2.12

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4