[cvs] / xvidcore / examples / xvid_bench.c Repository:
ViewVC logotype

Diff of /xvidcore/examples/xvid_bench.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.9.2.10, Sat Dec 13 00:04:08 2003 UTC revision 1.27.2.1, Wed Nov 1 10:01:23 2006 UTC
# Line 26  Line 26 
26  /*****************************************************************************  /*****************************************************************************
27   *   *
28   *  'Reference' output is at the end of file.   *  'Reference' output is at the end of file.
  *  Don't take the checksums and crc too seriouly, they aren't  
  *  bullet-proof (should plug some .md5 here)...  
29   *   *
30   *   compiles with something like:   *   compiles with something like:
31   *   gcc -o xvid_bench xvid_bench.c  -I../src/ -lxvidcore -lm   *   gcc -o xvid_bench xvid_bench.c  -I../src/ -lxvidcore -lm
# Line 60  Line 58 
58  #include "utils/timer.h"  #include "utils/timer.h"
59  #include "quant/quant_matrix.c"  #include "quant/quant_matrix.c"
60  #include "bitstream/cbp.h"  #include "bitstream/cbp.h"
61    #include "bitstream/bitstream.h"
62    
63  #include <math.h>  #include <math.h>
64    
# Line 67  Line 66 
66  #define M_PI            3.14159265358979323846  #define M_PI            3.14159265358979323846
67  #endif  #endif
68    
69  const int speed_ref = 100;  /* on slow machines, decrease this value */  int speed_ref = 100;  /* on slow machines, decrease this value */
70    int verbose = 0;
71    unsigned int cpu_mask;
72    
73  /*********************************************************************  /*********************************************************************
74   * misc   * misc
# Line 83  Line 84 
84  #else  #else
85          clock_t clk;          clock_t clk;
86          clk = clock();          clk = clock();
87          return clk * 1000000 / CLOCKS_PER_SEC;          return clk * 1000. / CLOCKS_PER_SEC;  /* clock() returns time in Milliseconds */
88  #endif  #endif
89  }  }
90    
# Line 112  Line 113 
113          unsigned int cpu;          unsigned int cpu;
114  } CPU;  } CPU;
115    
116  CPU cpu_list[] =  CPU cpu_list[] = {
117  { { "PLAINC", 0 }          { "PLAINC ", 0 },
118  #ifdef ARCH_IS_IA32  #ifdef ARCH_IS_IA32
119    , { "MMX   ", XVID_CPU_MMX }          { "MMX    ", XVID_CPU_MMX },
120    , { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }          { "MMXEXT ", XVID_CPU_MMXEXT | XVID_CPU_MMX },
121    , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }          { "SSE2   ", XVID_CPU_SSE2 | XVID_CPU_MMX },
122    , { "3DNOW ", XVID_CPU_3DNOW }          { "3DNOW  ", XVID_CPU_3DNOW },
123    , { "3DNOWE", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT }          { "3DNOWE ", XVID_CPU_3DNOW | XVID_CPU_3DNOWEXT },
124  #endif  #endif
125  //, { "IA64  ", XVID_CPU_IA64 }  #ifdef ARCH_IS_PPC
126  //, { "TSC   ", XVID_CPU_TSC }          { "ALTIVEC", XVID_CPU_ALTIVEC },
   , { 0, 0 } };  
   
 CPU  cpu_short_list[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
 //, { "MMXEXT", XVID_CPU_MMXEXT | XVID_CPU_MMX }  
127  #endif  #endif
128  //, { "IA64  ", XVID_CPU_IA64 }  #ifdef ARCH_IS_X86_64
129    , { 0, 0 } };          { "X86_64 ", XVID_CPU_ASM},
   
 CPU cpu_short_list2[] =  
 { { "PLAINC", 0 }  
 #ifdef ARCH_IS_IA32  
   , { "MMX   ", XVID_CPU_MMX }  
   , { "SSE2  ", XVID_CPU_SSE2 | XVID_CPU_MMX }  
130  #endif  #endif
131    , { 0, 0 } };  #ifdef ARCH_IS_IA64
132    //      { "IA64   ", XVID_CPU_IA64 },
133    #endif
134    //      { "TSC    ", XVID_CPU_TSC },
135            { 0, 0 }
136    };
137    
138    
139  int init_cpu(CPU *cpu)  int init_cpu(CPU *cpu)
# Line 253  Line 246 
246  };  };
247    
248  uint32_t  uint32_t
249  calc_crc(uint8_t *mem, int len, uint32_t initial)  calc_crc(uint8_t *mem, int len, uint32_t crc)
250  {  {
   
         register unsigned int crc;  
   
         crc = initial;  
   
251          while( len >= 8) {          while( len >= 8) {
252                  DO8(mem, crc);                  DO8(mem, crc);
253                  len -= 8;                  len -= 8;
# Line 270  Line 258 
258                  len--;                  len--;
259          }          }
260    
261          return(crc);          return crc;
262    }
263    
264    void byte_swap(uint8_t *mem, int len, int element_size) {
265    #ifdef ARCH_IS_BIG_ENDIAN
266            int i;
267    
268            if(element_size == 1) {
269                    /* No need to swap */
270            } else if(element_size == 2) {
271                    uint8_t temp[2];
272    
273                    for(i=0; i < (len/2); i++ ) {
274                            temp[0] = mem[0];
275                            temp[1] = mem[1];
276                            mem[0] = temp[1];
277                            mem[1] = temp[0];
278    
279                            mem += 2;
280                    }
281            } else if(element_size == 4) {
282                    uint8_t temp[4];
283    
284                    for(i=0; i < (len/4); i++ ) {
285                            temp[0] = mem[0];
286                            temp[1] = mem[1];
287                            temp[2] = mem[2];
288                            temp[3] = mem[3];
289                            mem[0] = temp[3];
290                            mem[1] = temp[2];
291                            mem[2] = temp[1];
292                            mem[3] = temp[0];
293    
294                            mem += 4;
295                    }
296            } else {
297                    printf("ERROR: byte_swap unsupported element_size(%u)\n", element_size);
298            }
299    #endif
300  }  }
301    
302  /*********************************************************************  /*********************************************************************
# Line 494  Line 519 
519                             (iCrc!=8107)?"| ERROR": "" );                             (iCrc!=8107)?"| ERROR": "" );
520  #endif  #endif
521    
522        /* New functions for field prediction by CK 1.10.2005 */
523    #pragma NEW8X4
524                    TEST_MB(interpolate8x4_halfpel_h, 0);
525                    printf("%s - interpfield-h -round0 %.3f usec       crc32=0x%08x %s\n",
526                               cpu->name, t, iCrc,
527                               (iCrc!=0x9538d6df)?"| ERROR": "" );
528    
529                    TEST_MB(interpolate8x4_halfpel_h, 1);
530                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
531                               cpu->name, t, iCrc,
532                               (iCrc!=0xde5f1db4)?"| ERROR": "" );
533    
534    
535                    TEST_MB(interpolate8x4_halfpel_v, 0);
536                    printf("%s - interpfield- v-round0 %.3f usec       crc32=0x%08x %s\n",
537                               cpu->name, t, iCrc,
538                               (iCrc!=0xea5a69ef)?"| ERROR": "" );
539    
540                    TEST_MB(interpolate8x4_halfpel_v, 1);
541                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
542                               cpu->name, t, iCrc,
543                               (iCrc!=0x4f10ec0f)?"| ERROR": "" );
544    
545    
546                    TEST_MB(interpolate8x4_halfpel_hv, 0);
547                    printf("%s - interpfield-hv-round0 %.3f usec       crc32=0x%08x %s\n",
548                               cpu->name, t, iCrc,
549                               (iCrc!=0xf97ee367)?"| ERROR": "" );
550    
551                    TEST_MB(interpolate8x4_halfpel_hv, 1);
552                    printf("%s -                round1 %.3f usec       crc32=0x%08x %s\n",
553                               cpu->name, t, iCrc,
554                               (iCrc!=0xb6a9f581)?"| ERROR": "" );
555    /* End of 8x4 functions */
556    
557                  printf( " --- \n" );                  printf( " --- \n" );
558          }          }
559  }  }
# Line 527  Line 587 
587  }                                         \  }                                         \
588  emms();                                   \  emms();                                   \
589  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
590  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
591    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
592    
593  #define TEST_TRANSFER(FUNC, DST, SRC)         \  #define TEST_TRANSFER(FUNC, DST, SRC)         \
594  TEST_TRANSFER_BEGIN(DST);                 \  TEST_TRANSFER_BEGIN(DST);                 \
# Line 553  Line 614 
614  }                                         \  }                                         \
615  emms();                                   \  emms();                                   \
616  t = (gettime_usec()-t -overhead) / nb_tests;\  t = (gettime_usec()-t -overhead) / nb_tests;\
617  s = calc_crc((uint8_t*)(DST), sizeof((DST)), CRC32_INITIAL)  byte_swap((uint8_t*)(DST), 8*32*sizeof((DST)[0]), sizeof((DST)[0]));  \
618    s = calc_crc((uint8_t*)(DST), 8*32*sizeof((DST)[0]), CRC32_INITIAL)
619    
620  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \  #define TEST_TRANSFER2(FUNC, DST, SRC, R1)    \
621  TEST_TRANSFER2_BEGIN(DST,SRC);            \  TEST_TRANSFER2_BEGIN(DST,SRC);            \
# Line 570  Line 632 
632          const int nb_tests = 4000*speed_ref;          const int nb_tests = 4000*speed_ref;
633          int i;          int i;
634          CPU *cpu;          CPU *cpu;
635          uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];  //      uint8_t  Src8[8*32], Dst8[8*32], Ref1[8*32], Ref2[8*32];
636          int16_t Src16[8*32], Dst16[8*32];  //      int16_t Src16[8*32], Dst16[8*32];
637      DECLARE_ALIGNED_MATRIX(Src8, 8, 32, uint8_t, CACHE_LINE);
638      DECLARE_ALIGNED_MATRIX(Dst8, 8, 32, uint8_t, CACHE_LINE);
639      DECLARE_ALIGNED_MATRIX(Ref1, 8, 32, uint8_t, CACHE_LINE);
640      DECLARE_ALIGNED_MATRIX(Ref2, 8, 32, uint8_t, CACHE_LINE);
641      DECLARE_ALIGNED_MATRIX(Src16, 8, 32, uint16_t, CACHE_LINE);
642      DECLARE_ALIGNED_MATRIX(Dst16, 8, 32, uint16_t, CACHE_LINE);
643    
644          printf( "\n ===  test transfer ===\n" );          printf( "\n ===  test transfer ===\n" );
645    
# Line 593  Line 661 
661                                  cpu->name, t, s,                                  cpu->name, t, s,
662                                  (s!=0xee7ccbb4)?"| ERROR": "");                                  (s!=0xee7ccbb4)?"| ERROR": "");
663    
664        /* New functions for field prediction by CK 1.10.2005 */
665    #pragma NEW8X4
666                    TEST_TRANSFER(transfer8x4_copy, Dst8, Src8);
667                    printf("%s - 8to4      %.3f usec       crc32=0x%08x %s\n",
668                               cpu->name, t, s,
669                               (s!=0xbb9c3db5)?"| ERROR": "");
670    /* End of new functions */
671    
672                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);                  TEST_TRANSFER(transfer8x8_copy, Dst8, Src8);
673                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",                  printf("%s - 8to8      %.3f usec       crc32=0x%08x %s\n",
674                             cpu->name, t, s,                             cpu->name, t, s,
# Line 606  Line 682 
682                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);                  TEST_TRANSFER2(transfer_8to16sub, Dst16, Src8, Ref1);
683                  {                  {
684                          int s1, s2;                          int s1, s2;
685                          s1 = calc_crc((uint8_t*)Dst16, sizeof(Dst16), CRC32_INITIAL);                          s1 = calc_crc((uint8_t*)Dst16, 8*32*sizeof(Dst16[0]), CRC32_INITIAL);
686                          s2 = calc_crc((uint8_t*)Src8, sizeof(Src8), CRC32_INITIAL);                          s2 = calc_crc((uint8_t*)Src8, 8*32*sizeof(Src8[0]), CRC32_INITIAL);
687                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",                          printf("%s - 8to16sub  %.3f usec       crc32(1)=0x%08x crc32(2)=0x%08x %s %s\n",
688                                     cpu->name, t, s1, s2,                                     cpu->name, t, s1, s2,
689                                     (s1!=0xa1e07163)?"| ERROR1": "",                                     (s1!=0xa1e07163)?"| ERROR1": "",
# Line 636  Line 712 
712    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
713          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
714            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \            (FUNC)((DST), (SRC), q, mpeg_quant_matrices);              \
715          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
716            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
717    }                                         \    }                                         \
718    emms();                                   \    emms();                                   \
719  }                                           \  }                                           \
# Line 651  Line 728 
728    for(q=1; q<=max_Q; ++q) {                 \    for(q=1; q<=max_Q; ++q) {                 \
729          for(tst=0; tst<nb_tests; ++tst)         \          for(tst=0; tst<nb_tests; ++tst)         \
730            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \            (FUNC)((DST), (SRC), q, q, mpeg_quant_matrices);           \
731          s = calc_crc((uint8_t*)(DST), 64*sizeof(int16_t), s); \          byte_swap((uint8_t*)(DST), 64*sizeof((DST)[0]), sizeof((DST)[0]));  \
732            s = calc_crc((uint8_t*)(DST), 64*sizeof((DST)[0]), s); \
733    }                                         \    }                                         \
734    emms();                                   \    emms();                                   \
735  }                                           \  }                                           \
736  t = (gettime_usec()-t-overhead)/nb_tests/qm  t = (gettime_usec()-t-overhead)/nb_tests/qm
737    
738    #define TEST_INTRA(REFFUNC, NEWFUNC, RANGE)              \
739    { int i,q,s;\
740            DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16); \
741      DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16); \
742      DECLARE_ALIGNED_MATRIX(Dst2,8, 8, int16_t, 16); \
743      for(q=1;q<=max_Q;q++)          \
744        for(s=-RANGE;s<RANGE;s++) { \
745          for(i=0;i<64;i++) Src[i]=s; \
746          (REFFUNC)((Dst),(Src),q,q,mpeg_quant_matrices);   \
747          (NEWFUNC)((Dst2),(Src),q,q,mpeg_quant_matrices);  \
748          for(i=0;i<64;i++)     \
749            if(Dst[i]!=Dst2[i]) printf("ERROR : " #NEWFUNC " i%d quant:%d input:%d C_result:%d ASM_result:%d\n",i,q,s,Dst[i],Dst2[i]);  \
750        }      \
751    }
752    
753    #define TEST_INTER(REFFUNC, NEWFUNC, RANGE)              \
754    { int i,q,s;  \
755            DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16); \
756      DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16); \
757      DECLARE_ALIGNED_MATRIX(Dst2,8, 8, int16_t, 16); \
758      for(q=1;q<=max_Q;q++)  \
759        for(s=-RANGE;s<RANGE;s++) {   \
760          for(i=0;i<64;i++) Src[i]=s; \
761          (REFFUNC)((Dst),(Src),q,mpeg_quant_matrices);  \
762          (NEWFUNC)((Dst2),(Src),q,mpeg_quant_matrices); \
763          emms();           \
764          for(i=0;i<64;i++) \
765            if(Dst[i]!=Dst2[i]) printf("ERROR : " #NEWFUNC " i%d quant:%d input:%d C_result:%d ASM_result:%d\n",i,q,s,Dst[i],Dst2[i]); \
766        } \
767    }
768    
769  void test_quant()  void test_quant()
770  {  {
771          const int nb_tests = 1*speed_ref;          const int nb_tests = 1*speed_ref;
# Line 667  Line 776 
776          CPU *cpu;          CPU *cpu;
777          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src, 8, 8, int16_t, 16);
778          DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Dst, 8, 8, int16_t, 16);
779            DECLARE_ALIGNED_MATRIX(Dst2,8, 8, int16_t, 16);
780          uint8_t Quant[8*8];          uint8_t Quant[8*8];
781    
782          printf( "\n =====  test quant =====\n" );          printf( "\n =====  test quant =====\n" );
# Line 687  Line 797 
797                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
798                  continue;                  continue;
799    
800                    // exhaustive tests to compare against the (ref) C-version
801                    TEST_INTRA(quant_h263_intra_c,   quant_h263_intra,    2048);
802                    TEST_INTRA(dequant_h263_intra_c, dequant_h263_intra , 512 );
803                    TEST_INTER(quant_h263_inter_c,   quant_h263_inter ,   2048);
804                    TEST_INTER(dequant_h263_inter_c, dequant_h263_inter , 512 );
805    
806                  overhead = -gettime_usec();                  overhead = -gettime_usec();
807                  for(s=0,qm=1; qm<=255; ++qm) {                  for(s=0,qm=1; qm<=255; ++qm) {
808                          for(i=0; i<8*8; ++i) Quant[i] = qm;                          for(i=0; i<8*8; ++i) Quant[i] = qm;
# Line 741  Line 857 
857  }  }
858    
859  /*********************************************************************  /*********************************************************************
860     * test distortion operators
861     *********************************************************************/
862    
863    static void ieee_reseed(long s);
864    static long ieee_rand(int Min, int Max);
865    
866    #define TEST_SSE(FUNCTION, SRC1, SRC2, STRIDE) \
867      do { \
868        t = gettime_usec(); \
869        tst = nb_tests; \
870        while((tst--)>0) sse = (FUNCTION)((SRC1), (SRC2), (STRIDE)); \
871        emms(); \
872        t = (gettime_usec() - t)/(double)nb_tests;  \
873      } while(0)
874    
875    
876    void test_sse()
877    {
878            const int nb_tests = 100000*speed_ref;
879            int i;
880            CPU *cpu;
881            DECLARE_ALIGNED_MATRIX(Src1, 8, 8, int16_t, 16);
882            DECLARE_ALIGNED_MATRIX(Src2, 8, 8, int16_t, 16);
883            DECLARE_ALIGNED_MATRIX(Src3, 8, 8, int16_t, 16);
884            DECLARE_ALIGNED_MATRIX(Src4, 8, 8, int16_t, 16);
885    
886            printf( "\n =====  test sse =====\n" );
887    
888            ieee_reseed(1);
889            for(i=0; i<64; ++i) {
890                    Src1[i] = ieee_rand(-2048, 2047);
891                    Src2[i] = ieee_rand(-2048, 2047);
892                    Src3[i] = ieee_rand(-2048, 2047);
893                    Src4[i] = ieee_rand(-2048, 2047);
894            }
895    
896            for(cpu = cpu_list; cpu->name!=0; ++cpu)
897            {
898                    double t;
899                    int tst, sse;
900    
901                    if (!init_cpu(cpu))
902                            continue;
903    
904                    /* 16 bit element blocks */
905                    TEST_SSE(sse8_16bit, Src1, Src2, 16);
906                    printf("%s -   sse8_16bit#1 %.3f usec       sse=%d %s\n",
907                               cpu->name, t, sse, (sse!=182013834)?"| ERROR": "");
908                    TEST_SSE(sse8_16bit, Src1, Src3, 16);
909                    printf("%s -   sse8_16bit#2 %.3f usec       sse=%d %s\n",
910                               cpu->name, t, sse, (sse!=142545203)?"| ERROR": "");
911                    TEST_SSE(sse8_16bit, Src1, Src4, 16);
912                    printf("%s -   sse8_16bit#3 %.3f usec       sse=%d %s\n",
913                               cpu->name, t, sse, (sse!=146340935)?"| ERROR": "");
914                    TEST_SSE(sse8_16bit, Src2, Src3, 16);
915                    printf("%s -   sse8_16bit#4 %.3f usec       sse=%d %s\n",
916                               cpu->name, t, sse, (sse!=130136661)?"| ERROR": "");
917                    TEST_SSE(sse8_16bit, Src2, Src4, 16);
918                    printf("%s -   sse8_16bit#5 %.3f usec       sse=%d %s\n",
919                               cpu->name, t, sse, (sse!=136870353)?"| ERROR": "");
920                    TEST_SSE(sse8_16bit, Src3, Src4, 16);
921                    printf("%s -   sse8_16bit#6 %.3f usec       sse=%d %s\n",
922                               cpu->name, t, sse, (sse!=164107772)?"| ERROR": "");
923    
924                    /* 8 bit element blocks */
925                    TEST_SSE(sse8_8bit, (int8_t*)Src1, (int8_t*)Src2, 8);
926                    printf("%s -    sse8_8bit#1 %.3f usec       sse=%d %s\n",
927                               cpu->name, t, sse, (sse!=1356423)?"| ERROR": "");
928                    TEST_SSE(sse8_8bit, (int8_t*)Src1, (int8_t*)Src3, 8);
929                    printf("%s -    sse8_8bit#2 %.3f usec       sse=%d %s\n",
930                               cpu->name, t, sse, (sse!=1173074)?"| ERROR": "");
931                    TEST_SSE(sse8_8bit, (int8_t*)Src1, (int8_t*)Src4, 8);
932                    printf("%s -    sse8_8bit#3 %.3f usec       sse=%d %s\n",
933                               cpu->name, t, sse, (sse!=1092357)?"| ERROR": "");
934                    TEST_SSE(sse8_8bit, (int8_t*)Src2, (int8_t*)Src3, 8);
935                    printf("%s -    sse8_8bit#4 %.3f usec       sse=%d %s\n",
936                               cpu->name, t, sse, (sse!=1360239)?"| ERROR": "");
937                    TEST_SSE(sse8_8bit, (int8_t*)Src2, (int8_t*)Src4, 8);
938                    printf("%s -    sse8_8bit#5 %.3f usec       sse=%d %s\n",
939                               cpu->name, t, sse, (sse!=1208414)?"| ERROR": "");
940                    TEST_SSE(sse8_8bit, (int8_t*)Src3, (int8_t*)Src4, 8);
941                    printf("%s -    sse8_8bit#6 %.3f usec       sse=%d %s\n",
942                               cpu->name, t, sse, (sse!=1099285)?"| ERROR": "");
943    
944                    printf(" ---\n");
945            }
946    }
947    
948    /*********************************************************************
949   * test non-zero AC counting   * test non-zero AC counting
950   *********************************************************************/   *********************************************************************/
951    
952  #define TEST_CBP(FUNC, SRC)                   \  #define TEST_CBP(FUNC, SRC, NB)           \
953  t = gettime_usec();                       \  t = gettime_usec();                       \
954  emms();                                   \  emms();                                   \
955  for(tst=0; tst<nb_tests; ++tst) {         \  for(tst=0; tst<NB; ++tst) {         \
956    cbp = (FUNC)((SRC));                    \    cbp = (FUNC)((SRC));                    \
957  }                                         \  }                                         \
958  emms();                                   \  emms();                                   \
# Line 756  Line 961 
961  void test_cbp()  void test_cbp()
962  {  {
963          const int nb_tests = 10000*speed_ref;          const int nb_tests = 10000*speed_ref;
964          int i;          int i, n, m;
965          CPU *cpu;          CPU *cpu;
966          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src1, 6, 64, int16_t, 16);
967          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src2, 6, 64, int16_t, 16);
968          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src3, 6, 64, int16_t, 16);
969          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);          DECLARE_ALIGNED_MATRIX(Src4, 6, 64, int16_t, 16);
970      DECLARE_ALIGNED_MATRIX(Src5, 6, 64, int16_t, 16);
971    
972          printf( "\n =====  test cbp =====\n" );          printf( "\n =====  test cbp =====\n" );
973    
# Line 770  Line 976 
976                  Src2[i] = (i<3*64);               /* half-full */                  Src2[i] = (i<3*64);               /* half-full */
977                  Src3[i] = ((i+32)>3*64);                  Src3[i] = ((i+32)>3*64);
978                  Src4[i] = (i==(3*64+2) || i==(5*64+9));                  Src4[i] = (i==(3*64+2) || i==(5*64+9));
979        Src5[i] = ieee_rand(0,1) ? -1 : 1;  /* +/- test */
980          }          }
981    
982          for(cpu = cpu_list; cpu->name!=0; ++cpu)          for(cpu = cpu_list; cpu->name!=0; ++cpu)
# Line 780  Line 987 
987                  if (!init_cpu(cpu))                  if (!init_cpu(cpu))
988                          continue;                          continue;
989    
990                  TEST_CBP(calc_cbp, Src1);                  TEST_CBP(calc_cbp, Src1, nb_tests);
991                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x\n",                  printf("%s -   calc_cbp#1 %.3f usec       cbp=0x%02x %s\n",
992                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x15)?"| ERROR": "");
993                  TEST_CBP(calc_cbp, Src2);                  TEST_CBP(calc_cbp, Src2, nb_tests);
994                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x\n",                  printf("%s -   calc_cbp#2 %.3f usec       cbp=0x%02x %s\n",
995                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");                             cpu->name, t, cbp, (cbp!=0x38)?"| ERROR": "");
996                  TEST_CBP(calc_cbp, Src3);                  TEST_CBP(calc_cbp, Src3, nb_tests);
997                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x\n",                  printf("%s -   calc_cbp#3 %.3f usec       cbp=0x%02x %s\n",
998                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x0f)?"| ERROR": "" );
999                  TEST_CBP(calc_cbp, Src4);                  TEST_CBP(calc_cbp, Src4, nb_tests);
1000                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x\n",                  printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1001                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );                             cpu->name, t, cbp, (cbp!=0x05)?"| ERROR": "" );
1002                    TEST_CBP(calc_cbp, Src5, nb_tests);
1003                    printf("%s -   calc_cbp#4 %.3f usec       cbp=0x%02x %s\n",
1004                               cpu->name, t, cbp, (cbp!=0x3f)?"| ERROR": "" );
1005                  printf( " --- \n" );                  printf( " --- \n" );
1006          }          }
1007    
1008            for(cpu = cpu_list; cpu->name!=0; ++cpu)  /* bench suggested by Carlo (carlo dot bramix at libero dot it) */
1009            {
1010                    double t;
1011                    int tst, cbp, err;
1012    
1013                    if (!init_cpu(cpu))
1014                            continue;
1015    
1016        err = 0;
1017        for(n=0; n<6; ++n)
1018        {
1019          for(m=0; m<64; ++m)
1020          {
1021            for(i=0; i<6*64; ++i)
1022              Src1[i] = (i== (m + n*64));
1023    
1024            TEST_CBP(calc_cbp, Src1, 1);
1025            if (cbp!= (((m!=0)<<(5-n))))
1026            {
1027              printf( "%s -   calc_cbp#5: ERROR at pos %d / %d!\n", cpu->name, n, m);
1028              err = 1;
1029              break;
1030            }
1031          }
1032        }
1033        if (!err)
1034          printf( " %s -    calc_cbp#5 : OK\n", cpu->name );
1035    
1036            }
1037  }  }
1038    
1039  /*********************************************************************  /*********************************************************************
# Line 1187  Line 1427 
1427   * measure raw decoding speed   * measure raw decoding speed
1428   *********************************************************************/   *********************************************************************/
1429    
1430  void test_dec(const char *name, int width, int height, int with_chksum)  void test_dec(const char *name, int width, int height, int ref_chksum)
1431  {  {
1432          FILE *f = 0;          FILE *f = 0;
1433          void *dechandle = 0;          void *dechandle = 0;
# Line 1198  Line 1438 
1438          double t = 0.;          double t = 0.;
1439          int nb = 0;          int nb = 0;
1440          uint8_t *buf = 0;          uint8_t *buf = 0;
1441          uint8_t *rgb_out = 0;          uint8_t *yuv_out = 0;
1442          int buf_size, pos;          int buf_size, pos;
1443          uint32_t chksum = 0;          uint32_t chksum = 0;
1444            int bps = (width+31) & ~31;
1445    
1446          memset(&xinit, 0, sizeof(xinit));          memset(&xinit, 0, sizeof(xinit));
1447          xinit.cpu_flags = XVID_CPU_MMX | XVID_CPU_FORCE;          xinit.cpu_flags = cpu_mask;
1448          xinit.version = XVID_VERSION;          xinit.version = XVID_VERSION;
1449          xvid_global(NULL, 0, &xinit, NULL);          xvid_global(NULL, 0, &xinit, NULL);
1450    
# Line 1213  Line 1454 
1454          xparam.version = XVID_VERSION;          xparam.version = XVID_VERSION;
1455          xerr = xvid_decore(NULL, XVID_DEC_CREATE, &xparam, NULL);          xerr = xvid_decore(NULL, XVID_DEC_CREATE, &xparam, NULL);
1456          if (xerr==XVID_ERR_FAIL) {          if (xerr==XVID_ERR_FAIL) {
1457                  printf("can't init decoder (err=%d)\n", xerr);                  printf("ERROR: can't init decoder (err=%d)\n", xerr);
1458                  return;                  return;
1459          }          }
1460          dechandle = xparam.handle;          dechandle = xparam.handle;
# Line 1221  Line 1462 
1462    
1463          f = fopen(name, "rb");          f = fopen(name, "rb");
1464          if (f==0) {          if (f==0) {
1465                  printf( "can't open file '%s'\n", name);                  printf( "ERROR: can't open file '%s'\n", name);
1466                  return;                  return;
1467          }          }
1468          fseek(f, 0, SEEK_END);          fseek(f, 0, SEEK_END);
1469          buf_size = ftell(f);          buf_size = ftell(f);
1470          fseek(f, 0, SEEK_SET);          fseek(f, 0, SEEK_SET);
1471          if (buf_size<=0) {          if (buf_size<=0) {
1472                  printf("error while stating file\n");                  printf("ERROR: error while stating file\n");
1473                  goto End;                  goto End;
1474          }          }
         else printf( "Input size: %d\n", buf_size);  
1475    
1476          buf = malloc(buf_size); /* should be enuf' */          buf = malloc(buf_size);
1477          rgb_out = calloc(4, width*height);  /* <-room for _RGB24 */          yuv_out = calloc(1, bps*height*3/2 + 15);
1478          if (buf==0 || rgb_out==0) {          if (buf==0 || yuv_out==0) {
1479                  printf( "malloc failed!\n" );                  printf( "ERROR: malloc failed!\n" );
1480                  goto End;                  goto End;
1481          }          }
1482    
1483          if (fread(buf, buf_size, 1, f)!=1) {          if (fread(buf, buf_size, 1, f)!=1) {
1484                  printf( "file-read failed\n" );                  printf( "ERROR: file-read failed\n" );
1485                  goto End;                  goto End;
1486          }          }
1487    
# Line 1249  Line 1489 
1489          pos = 0;          pos = 0;
1490          t = -gettime_usec();          t = -gettime_usec();
1491          while(1) {          while(1) {
1492              int y;
1493    
1494                  memset(&xframe, 0, sizeof(xframe));                  memset(&xframe, 0, sizeof(xframe));
1495                  xframe.version = XVID_VERSION;                  xframe.version = XVID_VERSION;
1496                  xframe.bitstream = buf + pos;                  xframe.bitstream = buf + pos;
1497                  xframe.length = buf_size - pos;                  xframe.length = buf_size - pos;
1498                  xframe.output.plane[0] = rgb_out;                  xframe.output.plane[0] = (uint8_t*)(((size_t)yuv_out + 15) & ~15);
1499                  xframe.output.stride[0] = width;                  xframe.output.plane[1] = (uint8_t*)xframe.output.plane[0] + bps*height;
1500                  xframe.output.csp = XVID_CSP_BGR;                  xframe.output.plane[2] = (uint8_t*)xframe.output.plane[1] + bps/2;
1501                    xframe.output.stride[0] = bps;
1502                    xframe.output.stride[1] = bps;
1503                    xframe.output.stride[2] = bps;
1504                    xframe.output.csp = XVID_CSP_I420;
1505                  xerr = xvid_decore(dechandle, XVID_DEC_DECODE, &xframe, 0);                  xerr = xvid_decore(dechandle, XVID_DEC_DECODE, &xframe, 0);
1506                    if (xerr<0) {
1507                            printf("ERROR: decoding failed for frame #%d (err=%d)!\n", nb, xerr);
1508                            break;
1509                    }
1510                    else if (xerr==0)
1511                      break;
1512        else if (verbose>0) printf("#%d %d\n", nb, xerr );
1513    
1514                    pos += xerr;
1515                  nb++;                  nb++;
1516                  pos += xframe.length;  
1517                  if (with_chksum) {      for(y=0; y<height/2; ++y) {
1518                          int k = width*height;                    chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+0)*bps, width, chksum);
1519                          uint32_t *ptr = (uint32_t *)rgb_out;                          chksum = calc_crc((uint8_t*)xframe.output.plane[0] + (2*y+1)*bps, width, chksum);
1520                          while(k-->0) chksum += *ptr++;                          chksum = calc_crc((uint8_t*)xframe.output.plane[1] + y*bps, width/2, chksum);
1521                            chksum = calc_crc((uint8_t*)xframe.output.plane[2] + y*bps, width/2, chksum);
1522                  }                  }
1523                  if (pos==buf_size)                  if (pos==buf_size)
1524                          break;                          break;
                 if (xerr==XVID_ERR_FAIL) {  
                         printf("decoding failed for frame #%d (err=%d)!\n", nb, xerr);  
                         break;  
                 }  
1525          }          }
1526          t += gettime_usec();          t += gettime_usec();
1527            if (ref_chksum==0) {
1528          if (t>0.)          if (t>0.)
1529                  printf( "%d frames decoded in %.3f s -> %.1f FPS\n", nb, t*1.e-6f, (float)(nb*1.e6f/t) );                    printf( "%d frames decoded in %.3f s -> %.1f FPS   Checksum:0x%.8x\n", nb, t*1.e-6f, (float)(nb*1.e6f/t), chksum );
1530          if (with_chksum)    }
1531                  printf("checksum: 0x%.8x\n", chksum);    else {
1532                    printf("FPS:%.1f Checksum: 0x%.8x Expected:0x%.8x | %s\n",
1533                      t>0. ? (float)(nb*1.e6f/t) : 0.f, chksum, ref_chksum, (chksum==ref_chksum) ? "OK" : "ERROR");
1534      }
1535    
1536   End:   End:
1537          if (rgb_out!=0) free(rgb_out);          if (yuv_out!=0) free(yuv_out);
1538          if (buf!=0) free(buf);          if (buf!=0) free(buf);
1539          if (dechandle!=0) {          if (dechandle!=0) {
1540                  xerr= xvid_decore(dechandle, XVID_DEC_DESTROY, NULL, NULL);                  xerr= xvid_decore(dechandle, XVID_DEC_DESTROY, NULL, NULL);
1541                  if (xerr==XVID_ERR_FAIL)                  if (xerr==XVID_ERR_FAIL)
1542                          printf("destroy-decoder failed (err=%d)!\n", xerr);                          printf("ERROR: destroy-decoder failed (err=%d)!\n", xerr);
1543          }          }
1544          if (f!=0) fclose(f);          if (f!=0) fclose(f);
1545  }  }
# Line 1445  Line 1701 
1701          }          }
1702  #endif  #endif
1703  }  }
1704    /*********************************************************************/
1705    
1706    static uint32_t __inline log2bin_v1(uint32_t value)
1707    {
1708      int n = 0;
1709      while (value) {
1710        value >>= 1;
1711        n++;
1712      }
1713      return n;
1714    }
1715    
1716    static const uint8_t log2_tab_16[16] =  { 0, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4 };
1717    
1718    static uint32_t __inline log2bin_v2(uint32_t value)
1719    {
1720      int n = 0;
1721      if (value & 0xffff0000) {
1722        value >>= 16;
1723        n += 16;
1724      }
1725      if (value & 0xff00) {
1726        value >>= 8;
1727        n += 8;
1728      }
1729      if (value & 0xf0) {
1730        value >>= 4;
1731        n += 4;
1732      }
1733     return n + log2_tab_16[value];
1734    }
1735    
1736    void test_log2bin()
1737    {
1738            const int nb_tests = 3000*speed_ref;
1739      int n, crc1=0, crc2=0;
1740      uint32_t s, s0;
1741      double t1, t2;
1742    
1743      t1 = gettime_usec();
1744      s0 = (int)(t1*31.241);
1745      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1746        crc1 += log2bin_v1(s);
1747      t1 = (gettime_usec()-t1) / nb_tests;
1748    
1749      t2 = gettime_usec();
1750      for(s=s0, n=0; n<nb_tests; ++n, s=(s*12363+31)&0x7fffffff)
1751        crc2 += log2bin_v2(s);
1752      t2 = (gettime_usec() - t2) / nb_tests;
1753    
1754      printf( "log2bin_v1: %.3f sec  crc=%d\n", t1, crc1 );
1755      printf( "log2bin_v2: %.3f sec  crc=%d\n", t2, crc2 );
1756      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1757    }
1758    
1759    /*********************************************************************/
1760    
1761    static void __inline old_gcd(int *num, int *den)
1762    {
1763     int i = *num;
1764      while (i > 1) {
1765        if (*num % i == 0 && *den % i == 0) {
1766          *num /= i;
1767          *den /= i;
1768          i = *num;
1769          continue;
1770        }
1771        i--;
1772      }
1773    }
1774    
1775    static uint32_t gcd(int num, int den)
1776    {
1777      int tmp;
1778      while( (tmp=num%den) ) { num = den; den = tmp; }
1779      return den;
1780    }
1781    static void __inline new_gcd(int *num, int *den)
1782    {
1783      const int div = gcd(*num, *den);
1784      if (num) {
1785        *num /= div;
1786        *den /= div;
1787      }
1788    }
1789    
1790    void test_gcd()
1791    {
1792            const int nb_tests = 10*speed_ref;
1793      int i;
1794      uint32_t crc1=0, crc2=0;
1795      uint32_t n0, n, d0, d;
1796      double t1, t2;
1797    
1798      t1 = gettime_usec();
1799      n0 = 0xfffff & (int)(t1*31.241);
1800      d0 = 0xfffff & (int)( ((n0*4123)%17) | 1 );
1801      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1802        old_gcd(&n, &d);
1803        crc1 = (((crc1>>4)^d) + ((crc1<<2)^n) ) & 0xffffff;
1804        n = d;
1805        d = (d*12363+31) & 0xffff;
1806        d |= !d;
1807      }
1808      t1 = (gettime_usec()-t1) / nb_tests;
1809    
1810      t2 = gettime_usec();
1811      for(n=n0, d=d0, i=0; i<nb_tests; ++i) {
1812        new_gcd(&n, &d);
1813        crc2 = (((crc2>>4)^d) + ((crc2<<2)^n) ) & 0xffffff;
1814        n = d;
1815        d = (d*12363+31) & 0xffff;
1816        d |= !d;
1817      }
1818      t2 = (gettime_usec() - t2) / nb_tests;
1819    
1820      printf( "old_gcd: %.3f sec  crc=%d\n", t1, crc1 );
1821      printf( "new_gcd: %.3f sec  crc=%d\n", t2, crc2 );
1822      if (crc1!=crc2) printf( " CRC ERROR !\n" );
1823    }
1824    
1825    /*********************************************************************
1826     * test compiler
1827     *********************************************************************/
1828    
1829    void test_compiler() {
1830      int nb_err = 0;
1831      int32_t v;
1832      if (sizeof(uint16_t)<2) {
1833        printf( "ERROR: sizeof(uint16_t)<2 !!\n" );
1834        nb_err++;
1835      }
1836      if (sizeof(int16_t)<2) {
1837        printf( "ERROR: sizeof(int16_t)<2 !!\n" );
1838        nb_err++;
1839      }
1840      if (sizeof(uint8_t)!=1) {
1841        printf( "ERROR: sizeof(uint8_t)!=1 !!\n" );
1842        nb_err++;
1843      }
1844      if (sizeof(int8_t)!=1) {
1845        printf( "ERROR: sizeof(int8_t)!=1 !!\n" );
1846        nb_err++;
1847      }
1848      if (sizeof(uint32_t)<4) {
1849        printf( "ERROR: sizeof(uint32_t)<4 !!\n" );
1850        nb_err++;
1851      }
1852      if (sizeof(int32_t)<4) {
1853        printf( "ERROR: sizeof(int32_t)<4 !!\n" );
1854        nb_err++;
1855      }
1856             /* yes, i know, this test is silly. But better be safe than sorry. :) */
1857      for(v=1000; v>=0; v--) {
1858        if ( (v>>2) != v/4)
1859          nb_err++;
1860      }
1861      for(v=-1000; v!=-1; v++) {
1862        if ( (v>>2) != (v/4)-!!(v%4))
1863          nb_err++;
1864      }
1865      if (nb_err!=0) {
1866        printf( "ERROR! please post your platform/compiler specs to xvid-devel@xvid.org !\n" );
1867      }
1868    }
1869    
1870    /*********************************************************************
1871     * test bitstream functions
1872     *********************************************************************/
1873    
1874    #define BIT_BUF_SIZE 2000
1875    
1876    static void test_bits()
1877    {
1878      const int nb_tests = 50*speed_ref;
1879      int tst;
1880      uint32_t Crc;
1881      uint8_t Buf[BIT_BUF_SIZE];
1882      uint32_t Extracted[BIT_BUF_SIZE*8]; /* worst case: bits read 1 by 1 */
1883      int Lens[BIT_BUF_SIZE*8];
1884      double t1;
1885    
1886    
1887      printf( "\n ===  test bitstream ===\n" );
1888      ieee_reseed(1);
1889      Crc = 0;
1890    
1891      t1 = gettime_usec();
1892      for(tst=0; tst<nb_tests; ++tst) {
1893            Bitstream bs;
1894            int m, m2, l, l2;
1895    
1896            for(l=0; l<BIT_BUF_SIZE; ++l)
1897                    Buf[l] = (uint8_t)ieee_rand(0,255);
1898    
1899            l = BIT_BUF_SIZE - ieee_rand(1,BIT_BUF_SIZE/10);
1900            BitstreamInit(&bs, (void*)(Buf+BIT_BUF_SIZE-l), l);
1901    
1902    
1903            BitstreamReset(&bs);
1904            for(l2=l*8, m=0; l2>0; m++) {
1905                    const int b = ieee_rand(1,32);
1906                    Lens[m] = b;
1907                    l2 -= b;
1908                    if (l2<0) break;
1909                    Extracted[m] = BitstreamShowBits(&bs, b);
1910                    BitstreamSkip(&bs, b);
1911    //              printf( "<= %d: %d 0x%x\n", m, b, Extracted[m]);
1912            }
1913    
1914            BitstreamReset(&bs);
1915            for(m2=0; m2<m; ++m2) {
1916                    const int b = Lens[m2];
1917                    const uint32_t v = BitstreamGetBits(&bs, b);
1918                    Crc |= (v!=Extracted[m2]);
1919    //              printf( "=> %d: %d 0x%x %c\n", m2, b, v, " *"[Crc]);
1920            }
1921      }
1922      t1 = (gettime_usec() - t1) / nb_tests;
1923      printf(" test_bits   %.3f usec   %s\n", t1, (Crc!=0)?"| ERROR": "" );
1924    }
1925    
1926  /*********************************************************************  /*********************************************************************
1927   * main   * main
1928   *********************************************************************/   *********************************************************************/
1929    
1930  int main(int argc, char *argv[])  static void arg_missing(const char *opt)
1931    {
1932      printf( "missing argument after option '%s'\n", opt);
1933      exit(-1);
1934    }
1935    
1936    int main(int argc, const char *argv[])
1937    {
1938            int c, what = 0;
1939            int width, height;
1940            uint32_t chksum = 0;
1941      const char * test_bitstream = 0;
1942    
1943            cpu_mask = 0;  // default => will use autodectect
1944            for(c=1; c<argc; ++c)
1945  {  {
1946          int what = 0;            if (!strcmp(argv[c], "-v")) verbose++;
1947          if (argc>1) what = atoi(argv[1]);            else if (!strcmp(argv[c], "-c"))      cpu_mask = 0 /* PLAIN_C */ | XVID_CPU_FORCE;
1948              else if (!strcmp(argv[c], "-mmx"))    cpu_mask = XVID_CPU_MMX    | XVID_CPU_FORCE;
1949              else if (!strcmp(argv[c], "-mmxext")) cpu_mask = XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
1950              else if (!strcmp(argv[c], "-sse2"))   cpu_mask = XVID_CPU_SSE2   | XVID_CPU_MMXEXT | XVID_CPU_MMX | XVID_CPU_FORCE;
1951              else if (!strcmp(argv[c], "-3dnow"))  cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_FORCE;
1952              else if (!strcmp(argv[c], "-3dnowe")) cpu_mask = XVID_CPU_3DNOW  | XVID_CPU_3DNOWEXT | XVID_CPU_FORCE;
1953              else if (!strcmp(argv[c], "-altivec")) cpu_mask = XVID_CPU_ALTIVEC | XVID_CPU_FORCE;
1954              else if (!strcmp(argv[c], "-spd")) {
1955          if (++c==argc) arg_missing( argv[argc-1] );
1956          speed_ref = atoi(argv[c]);
1957        }
1958              else if (argv[c][0]!='-') {
1959                what = atoi(argv[c]);
1960                if (what==9) {
1961                  if (c+4>argc) {
1962                    printf("usage: %s %d bitstream width height (checksum)\n", argv[0], what);
1963                    exit(-1);
1964            }
1965            test_bitstream = argv[++c];
1966                  width  = atoi(argv[++c]);
1967                  height = atoi(argv[++c]);
1968                  if (c+1<argc && argv[c+1][0]!='-') {
1969                    if (sscanf(argv[c+1], "0x%x", &chksum)!=1) {
1970                      printf( "can't read checksum value.\n" );
1971                      exit(-1);
1972              }
1973              else c++;
1974            }
1975    //        printf( "[%s] %dx%d (0x%.8x)\n", test_bitstream, width, height, chksum);
1976          }
1977        }
1978        else {
1979          printf( "unrecognized option '%s'\n", argv[c]);
1980          exit(-1);
1981        }
1982      }
1983    
1984    
1985          if (what==0 || what==1) test_dct();          if (what==0 || what==1) test_dct();
1986          if (what==0 || what==2) test_mb();          if (what==0 || what==2) test_mb();
1987          if (what==0 || what==3) test_sad();          if (what==0 || what==3) test_sad();
1988          if (what==0 || what==4) test_transfer();          if (what==0 || what==4) test_transfer();
1989          if (what==0 || what==5) test_quant();          if (what==0 || what==5) test_quant();
1990          if (what==0 || what==6) test_cbp();          if (what==0 || what==6) test_cbp();
1991            if (what==0 || what==10) test_sse();
1992            if (what==0 || what==11) test_log2bin();
1993            if (what==0 || what==12) test_gcd();
1994            if (what==0 || what==13) test_compiler();
1995            if (what==0 || what==17) test_bits();
1996    
1997    
1998          if (what==7) {          if (what==7) {
1999                  test_IEEE1180_compliance(-256, 255, 1);                  test_IEEE1180_compliance(-256, 255, 1);
# Line 1471  Line 2005 
2005          }          }
2006          if (what==8) test_dct_saturation(-256, 255);          if (what==8) test_dct_saturation(-256, 255);
2007    
2008          if (what==9) {          if (test_bitstream)
2009                  int width, height;            test_dec(test_bitstream, width, height, chksum);
                 if (argc<5) {  
                         printf("usage: %s %d [bitstream] [width] [height]\n", argv[0], what);  
                         return 1;  
                 }  
                 width = atoi(argv[3]);  
                 height = atoi(argv[4]);  
                 test_dec(argv[2], width, height, (argc>5));  
         }  
   
2010          if (what==-1) {          if (what==-1) {
2011                  test_dct_precision_diffs();                  test_dct_precision_diffs();
2012                  test_bugs1();                  test_bugs1();
# Line 1489  Line 2014 
2014          if (what==-2)          if (what==-2)
2015                  test_quant_bug();                  test_quant_bug();
2016    
2017          if (what >= 0 && what <= 6) {          if ((what >= 0 && what <= 6) || what == 10) {
2018                  printf("\n\n"                  printf("\n\n"
2019                             "NB: If a function isn't optimised for a specific set of intructions,\n"                             "NB: If a function isn't optimised for a specific set of intructions,\n"
2020                             "    a C function is used instead. So don't panic if some functions\n"                             "    a C function is used instead. So don't panic if some functions\n"
# Line 1509  Line 2034 
2034          return 0;          return 0;
2035  }  }
2036    
2037  /*********************************************************************  /*********************************************************************/
  * 'Reference' output (except for timing) on an Athlon XP 2200+  
  *********************************************************************/  
   
 /* as of 2002-01-07, there's a problem with MMX mpeg4-quantization */  
 /* as of 2003-11-30, the problem is still here */  
   
 /*********************************************************************  
   
   
  ===== test fdct/idct =====  
 PLAINC -  2.867 usec       PSNR=13.291  MSE=3.000  
 MMX    -  -0.211 usec       PSNR=9.611  MSE=7.000  
 MMXEXT -  -0.256 usec       PSNR=9.611  MSE=7.000  
 3DNOW  -  2.855 usec       PSNR=13.291  MSE=3.000  
 3DNOWE -  1.429 usec       PSNR=13.291  MSE=3.000  
   
  ===  test block motion ===  
 PLAINC - interp- h-round0 0.538 usec       crc32=0x115381ba  
 PLAINC -           round1 0.527 usec       crc32=0x2b1f528f  
 PLAINC - interp- v-round0 0.554 usec       crc32=0x423cdcc7  
 PLAINC -           round1 0.551 usec       crc32=0x42202efe  
 PLAINC - interp-hv-round0 1.041 usec       crc32=0xd198d387  
 PLAINC -           round1 1.038 usec       crc32=0x9ecfd921  
  ---  
 MMX    - interp- h-round0 0.051 usec       crc32=0x115381ba  
 MMX    -           round1 0.053 usec       crc32=0x2b1f528f  
 MMX    - interp- v-round0 0.048 usec       crc32=0x423cdcc7  
 MMX    -           round1 0.048 usec       crc32=0x42202efe  
 MMX    - interp-hv-round0 0.074 usec       crc32=0xd198d387  
 MMX    -           round1 0.073 usec       crc32=0x9ecfd921  
  ---  
 MMXEXT - interp- h-round0 0.020 usec       crc32=0x115381ba  
 MMXEXT -           round1 0.025 usec       crc32=0x2b1f528f  
 MMXEXT - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 MMXEXT -           round1 0.024 usec       crc32=0x42202efe  
 MMXEXT - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 MMXEXT -           round1 0.037 usec       crc32=0x9ecfd921  
  ---  
 3DNOW  - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOW  -           round1 0.029 usec       crc32=0x2b1f528f  
 3DNOW  - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOW  -           round1 0.024 usec       crc32=0x42202efe  
 3DNOW  - interp-hv-round0 0.038 usec       crc32=0xd198d387  
 3DNOW  -           round1 0.039 usec       crc32=0x9ecfd921  
  ---  
 3DNOWE - interp- h-round0 0.020 usec       crc32=0x115381ba  
 3DNOWE -           round1 0.024 usec       crc32=0x2b1f528f  
 3DNOWE - interp- v-round0 0.016 usec       crc32=0x423cdcc7  
 3DNOWE -           round1 0.021 usec       crc32=0x42202efe  
 3DNOWE - interp-hv-round0 0.037 usec       crc32=0xd198d387  
 3DNOWE -           round1 0.036 usec       crc32=0x9ecfd921  
  ---  
   
  ======  test SAD ======  
 PLAINC - sad8    0.505 usec       sad=3776  
 PLAINC - sad16   1.941 usec       sad=27214  
 PLAINC - sad16bi 4.925 usec       sad=26274  
 PLAINC - dev16   4.254 usec       sad=3344  
  ---  
 MMX    - sad8    0.036 usec       sad=3776  
 MMX    - sad16   0.107 usec       sad=27214  
 MMX    - sad16bi 0.259 usec       sad=26274  
 MMX    - dev16   0.187 usec       sad=3344  
  ---  
 MMXEXT - sad8    0.016 usec       sad=3776  
 MMXEXT - sad16   0.050 usec       sad=27214  
 MMXEXT - sad16bi 0.060 usec       sad=26274  
 MMXEXT - dev16   0.086 usec       sad=3344  
  ---  
 3DNOW  - sad8    0.506 usec       sad=3776  
 3DNOW  - sad16   1.954 usec       sad=27214  
 3DNOW  - sad16bi 0.119 usec       sad=26274  
 3DNOW  - dev16   4.252 usec       sad=3344  
  ---  
 3DNOWE - sad8    0.017 usec       sad=3776  
 3DNOWE - sad16   0.038 usec       sad=27214  
 3DNOWE - sad16bi 0.052 usec       sad=26274  
 3DNOWE - dev16   0.067 usec       sad=3344  
  ---  
   
  ===  test transfer ===  
 PLAINC - 8to16     0.603 usec       crc32=0x115814bb  
 PLAINC - 16to8     1.077 usec       crc32=0xee7ccbb4  
 PLAINC - 8to8      0.679 usec       crc32=0xd37b3295  
 PLAINC - 16to8add  1.341 usec       crc32=0xdd817bf4  
 PLAINC - 8to16sub  1.566 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 PLAINC - 8to16sub2 2.206 usec       crc32=0x99b6c4c7  
  ---  
 MMX    - 8to16     -0.025 usec       crc32=0x115814bb  
 MMX    - 16to8     -0.049 usec       crc32=0xee7ccbb4  
 MMX    - 8to8      0.014 usec       crc32=0xd37b3295  
 MMX    - 16to8add  0.011 usec       crc32=0xdd817bf4  
 MMX    - 8to16sub  0.108 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMX    - 8to16sub2 0.164 usec       crc32=0x99b6c4c7  
  ---  
 MMXEXT - 8to16     -0.054 usec       crc32=0x115814bb  
 MMXEXT - 16to8     0.010 usec       crc32=0xee7ccbb4  
 MMXEXT - 8to8      0.015 usec       crc32=0xd37b3295  
 MMXEXT - 16to8add  0.008 usec       crc32=0xdd817bf4  
 MMXEXT - 8to16sub  0.263 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 MMXEXT - 8to16sub2 0.178 usec       crc32=0x99b6c4c7  
  ---  
 3DNOW  - 8to16     0.666 usec       crc32=0x115814bb  
 3DNOW  - 16to8     1.078 usec       crc32=0xee7ccbb4  
 3DNOW  - 8to8      0.665 usec       crc32=0xd37b3295  
 3DNOW  - 16to8add  1.365 usec       crc32=0xdd817bf4  
 3DNOW  - 8to16sub  1.356 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOW  - 8to16sub2 2.098 usec       crc32=0x99b6c4c7  
  ---  
 3DNOWE - 8to16     -0.024 usec       crc32=0x115814bb  
 3DNOWE - 16to8     0.010 usec       crc32=0xee7ccbb4  
 3DNOWE - 8to8      0.014 usec       crc32=0xd37b3295  
 3DNOWE - 16to8add  0.016 usec       crc32=0xdd817bf4  
 3DNOWE - 8to16sub  -0.000 usec       crc32(1)=0xa1e07163 crc32(2)=0xd86c5d23  
 3DNOWE - 8to16sub2 -0.031 usec       crc32=0x99b6c4c7  
  ---  
   
  =====  test quant =====  
 PLAINC -   quant_mpeg_intra 98.631 usec       crc32=0xfd6a21a4  
 PLAINC -   quant_mpeg_inter 104.876 usec       crc32=0xf6de7757  
 PLAINC - dequant_mpeg_intra 50.285 usec       crc32=0x2def7bc7  
 PLAINC - dequant_mpeg_inter 58.316 usec       crc32=0xd878c722  
 PLAINC -   quant_h263_intra 33.803 usec       crc32=0x2eba9d43  
 PLAINC -   quant_h263_inter 45.411 usec       crc32=0xbd315a7e  
 PLAINC - dequant_h263_intra 39.302 usec       crc32=0x9841212a  
 PLAINC - dequant_h263_inter 44.124 usec       crc32=0xe7df8fba  
  ---  
 MMX    -   quant_mpeg_intra 4.273 usec       crc32=0xdacabdb6 | ERROR  
 MMX    -   quant_mpeg_inter 3.576 usec       crc32=0x72883ab6 | ERROR  
 MMX    - dequant_mpeg_intra 3.793 usec       crc32=0x2def7bc7  
 MMX    - dequant_mpeg_inter 4.808 usec       crc32=0xd878c722  
 MMX    -   quant_h263_intra 2.881 usec       crc32=0x2eba9d43  
 MMX    -   quant_h263_inter 2.550 usec       crc32=0xbd315a7e  
 MMX    - dequant_h263_intra 2.974 usec       crc32=0x9841212a  
 MMX    - dequant_h263_inter 2.906 usec       crc32=0xe7df8fba  
  ---  
 MMXEXT -   quant_mpeg_intra 4.221 usec       crc32=0xfd6a21a4  
 MMXEXT -   quant_mpeg_inter 4.339 usec       crc32=0xf6de7757  
 MMXEXT - dequant_mpeg_intra 3.802 usec       crc32=0x2def7bc7  
 MMXEXT - dequant_mpeg_inter 4.821 usec       crc32=0xd878c722  
 MMXEXT -   quant_h263_intra 2.884 usec       crc32=0x2eba9d43  
 MMXEXT -   quant_h263_inter 2.554 usec       crc32=0xbd315a7e  
 MMXEXT - dequant_h263_intra 2.728 usec       crc32=0x9841212a  
 MMXEXT - dequant_h263_inter 2.611 usec       crc32=0xe7df8fba  
  ---  
 3DNOW  -   quant_mpeg_intra 98.512 usec       crc32=0xfd6a21a4  
 3DNOW  -   quant_mpeg_inter 104.873 usec       crc32=0xf6de7757  
 3DNOW  - dequant_mpeg_intra 50.219 usec       crc32=0x2def7bc7  
 3DNOW  - dequant_mpeg_inter 58.254 usec       crc32=0xd878c722  
 3DNOW  -   quant_h263_intra 33.778 usec       crc32=0x2eba9d43  
 3DNOW  -   quant_h263_inter 41.998 usec       crc32=0xbd315a7e  
 3DNOW  - dequant_h263_intra 39.344 usec       crc32=0x9841212a  
 3DNOW  - dequant_h263_inter 43.607 usec       crc32=0xe7df8fba  
  ---  
 3DNOWE -   quant_mpeg_intra 98.490 usec       crc32=0xfd6a21a4  
 3DNOWE -   quant_mpeg_inter 104.889 usec       crc32=0xf6de7757  
 3DNOWE - dequant_mpeg_intra 3.277 usec       crc32=0x2def7bc7  
 3DNOWE - dequant_mpeg_inter 4.485 usec       crc32=0xd878c722  
 3DNOWE -   quant_h263_intra 1.882 usec       crc32=0x2eba9d43  
 3DNOWE -   quant_h263_inter 2.246 usec       crc32=0xbd315a7e  
 3DNOWE - dequant_h263_intra 3.457 usec       crc32=0x9841212a  
 3DNOWE - dequant_h263_inter 3.275 usec       crc32=0xe7df8fba  
  ---  
   
  =====  test cbp =====  
 PLAINC -   calc_cbp#1 0.168 usec       cbp=0x15  
 PLAINC -   calc_cbp#2 0.168 usec       cbp=0x38  
 PLAINC -   calc_cbp#3 0.157 usec       cbp=0x0f  
 PLAINC -   calc_cbp#4 0.235 usec       cbp=0x05  
  ---  
 MMX    -   calc_cbp#1 0.070 usec       cbp=0x15  
 MMX    -   calc_cbp#2 0.062 usec       cbp=0x38  
 MMX    -   calc_cbp#3 0.062 usec       cbp=0x0f  
 MMX    -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 MMXEXT -   calc_cbp#1 0.062 usec       cbp=0x15  
 MMXEXT -   calc_cbp#2 0.061 usec       cbp=0x38  
 MMXEXT -   calc_cbp#3 0.061 usec       cbp=0x0f  
 MMXEXT -   calc_cbp#4 0.061 usec       cbp=0x05  
  ---  
 3DNOW  -   calc_cbp#1 0.168 usec       cbp=0x15  
 3DNOW  -   calc_cbp#2 0.168 usec       cbp=0x38  
 3DNOW  -   calc_cbp#3 0.157 usec       cbp=0x0f  
 3DNOW  -   calc_cbp#4 0.238 usec       cbp=0x05  
  ---  
 3DNOWE -   calc_cbp#1 0.049 usec       cbp=0x15  
 3DNOWE -   calc_cbp#2 0.049 usec       cbp=0x38  
 3DNOWE -   calc_cbp#3 0.049 usec       cbp=0x0f  
 3DNOWE -   calc_cbp#4 0.049 usec       cbp=0x05  
  ---  
   
   
 NB: If a function isn't optimised for a specific set of intructions,  
     a C function is used instead. So don't panic if some functions  
     may appear to be slow.  
   
 NB: MMX mpeg4 quantization is known to have very small errors (+/-1 magnitude)  
     for 1 or 2 coefficients a block. This is mainly caused by the fact the unit  
     test goes far behind the usual limits of real encoding. Please do not report  
     this error to the developers  
   
 *********************************************************************/  

Legend:
Removed from v.1.9.2.10  
changed lines
  Added in v.1.27.2.1

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4