Diff of /xvidcore/src/bitstream/x86_asm/cbp_mmx.asm

-revision 1.10, Sat Jul 24 11:46:08 2004 UTC
+revision 1.14, Sat Sep 24 03:10:37 2005 UTC
 Line 3
  ; *  XVID MPEG-4 VIDEO CODEC
  ; *  - MMX CBP computation -
  ; *
- ; *  Copyright (C) 2001-2003 Peter Ross <pross@xvid.org>
+ ; *  Copyright (C) 2005      Carlo Bramini <carlo.bramix@libero.it>
+ ; *                2001-2003 Peter Ross <pross@xvid.org>
  ; *                2002-2003 Pascal Massimino <skal@planet-d.net>
  ; *
  ; *  This program is free software ; you can redistribute it and/or modify
-Line 32
+Line 33
  %macro cglobal 1
          %ifdef PREFIX
+                 %ifdef MARK_FUNCS
+                         global _%1:function %1.endfunc-%1
+                         %define %1 _%1:function %1.endfunc-%1
+                 %else
                  global _%1
                  %define %1 _%1
+                 %endif
+         %else
+                 %ifdef MARK_FUNCS
+                         global %1:function %1.endfunc-%1
          %else
                  global %1
          %endif
+         %endif
  %endmacro
  ;=============================================================================
-Line 51
+Line 61
  ALIGN 16
+ mult_mask:
+   db 0x10,0x20,0x04,0x08,0x01,0x02,0x00,0x00
  ignore_dc:
-         dw 0, -1, -1, -1, -1, -1, -1, -1
+   dw 0, -1, -1, -1
  ;=============================================================================
  ; Code
-Line 66
+Line 78
  ; uint32_t calc_cbp_mmx(const int16_t coeff[6][64]);
  ;-----------------------------------------------------------------------------
+ %macro      MAKE_LOAD         1
+   por mm0, [eax-128*1+%1*8]
+   por mm1, [eax+128*0+%1*8]
+   por mm2, [eax+128*1+%1*8]
+   por mm3, [eax+128*2+%1*8]
+   por mm4, [eax+128*3+%1*8]
+   por mm5, [eax+128*4+%1*8]
+ %endmacro
  ALIGN 16
  calc_cbp_mmx:
-   push ebx
+   mov eax, [esp + 4]            ; coeff
-   push esi
-   mov esi, [esp + 8 + 4]        ; coeff
-   xor eax, eax                  ; cbp = 0
-   mov edx, (1 << 5)
    movq mm7, [ignore_dc]
+   pxor mm6, mm6                ; used only for comparing
- .loop
+   movq mm0, [eax+128*0]
-   movq mm0, [esi]
+   movq mm1, [eax+128*1]
-   movq mm1, [esi+8]
+   movq mm2, [eax+128*2]
+   movq mm3, [eax+128*3]
+   movq mm4, [eax+128*4]
+   movq mm5, [eax+128*5]
+   add eax, 8+128
    pand mm0, mm7
+   pand mm1, mm7
+   pand mm2, mm7
+   pand mm3, mm7
+   pand mm4, mm7
+   pand mm5, mm7
+   MAKE_LOAD 0
+   MAKE_LOAD 1
+   MAKE_LOAD 2
+   MAKE_LOAD 3
+   MAKE_LOAD 4
+   MAKE_LOAD 5
+   MAKE_LOAD 6
+   MAKE_LOAD 7
+   MAKE_LOAD 8
+   MAKE_LOAD 9
+   MAKE_LOAD 10
+   MAKE_LOAD 11
+   MAKE_LOAD 12
+   MAKE_LOAD 13
+   MAKE_LOAD 14
+   movq mm7, [mult_mask]
+   packssdw mm0, mm1
+   packssdw mm2, mm3
+   packssdw mm4, mm5
+   packssdw mm0, mm2
+   packssdw mm4, mm6
+   pcmpeqw mm0, mm6
+   pcmpeqw mm4, mm6
+   pcmpeqw mm0, mm6
+   pcmpeqw mm4, mm6
+   psrlw mm0, 15
+   psrlw mm4, 15
+   packuswb mm0, mm4
+   pmaddwd mm0, mm7
-   por mm0, [esi+16]
-   por mm1, [esi+24]
-   por mm0, [esi+32]
-   por mm1, [esi+40]
-   por mm0, [esi+48]
-   por mm1, [esi+56]
-   por mm0, [esi+64]
-   por mm1, [esi+72]
-   por mm0, [esi+80]
-   por mm1, [esi+88]
-   por mm0, [esi+96]
-   por mm1, [esi+104]
-   por mm0, [esi+112]
-   por mm1, [esi+120]
-   por mm0, mm1
    movq mm1, mm0
    psrlq mm1, 32
-   lea esi, [esi + 128]
+   paddusb mm0, mm1
-   por mm0, mm1
-   movd ebx, mm0
-   test ebx, ebx
-   jz .next
-   or eax, edx     ; cbp |= 1 << (5-i)
- .next
-   shr edx,1
-   jnc .loop
-   pop esi
-   pop ebx
+   movd eax, mm0
+   shr eax, 8
+   and eax, 0x3F
    ret
+ .endfunc

 Legend:



Removed from v.1.10
 


changed lines


 
Added in v.1.14
 Legend:



Removed from v.1.10
 


changed lines


 
Added in v.1.14
-Removed from v.1.10
+Added in v.1.14

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4