Diff of /xvidcore/src/utils/x86_asm/mem_transfer_mmx.asm

-revision 1.6, Thu Jun 20 10:22:02 2002 UTC
+revision 1.20.2.1, Thu May 28 08:42:37 2009 UTC
 Line 1
- ;/**************************************************************************
+ ;/****************************************************************************
  ; *
  ; *     XVID MPEG-4 VIDEO CODEC
- ; *     mmx 8bit<->16bit transfers
+ ; *  - 8<->16 bit transfer functions -
  ; *
- ; *     This program is an implementation of a part of one or more MPEG-4
+ ; *  Copyright (C) 2001 Peter Ross <pross@xvid.org>
- ; *     Video tools as specified in ISO/IEC 14496-2 standard.  Those intending
+ ; *                2001-2008 Michael Militzer <michael@xvid.org>
- ; *     to use this software module in hardware or software products are
+ ; *                2002 Pascal Massimino <skal@planet-d.net>
- ; *     advised that its use may infringe existing patents or copyrights, and
- ; *     any such use would be at such party's own risk.  The original
- ; *     developer of this software module and his/her company, and subsequent
- ; *     editors and their companies, will have no liability for use of this
- ; *     software or modifications or derivatives thereof.
  ; *
  ; *     This program is free software; you can redistribute it and/or modify
  ; *     it under the terms of the GNU General Public License as published by
-Line 24
+Line 19
  ; *
  ; *     You should have received a copy of the GNU General Public License
  ; *     along with this program; if not, write to the Free Software
- ; *     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+ ; *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
  ; *
- ; *************************************************************************/
+ ; * $Id$
- ;/**************************************************************************
- ; *
- ; *     History:
- ; *
- ; * 04.06.2002  speed enhancement (unroll+overlap). -Skal-
- ; *             + added transfer_8to16sub2_mmx/xmm
- ; * 07.01.2002  merge functions from compensate_mmx; rename functions
- ; *     07.11.2001      initial version; (c)2001 peter ross <pross@cs.rmit.edu.au>
  ; *
- ; *************************************************************************/
+ ; ***************************************************************************/
+ %include "nasm.inc"
- bits 32
+ ;=============================================================================
+ ; Read only data
+ ;=============================================================================
- %macro cglobal 1
+ DATA
-         %ifdef PREFIX
-                 global _%1
-                 %define %1 _%1
-         %else
-                 global %1
-         %endif
- %endmacro
+ ALIGN SECTION_ALIGN
+ mmx_one:
+         dw 1, 1, 1, 1
- section .text
+ ;=============================================================================
+ ; Code
+ ;=============================================================================
+ TEXT
  cglobal transfer_8to16copy_mmx
  cglobal transfer_16to8copy_mmx
  cglobal transfer_8to16sub_mmx
+ cglobal transfer_8to16subro_mmx
  cglobal transfer_8to16sub2_mmx
  cglobal transfer_8to16sub2_xmm
+ cglobal transfer_8to16sub2ro_xmm
  cglobal transfer_16to8add_mmx
  cglobal transfer8x8_copy_mmx
+ cglobal transfer8x4_copy_mmx
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_8to16copy_mmx(int16_t * const dst,
  ;                                                       const uint8_t * const src,
  ;                                                       uint32_t stride);
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_8_TO_16 1
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm1, [eax+edx]
+   movq mm1, [_EAX+TMP1]
    movq mm2, mm0
    movq mm3, mm1
    punpcklbw mm0, mm7
-   movq [ecx+%1*32], mm0
+   movq [TMP0+%1*32], mm0
    punpcklbw mm1, mm7
-   movq [ecx+%1*32+16], mm1
+   movq [TMP0+%1*32+16], mm1
    punpckhbw mm2, mm7
    punpckhbw mm3, mm7
-   lea eax,[eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
-   movq [ecx+%1*32+8], mm2
+   movq [TMP0+%1*32+8], mm2
-   movq [ecx+%1*32+24], mm3
+   movq [TMP0+%1*32+24], mm3
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_8to16copy_mmx:
-   mov ecx, [esp+ 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp+ 8] ; Src
+   mov _EAX, prm2 ; Src
-   mov edx, [esp+12] ; Stride
+   mov TMP1, prm3 ; Stride
    pxor mm7,mm7
    COPY_8_TO_16 0
-Line 99
+Line 91
    COPY_8_TO_16 2
    COPY_8_TO_16 3
    ret
+ ENDFUNC
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_16to8copy_mmx(uint8_t * const dst,
  ;                                                       const int16_t * const src,
  ;                                                       uint32_t stride);
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_16_TO_8 1
-   movq mm0, [eax+%1*32]
+   movq mm0, [_EAX+%1*32]
-   movq mm1, [eax+%1*32+8]
+   movq mm1, [_EAX+%1*32+8]
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
-   movq mm2, [eax+%1*32+16]
+   movq mm2, [_EAX+%1*32+16]
-   movq mm3, [eax+%1*32+24]
+   movq mm3, [_EAX+%1*32+24]
    packuswb mm2, mm3
-   movq [ecx+edx], mm2
+   movq [TMP0+TMP1], mm2
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_16to8copy_mmx:
-   mov ecx, [esp+ 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp+ 8] ; Src
+   mov _EAX, prm2 ; Src
-   mov edx, [esp+12] ; Stride
+   mov TMP1, prm3 ; Stride
    COPY_16_TO_8 0
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8 1
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8 2
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8 3
    ret
+ ENDFUNC
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_8to16sub_mmx(int16_t * const dct,
  ;                               uint8_t * const cur,
  ;                               const uint8_t * const ref,
  ;                               const uint32_t stride);
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
- ;/**************************************************************************
- ; *
- ; *     History:
- ; *
- ; * 27.12.2001  renamed from 'compensate' to 'transfer_8to16sub'
- ; * 02.12.2001  loop unrolled, code runs 10% faster now (Isibaar)
- ; * 30.11.2001  16 pixels are processed per iteration (Isibaar)
- ; * 30.11.2001  .text missing
- ; *     06.11.2001      inital version; (c)2001 peter ross <pross@cs.rmit.edu.au>
- ; *
- ; *************************************************************************/
- %macro COPY_8_TO_16_SUB 1
+ ; when second argument == 1, reference (ebx) block is to current (_EAX)
-   movq mm0, [eax]      ; cur
+ %macro COPY_8_TO_16_SUB 2
-   movq mm2, [eax+edx]
+   movq mm0, [_EAX]      ; cur
+   movq mm2, [_EAX+TMP1]
    movq mm1, mm0
    movq mm3, mm2
    punpcklbw mm0, mm7
    punpcklbw mm2, mm7
-   movq mm4, [ebx]      ; ref
+   movq mm4, [_EBX]      ; ref
          punpckhbw mm1, mm7
          punpckhbw mm3, mm7
-   movq mm5, [ebx+edx]  ; ref
+   movq mm5, [_EBX+TMP1]  ; ref
    movq mm6, mm4
-   movq [eax], mm4
+ %if %2 == 1
-   movq [eax+edx], mm5
+   movq [_EAX], mm4
+   movq [_EAX+TMP1], mm5
+ %endif
    punpcklbw mm4, mm7
    punpckhbw mm6, mm7
    psubsw mm0, mm4
-Line 179
+Line 165
    punpcklbw mm5, mm7
    punpckhbw mm6, mm7
    psubsw mm2, mm5
-   lea eax,[eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
    psubsw mm3, mm6
-   lea ebx,[ebx+2*edx]
+   lea _EBX,[_EBX+2*TMP1]
-   movq [ecx+%1*32+ 0], mm0 ; dst
+   movq [TMP0+%1*32+ 0], mm0 ; dst
-         movq [ecx+%1*32+ 8], mm1
+   movq [TMP0+%1*32+ 8], mm1
-         movq [ecx+%1*32+16], mm2
+   movq [TMP0+%1*32+16], mm2
-         movq [ecx+%1*32+24], mm3
+   movq [TMP0+%1*32+24], mm3
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_8to16sub_mmx:
-   mov ecx, [esp  + 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp  + 8] ; Cur
+   mov _EAX, prm2 ; Cur
-   push ebx
+   mov TMP1, prm4 ; Stride
-   mov ebx, [esp+4+12] ; Ref
-   mov edx, [esp+4+16] ; Stride
+   push _EBX
+ %ifdef ARCH_IS_X86_64
+   mov _EBX, prm3
+ %else
+   mov _EBX, [_ESP+4+12] ; Ref
+ %endif
    pxor mm7, mm7
-   COPY_8_TO_16_SUB 0
+   COPY_8_TO_16_SUB 0, 1
-   COPY_8_TO_16_SUB 1
+   COPY_8_TO_16_SUB 1, 1
-   COPY_8_TO_16_SUB 2
+   COPY_8_TO_16_SUB 2, 1
-   COPY_8_TO_16_SUB 3
+   COPY_8_TO_16_SUB 3, 1
-   pop ebx
+   pop _EBX
    ret
+ ENDFUNC
+ ALIGN SECTION_ALIGN
+ transfer_8to16subro_mmx:
+   mov TMP0, prm1 ; Dst
+   mov _EAX, prm2 ; Cur
+   mov TMP1, prm4 ; Stride
+   push _EBX
+ %ifdef ARCH_IS_X86_64
+   mov _EBX, prm3
+ %else
+   mov _EBX, [_ESP+4+12] ; Ref
+ %endif
+   pxor mm7, mm7
- ;===========================================================================
+   COPY_8_TO_16_SUB 0, 0
+   COPY_8_TO_16_SUB 1, 0
+   COPY_8_TO_16_SUB 2, 0
+   COPY_8_TO_16_SUB 3, 0
+   pop _EBX
+   ret
+ ENDFUNC
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_8to16sub2_mmx(int16_t * const dct,
  ;                               uint8_t * const cur,
-Line 214
+Line 231
  ;                               const uint8_t * ref2,
  ;                               const uint32_t stride)
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_8_TO_16_SUB2_MMX 1
-   movq mm0, [eax]      ; cur
+   movq mm0, [_EAX]      ; cur
-   movq mm2, [eax+edx]
+   movq mm2, [_EAX+TMP1]
      ; mm4 <- (ref1+ref2+1) / 2
-   movq mm4, [ebx]      ; ref1
+   movq mm4, [_EBX]      ; ref1
-   movq mm1, [esi]      ; ref2
+   movq mm1, [_ESI]      ; ref2
    movq mm6, mm4
    movq mm3, mm1
    punpcklbw mm4, mm7
-Line 231
+Line 248
    punpckhbw mm3, mm7
    paddusw mm4, mm1
    paddusw mm6, mm3
+   paddusw mm4, [mmx_one]
+   paddusw mm6, [mmx_one]
    psrlw mm4,1
    psrlw mm6,1
    packuswb mm4, mm6
+   movq [_EAX], mm4
      ; mm5 <- (ref1+ref2+1) / 2
-   movq mm5, [ebx+edx]  ; ref1
+   movq mm5, [_EBX+TMP1]  ; ref1
-   movq mm1, [esi+edx]  ; ref2
+   movq mm1, [_ESI+TMP1]  ; ref2
    movq mm6, mm5
    movq mm3, mm1
    punpcklbw mm5, mm7
-Line 246
+Line 266
    punpckhbw mm3, mm7
    paddusw mm5, mm1
    paddusw mm6, mm3
-   lea esi,[esi+2*edx]
+   paddusw mm5, [mmx_one]
+   paddusw mm6, [mmx_one]
+   lea _ESI, [_ESI+2*TMP1]
    psrlw mm5,1
    psrlw mm6,1
    packuswb mm5, mm6
+   movq [_EAX+TMP1], mm5
    movq mm1, mm0
    movq mm3, mm2
-Line 268
+Line 290
    punpcklbw mm5, mm7
    punpckhbw mm6, mm7
    psubsw mm2, mm5
-   lea eax,[eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
    psubsw mm3, mm6
-   lea ebx,[ebx+2*edx]
+   lea _EBX, [_EBX+2*TMP1]
-   movq [ecx+%1*32+ 0], mm0 ; dst
+   movq [TMP0+%1*32+ 0], mm0 ; dst
-         movq [ecx+%1*32+ 8], mm1
+   movq [TMP0+%1*32+ 8], mm1
-         movq [ecx+%1*32+16], mm2
+   movq [TMP0+%1*32+16], mm2
-         movq [ecx+%1*32+24], mm3
+   movq [TMP0+%1*32+24], mm3
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_8to16sub2_mmx:
-   mov ecx, [esp  + 4] ; Dst
+   mov TMP0, prm1   ; Dst
-   mov eax, [esp  + 8] ; Cur
+   mov TMP1d, prm5d ; Stride
-   push ebx
+   mov _EAX, prm2   ; Cur
-   mov ebx, [esp+4+12] ; Ref1
-   push esi
+   push _EBX
-   mov esi, [esp+8+16] ; Ref2
+ %ifdef ARCH_IS_X86_64
-   mov edx, [esp+8+20] ; Stride
+   mov _EBX, prm3
+ %else
+   mov _EBX, [_ESP+4+12] ; Ref1
+ %endif
+   push _ESI
+ %ifdef ARCH_IS_X86_64
+   mov _ESI, prm4
+ %else
+   mov _ESI, [_ESP+8+16] ; Ref2
+ %endif
    pxor mm7, mm7
    COPY_8_TO_16_SUB2_MMX 0
-Line 294
+Line 327
    COPY_8_TO_16_SUB2_MMX 2
    COPY_8_TO_16_SUB2_MMX 3
-   pop esi
+   pop _ESI
-   pop ebx
+   pop _EBX
    ret
+ ENDFUNC
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_8to16sub2_xmm(int16_t * const dct,
  ;                               uint8_t * const cur,
-Line 306
+Line 340
  ;                               const uint8_t * ref2,
  ;                               const uint32_t stride)
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_8_TO_16_SUB2_SSE 1
-   movq mm0, [eax]      ; cur
+   movq mm0, [_EAX]      ; cur
-   movq mm2, [eax+edx]
+   movq mm2, [_EAX+TMP1]
    movq mm1, mm0
    movq mm3, mm2
    punpcklbw mm0, mm7
    punpcklbw mm2, mm7
-   movq mm4, [ebx]      ; ref1
+   movq mm4, [_EBX]     ; ref1
-   pavgb mm4, [esi]     ; ref2
+   pavgb mm4, [_ESI]     ; ref2
+   movq [_EAX], mm4
          punpckhbw mm1, mm7
          punpckhbw mm3, mm7
-   movq mm5, [ebx+edx]  ; ref
+   movq mm5, [_EBX+TMP1] ; ref
-   pavgb mm5, [esi+edx] ; ref2
+   pavgb mm5, [_ESI+TMP1] ; ref2
+   movq [_EAX+TMP1], mm5
    movq mm6, mm4
    punpcklbw mm4, mm7
    punpckhbw mm6, mm7
    psubsw mm0, mm4
    psubsw mm1, mm6
-   lea esi,[esi+2*edx]
+   lea _ESI, [_ESI+2*TMP1]
    movq mm6, mm5
    punpcklbw mm5, mm7
    punpckhbw mm6, mm7
    psubsw mm2, mm5
-   lea eax,[eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
    psubsw mm3, mm6
-   lea ebx,[ebx+2*edx]
+   lea _EBX, [_EBX+2*TMP1]
-   movq [ecx+%1*32+ 0], mm0 ; dst
+   movq [TMP0+%1*32+ 0], mm0 ; dst
-         movq [ecx+%1*32+ 8], mm1
+   movq [TMP0+%1*32+ 8], mm1
-         movq [ecx+%1*32+16], mm2
+   movq [TMP0+%1*32+16], mm2
-         movq [ecx+%1*32+24], mm3
+   movq [TMP0+%1*32+24], mm3
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_8to16sub2_xmm:
-   mov ecx, [esp  + 4] ; Dst
+   mov TMP0, prm1   ; Dst
-   mov eax, [esp  + 8] ; Cur
+   mov _EAX, prm2   ; Cur
-   push ebx
+   mov TMP1d, prm5d ; Stride
-   mov ebx, [esp+4+12] ; Ref1
-   push esi
+   push _EBX
-   mov esi, [esp+8+16] ; Ref2
+ %ifdef ARCH_IS_X86_64
-   mov edx, [esp+8+20] ; Stride
+   mov _EBX, prm3 ; Ref1
+ %else
+   mov _EBX, [_ESP+4+12] ; Ref1
+ %endif
+   push _ESI
+ %ifdef ARCH_IS_X86_64
+   mov _ESI, prm4 ; Ref1
+ %else
+   mov _ESI, [_ESP+8+16] ; Ref2
+ %endif
    pxor mm7, mm7
    COPY_8_TO_16_SUB2_SSE 0
-Line 359
+Line 406
    COPY_8_TO_16_SUB2_SSE 2
    COPY_8_TO_16_SUB2_SSE 3
-   pop esi
+   pop _ESI
-   pop ebx
+   pop _EBX
    ret
+ ENDFUNC
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
+ ;
+ ; void transfer_8to16sub2ro_xmm(int16_t * const dct,
+ ;                               const uint8_t * const cur,
+ ;                               const uint8_t * ref1,
+ ;                               const uint8_t * ref2,
+ ;                               const uint32_t stride)
+ ;
+ ;-----------------------------------------------------------------------------
+ %macro COPY_8_TO_16_SUB2RO_SSE 1
+   movq mm0, [_EAX]      ; cur
+   movq mm2, [_EAX+TMP1]
+   movq mm1, mm0
+   movq mm3, mm2
+   punpcklbw mm0, mm7
+   punpcklbw mm2, mm7
+   movq mm4, [_EBX]     ; ref1
+   pavgb mm4, [_ESI]     ; ref2
+   punpckhbw mm1, mm7
+   punpckhbw mm3, mm7
+   movq mm5, [_EBX+TMP1] ; ref
+   pavgb mm5, [_ESI+TMP1] ; ref2
+   movq mm6, mm4
+   punpcklbw mm4, mm7
+   punpckhbw mm6, mm7
+   psubsw mm0, mm4
+   psubsw mm1, mm6
+   lea _ESI, [_ESI+2*TMP1]
+   movq mm6, mm5
+   punpcklbw mm5, mm7
+   punpckhbw mm6, mm7
+   psubsw mm2, mm5
+   lea _EAX, [_EAX+2*TMP1]
+   psubsw mm3, mm6
+   lea _EBX, [_EBX+2*TMP1]
+   movq [TMP0+%1*32+ 0], mm0 ; dst
+   movq [TMP0+%1*32+ 8], mm1
+   movq [TMP0+%1*32+16], mm2
+   movq [TMP0+%1*32+24], mm3
+ %endmacro
+ ALIGN SECTION_ALIGN
+ transfer_8to16sub2ro_xmm:
+   pxor mm7, mm7
+   mov TMP0, prm1   ; Dst
+   mov _EAX, prm2   ; Cur
+   mov TMP1d, prm5d ; Stride
+   push _EBX
+ %ifdef ARCH_IS_X86_64
+   mov _EBX, prm3
+ %else
+   mov _EBX, [_ESP+4+12] ; Ref1
+ %endif
+   push _ESI
+ %ifdef ARCH_IS_X86_64
+   mov _ESI, prm4
+ %else
+   mov _ESI, [_ESP+8+16] ; Ref2
+ %endif
+   COPY_8_TO_16_SUB2RO_SSE 0
+   COPY_8_TO_16_SUB2RO_SSE 1
+   COPY_8_TO_16_SUB2RO_SSE 2
+   COPY_8_TO_16_SUB2RO_SSE 3
+   pop _ESI
+   pop _EBX
+   ret
+ ENDFUNC
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer_16to8add_mmx(uint8_t * const dst,
  ;                                               const int16_t * const src,
  ;                                               uint32_t stride);
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_16_TO_8_ADD 1
-   movq mm0, [ecx]
+   movq mm0, [TMP0]
-   movq mm2, [ecx+edx]
+   movq mm2, [TMP0+TMP1]
    movq mm1, mm0
    movq mm3, mm2
    punpcklbw mm0, mm7
    punpcklbw mm2, mm7
    punpckhbw mm1, mm7
    punpckhbw mm3, mm7
-   paddsw mm0, [eax+%1*32+ 0]
+   paddsw mm0, [_EAX+%1*32+ 0]
-   paddsw mm1, [eax+%1*32+ 8]
+   paddsw mm1, [_EAX+%1*32+ 8]
-   paddsw mm2, [eax+%1*32+16]
+   paddsw mm2, [_EAX+%1*32+16]
-   paddsw mm3, [eax+%1*32+24]
+   paddsw mm3, [_EAX+%1*32+24]
    packuswb mm0, mm1
-   movq [ecx], mm0
+   movq [TMP0], mm0
    packuswb mm2, mm3
-   movq [ecx+edx], mm2
+   movq [TMP0+TMP1], mm2
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer_16to8add_mmx:
-   mov ecx, [esp+ 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp+ 8] ; Src
+   mov _EAX, prm2 ; Src
-   mov edx, [esp+12] ; Stride
+   mov TMP1, prm3 ; Stride
    pxor mm7, mm7
    COPY_16_TO_8_ADD 0
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8_ADD 1
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8_ADD 2
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_16_TO_8_ADD 3
    ret
+ ENDFUNC
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  ;
  ; void transfer8x8_copy_mmx(uint8_t * const dst,
  ;                                       const uint8_t * const src,
  ;                                       const uint32_t stride);
  ;
  ;
- ;===========================================================================
+ ;-----------------------------------------------------------------------------
  %macro COPY_8_TO_8 0
-   movq mm0, [eax]
+   movq mm0, [_EAX]
-   movq mm1, [eax+edx]
+   movq mm1, [_EAX+TMP1]
-   movq [ecx], mm0
+   movq [TMP0], mm0
-   lea eax,[eax+2*edx]
+   lea _EAX, [_EAX+2*TMP1]
-   movq [ecx+edx], mm1
+   movq [TMP0+TMP1], mm1
  %endmacro
- align 16
+ ALIGN SECTION_ALIGN
  transfer8x8_copy_mmx:
-   mov ecx, [esp+ 4] ; Dst
+   mov TMP0, prm1 ; Dst
-   mov eax, [esp+ 8] ; Src
+   mov _EAX, prm2 ; Src
-   mov edx, [esp+12] ; Stride
+   mov TMP1, prm3 ; Stride
    COPY_8_TO_8
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
+   COPY_8_TO_8
+   lea TMP0,[TMP0+2*TMP1]
+   COPY_8_TO_8
+   lea TMP0,[TMP0+2*TMP1]
    COPY_8_TO_8
-   lea ecx,[ecx+2*edx]
+   ret
+ ENDFUNC
+ ;-----------------------------------------------------------------------------
+ ;
+ ; void transfer8x4_copy_mmx(uint8_t * const dst,
+ ;                                       const uint8_t * const src,
+ ;                                       const uint32_t stride);
+ ;
+ ;
+ ;-----------------------------------------------------------------------------
+ ALIGN SECTION_ALIGN
+ transfer8x4_copy_mmx:
+   mov TMP0, prm1 ; Dst
+   mov _EAX, prm2 ; Src
+   mov TMP1, prm3 ; Stride
    COPY_8_TO_8
-   lea ecx,[ecx+2*edx]
+   lea TMP0,[TMP0+2*TMP1]
    COPY_8_TO_8
    ret
+ ENDFUNC
+ %ifidn __OUTPUT_FORMAT__,elf
+ section ".note.GNU-stack" noalloc noexec nowrite progbits
+ %endif

 Legend:



Removed from v.1.6
 


changed lines


 
Added in v.1.20.2.1
 Legend:



Removed from v.1.6
 


changed lines


 
Added in v.1.20.2.1
-Removed from v.1.6
+Added in v.1.20.2.1

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4