linux/arch/sparc/lib/NGbzero.S
<<
>>
Prefs
   1/* SPDX-License-Identifier: GPL-2.0 */
   2/* NGbzero.S: Niagara optimized memset/clear_user.
   3 *
   4 * Copyright (C) 2006 David S. Miller (davem@davemloft.net)
   5 */
   6#include <asm/asi.h>
   7
   8#define EX_ST(x,y)              \
   998:     x,y;                    \
  10        .section __ex_table,"a";\
  11        .align 4;               \
  12        .word 98b, __retl_o1_asi;\
  13        .text;                  \
  14        .align 4;
  15
  16        .text
  17
  18        .globl          NGmemset
  19        .type           NGmemset, #function
  20NGmemset:               /* %o0=buf, %o1=pat, %o2=len */
  21        and             %o1, 0xff, %o3
  22        mov             %o2, %o1
  23        sllx            %o3, 8, %g1
  24        or              %g1, %o3, %o2
  25        sllx            %o2, 16, %g1
  26        or              %g1, %o2, %o2
  27        sllx            %o2, 32, %g1
  28        ba,pt           %xcc, 1f
  29         or             %g1, %o2, %o2
  30
  31        .globl          NGbzero
  32        .type           NGbzero, #function
  33NGbzero:
  34        clr             %o2
  351:      brz,pn          %o1, NGbzero_return
  36         mov            %o0, %o3
  37
  38        /* %o5: saved %asi, restored at NGbzero_done
  39         * %g7: store-init %asi to use
  40         * %o4: non-store-init %asi to use
  41         */
  42        rd              %asi, %o5
  43        mov             ASI_BLK_INIT_QUAD_LDD_P, %g7
  44        mov             ASI_P, %o4
  45        wr              %o4, 0x0, %asi
  46
  47NGbzero_from_clear_user:
  48        cmp             %o1, 15
  49        bl,pn           %icc, NGbzero_tiny
  50         andcc          %o0, 0x7, %g1
  51        be,pt           %xcc, 2f
  52         mov            8, %g2
  53        sub             %g2, %g1, %g1
  54        sub             %o1, %g1, %o1
  551:      EX_ST(stba %o2, [%o0 + 0x00] %asi)
  56        subcc           %g1, 1, %g1
  57        bne,pt          %xcc, 1b
  58         add            %o0, 1, %o0
  592:      cmp             %o1, 128
  60        bl,pn           %icc, NGbzero_medium
  61         andcc          %o0, (64 - 1), %g1
  62        be,pt           %xcc, NGbzero_pre_loop
  63         mov            64, %g2
  64        sub             %g2, %g1, %g1
  65        sub             %o1, %g1, %o1
  661:      EX_ST(stxa %o2, [%o0 + 0x00] %asi)
  67        subcc           %g1, 8, %g1
  68        bne,pt          %xcc, 1b
  69         add            %o0, 8, %o0
  70
  71NGbzero_pre_loop:
  72        wr              %g7, 0x0, %asi
  73        andn            %o1, (64 - 1), %g1
  74        sub             %o1, %g1, %o1
  75NGbzero_loop:
  76        EX_ST(stxa %o2, [%o0 + 0x00] %asi)
  77        EX_ST(stxa %o2, [%o0 + 0x08] %asi)
  78        EX_ST(stxa %o2, [%o0 + 0x10] %asi)
  79        EX_ST(stxa %o2, [%o0 + 0x18] %asi)
  80        EX_ST(stxa %o2, [%o0 + 0x20] %asi)
  81        EX_ST(stxa %o2, [%o0 + 0x28] %asi)
  82        EX_ST(stxa %o2, [%o0 + 0x30] %asi)
  83        EX_ST(stxa %o2, [%o0 + 0x38] %asi)
  84        subcc           %g1, 64, %g1
  85        bne,pt          %xcc, NGbzero_loop
  86         add            %o0, 64, %o0
  87
  88        membar          #Sync
  89        wr              %o4, 0x0, %asi
  90        brz,pn          %o1, NGbzero_done
  91NGbzero_medium:
  92         andncc         %o1, 0x7, %g1
  93        be,pn           %xcc, 2f
  94         sub            %o1, %g1, %o1
  951:      EX_ST(stxa %o2, [%o0 + 0x00] %asi)
  96        subcc           %g1, 8, %g1
  97        bne,pt          %xcc, 1b
  98         add            %o0, 8, %o0
  992:      brz,pt          %o1, NGbzero_done
 100         nop
 101
 102NGbzero_tiny:
 1031:      EX_ST(stba %o2, [%o0 + 0x00] %asi)
 104        subcc           %o1, 1, %o1
 105        bne,pt          %icc, 1b
 106         add            %o0, 1, %o0
 107
 108        /* fallthrough */
 109
 110NGbzero_done:
 111        wr              %o5, 0x0, %asi
 112
 113NGbzero_return:
 114        retl
 115         mov            %o3, %o0
 116        .size           NGbzero, .-NGbzero
 117        .size           NGmemset, .-NGmemset
 118
 119        .globl          NGclear_user
 120        .type           NGclear_user, #function
 121NGclear_user:           /* %o0=buf, %o1=len */
 122        rd              %asi, %o5
 123        brz,pn          %o1, NGbzero_done
 124         clr            %o3
 125        cmp             %o5, ASI_AIUS
 126        bne,pn          %icc, NGbzero
 127         clr            %o2
 128        mov             ASI_BLK_INIT_QUAD_LDD_AIUS, %g7
 129        ba,pt           %xcc, NGbzero_from_clear_user
 130         mov            ASI_AIUS, %o4
 131        .size           NGclear_user, .-NGclear_user
 132
 133#define BRANCH_ALWAYS   0x10680000
 134#define NOP             0x01000000
 135#define NG_DO_PATCH(OLD, NEW)   \
 136        sethi   %hi(NEW), %g1; \
 137        or      %g1, %lo(NEW), %g1; \
 138        sethi   %hi(OLD), %g2; \
 139        or      %g2, %lo(OLD), %g2; \
 140        sub     %g1, %g2, %g1; \
 141        sethi   %hi(BRANCH_ALWAYS), %g3; \
 142        sll     %g1, 11, %g1; \
 143        srl     %g1, 11 + 2, %g1; \
 144        or      %g3, %lo(BRANCH_ALWAYS), %g3; \
 145        or      %g3, %g1, %g3; \
 146        stw     %g3, [%g2]; \
 147        sethi   %hi(NOP), %g3; \
 148        or      %g3, %lo(NOP), %g3; \
 149        stw     %g3, [%g2 + 0x4]; \
 150        flush   %g2;
 151
 152        .globl  niagara_patch_bzero
 153        .type   niagara_patch_bzero,#function
 154niagara_patch_bzero:
 155        NG_DO_PATCH(memset, NGmemset)
 156        NG_DO_PATCH(__bzero, NGbzero)
 157        NG_DO_PATCH(__clear_user, NGclear_user)
 158        NG_DO_PATCH(tsb_init, NGtsb_init)
 159        retl
 160         nop
 161        .size   niagara_patch_bzero,.-niagara_patch_bzero
 162