arm 指令学习载录

最初九月雪 2017-04-14

展开全文

ARM寻址方式：

1、立即寻址，操作数在指令中给出。

ADDR0,R0,#1; R0?R0+1

ANDR8,R7,#&FF; R8?R7[7:0];

ADDR0,R0,#&3F R0?R0+0X3F

立即数要求加上#作为前缀，十六进制使用0x，或者&表示

2、寄存器寻址，直接使用寄存器名字

ADD R0,R1,R2; R0?R1+R2

3、寄存器移位寻址，ARM特有

ADD R3,R2,R1,LSL#3; R3?R2+8*R1

其中LSL #3 为左移三位

表示移位的还有：

LSL：逻辑左移

LSR：逻辑右移

ASR：算术右移

ROR：循环右移

RRX：扩展为1的循环右移

4、寄存器间接寻址，寄存器中的值作为操作数地址,操作数在RAM中

LDR R0,[R1]; R0?[R1]

STR R0,[R1]; [R1]?R0

5、基址寻址，给定寄存器的值加上一个偏移作为操作数地址，操作数在RAM中

LDR R0,[R1,#4]; R0?[R1+4]

LDR R0,[R1,#4]!; R0?[R1+4],R1?R1+4

LDR R0,[R1],#4; R0?[R1],R1?R1+4

LDR R0,[R1,R2]; R0?[R1+R2]

6、多寄存器寻址，一条指令可以完成多个寄存器值的传送，最多16个寄存器

LDMIAR0,{R1,R2,R3,R4}; R1?[R0],R2?[R0+4],R3?[R0+8],R4?[R0+12]

格式：LDM+

IB：地址增加在先

R1?[R0+4],R2?[R0+8],R3?[R0+12],R4?[R0+16]

IA：地址增加在后

R1?[R0],R2?[R0+4],R3?[R0+8],R4?[R0+12]

DB：地址减少在先

R1?[R0-4],R2?[R0-8],R3?[R0-12],R4?[R0-16]

DA：地址减少在后

R1?[R0],R2?[R0-4],R3?[R0-8],R4?[R0-12]

I：Increment

D：Decrement

B：Before

A：After

7、堆栈寻址

堆栈寻址有四种情况

1，堆栈向高地址方向生长

2，堆栈向低地址方向生长

3，当前堆栈指针指向有意义的数据[满]（推送数据前堆栈需腾出4字节空间）

4，当前堆栈指针指向无意义的数据（可直接向当前位置推送数据）

1,2情况与3,4情况两两组合，产生四种结果，四种结果如下

满递增堆栈（FA）：

堆栈指针指向最后压入的数据，且由低地址向高地址生成。

入栈：STMFA，出栈：LDMFA

满递减堆栈（FD）：

堆栈指针指向最后压入的数据，且由高地址向低地址生成。

入栈：STMFD，出栈：LDMFD

空递增堆栈（EA）：

堆栈指针指向下一个将要放入数据的空位置，且由低地址向高地址生成。

入栈：STMEA，出栈：LDMEA

空递减堆栈（ED）：

堆栈指针指向下一个将要放入数据的空位置，且由高地址向低地址生成。

入栈：STMED，出栈：LDMED

STMFA r13!, {r0-r5} ; Push onto a FullAscending Stack

LDMFA r13!, {r0-r5} ; Pop from a FullAscending Stack

STMFD r13!, {r0-r5} ; Push onto a FullDescending Stack

LDMFD r13!, {r0-r5} ; Pop from a Full DescendingStack

STMEA r13!, {r0-r5} ; Push onto an EmptyAscending Stack

LDMEA r13!, {r0-r5} ; Pop from an EmptyAscending Stack

STMED r13!, {r0-r5} ; Push onto EmptyDescending Stack

LDMED r13!, {r0-r5} ; Pop from an EmptyDescending Stack

SP＝0x0FF8

出栈

入栈

SP＝0x1000

8、相对寻址

以程序计数器PC的当前值为基地址，指令中的地址标号作为偏移量，将两者相加之后得到操作数的有效地址。

LDRPC,[PC,#+0xFF0]；PC ←[PC+8+0xFF0]

ARM微处理器指令分类

1、跳转指令

2、数据处理指令

3、程序状态寄存器（PSR）传输指令

4、加载、存储（Load/Store）指令

5、协处理器指令

6、异常中断产生指令

ARM微处理器指令格式

典型的ARM指令格式（机器码）如下：

语法格式：

<opcode>:指令助记符

{<cond>}:指令执行条件

{<S>} :指令的操作是否影响CPSR的值

<Rd> :目标寄存器

<Rn> :包含第一个操作数的寄存器

<shifter_operand>:第二个操作数

指令的条件域

当处理器工作在ARM状态时，几乎所有的指令均可根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行满足条件时被执行。

每一条ARM指令包含4位条件码，位于指令的最高4位[31:28]。条件码共有16种，每种条件码可用两个字符表示，这两个字符可以添加在指令助记符的后面和指令同时使用。

B 无条件跳转

BEQ 相等则跳转，即当CPSR中的Z标志置位时发生跳转。

条件码	助记符后缀	标志	含义
0000	EQ	Z置位	相等
0001	NE	Z清零	不相等
0010	CS/HS	C置位	无符号数大于或等于
0011	CC/LO	C清零	无符号数小于
0100	MI	N置位	负数
0101	PL	N清零	正数或零
0110	VS	V置位	溢出
0111	VC	V清零	未溢出
1000	HI	C置位Z清零	无符号数大于
1001	LS	C清零Z置位	无符号数小于或等于
1010	GE	N等于V	带符号数大于或等于
1011	LT	N不等于V	带符号数小于
1100	GT	Z清零且（N等于V）	带符号数大于
1101	LE	Z置位或（N不等于V）	带符号数小于或等于
1110	AL	忽略	无条件执行

几乎所有的ARM数据处理指令均可以根据执行结果来选择是否更新条件码标志。若要更新条件码标志，则指令中须包含后缀S

一些指令（CMP，CMN，TST，TEQ）不需要后缀S

一些指令只更新部分标志，而不影响其他标志

跳转指令

在ARM程序中有两种方法可以实现程序的跳转

1、使用跳转指令

2、直接向程序计数器PC写入目标地址值

通过向PC寄存器写入跳转地址值，可以实现在4G的地址空间中任意跳转。这种跳转指令称为长跳转。

ARM的跳转指令可以从当前指令向前或者向后的32M的地址空间跳转，包括以下四条指令：

B 跳转指令

BL 带返回的跳转指令

BLX 带返回和状态切换的跳转指令

BX 带状态切换的跳转指令

Cond(31:28)

1 0 1

L(24)

Signed_immed_24(23:0)

指令的语法格式

B{L}{<cond>}<targt_address>

L:是否保存返回地址（ L：PCàLR )

<cond>:指令执行的条件码

<targt_address>：指令跳转的目标地址。计算方法，24 位有符号数补码立即数扩展为 32 位，再左移2位；将得到的值加到PC寄存器中，即得到跳转的目标地址。(-32MB~+32MB)。

B（跳转指令）及BL（带返回的跳转指令）

指令的使用

子程序返回：

BX R14

MOV PC，R14

STMFDR13!,{<registers>,R14}

LDMFDR13!,{<registers>,PC}

示例

B Label ;程序跳转到标号Label处执行

BCS Label ;当CPSR寄存器中的C条件码置位时，程序 ;跳转到标号Label处执行

BL func_1 ;程序跳转到子程序func_1处执行，同时将当前PC值 ;保存到LR中

BLX(1)

BLX(1)指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态切换到Thumb状态，该指令同时将PC寄存器的内容复制到LR寄存器中。

本指令属于无条件执行的指令

指令的语法格式

BLX <targt_address>

BLX(2)

BLX(2)指令从ARM指令集跳转到指令中所指定的目标地址，目标地址的指令可以是ARM指令，也可以是Thumb指令。目标地址放在指令中的寄存器<Rm>中，当<Rm>寄存器的bit[0]值为0时，目标地址处的指令类型为ARM指令；当<Rm>寄存器的bit[0]值为1时，目标地址处的指令类型为Thumb指令。该指令同时将PC寄存器的内容复制到LR寄存器中。

指令的语法格式

BLX{<cond>} <Rm>

BLX(2)

BLX 目标地址

BLX指令从ARM指令集跳转到指令中所指定的目标地址，并将处理器的工作状态从ARM状态切换到Thumb状态，该指令同时将PC的当前内容保存到寄存器R14中。因此，当子程序使用Thumb指令集，而调用者使用ARM指令集时，可以通过BLX指令实现子程序的调用和处理器工作状态的切换。同时，子程序的返回可以通过将寄存器R14值复制到PC中来完成。

BX指令

BX{条件} 目标地址

BX指令跳转到指令中所指定的目标地址，目标地址处的指令既可以是ARM指令，也可以是Thumb指令。

数据处理指令：

数据处理指令可分为数据传送指令、算术逻辑运算指令和比较指令等。

数据传送指令用于在寄存器之间进行数据的传输。

算术逻辑运算指令完成常用的算术逻辑运算，该类指令不但将运算结果保存在目的寄存器中，同时更新CPSR中的相应条件标志位。

比较指令不保存运算结果，只更新CPSR中相应的条件标志位。

ARM指令集中数据处理指令集包括：

传送指令：

MOV 数据传送指令

MVN 数据取反传送指令

比较指令：

CMP 比较指令

CMN 反值比较指令

TST 位测试指令

TEQ 相等测试指令

算术指令：

ADD 加法指令

ADC 带进位加法指令

SUB 减法指令

SBC 带借位减法指令

RSB 逆向减法指令

RSC 带借位的逆向减法指令

逻辑指令：

AND 逻辑与指令

ORR 逻辑或指令

EOR 逻辑异或指令

BIC 位清除指令

MOV指令

MOV{条件}{S} 目的寄存器，源操作数

MOV指令可完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。其中S选项决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。

MOV R1，R0 ；将寄存器R0的值传送到寄存器R1

MOV PC，R14

；将寄存器R14的值传送到PC，常用于子程序返回

MOV R1，R0，LSL #3

；将寄存器R0的值左移3位后传送到R1

MVN指令

MVN{条件}{S} 目的寄存器，源操作数

MVN指令可完成从另一个寄存器、被移位的寄存器、或将一个立即数加载到目的寄存器。与MOV指令不同之处是在传送之前按位被取反了，即把一个被取反的值传送到目的寄存器中。其中S决定指令的操作是否影响CPSR中条件标志位的值，当没有S时指令不更新CPSR中条件标志位的值。

MVN R0，＃0

；将立即数0取反传送到寄存器R0中，完成后R0=-1

CMP指令

CMP{条件} 操作数1，操作数2

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较，同时更新CPSR中条件标志位的值。该指令进行一次减法运算，但不存储结果，只更改条件标志位。标志位表示的是操作数1与操作数2的关系(大、小、相等)。

CMP R1，R0

；将寄存器R1的值与寄存器R0的值相减，并根据结果设置CPSR的标志位

CMP R1，＃100

；将寄存器R1的值与立即数100相减，并根据结果设置CPSR的标志位

CMN指令

CMN{条件} 操作数1，操作数2

CMN指令用于把一个寄存器的内容和另一个寄存器的内容或立即数取反后进行比较，同时更新CPSR中条件标志位的值。该指令实际完成操作数1和操作数2相加，并根据结果更改条件标志位。

CMN R1，R0

；将寄存器R1的值与寄存器R0的值相加，并根据结果设置CPSR的标志位

CMN R1，＃100

；将寄存器R1的值与立即数100相加，并根据结果设置CPSR的标志位

TST指令

TST{条件} 操作数1，操作数2

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算，并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据，而操作数2是一个位掩码，该指令一般用来检测是否设置了特定的位。

TST R1, #2_1

；用于测试在寄存器R1中是否设置了最低位

TST R1, #0xff0

；将寄存器R1的值与立即数0xff0按位与，并根据结果设置CPSR的标志位

TEQ指令

TEQ{条件} 操作数1，操作数2

TEQ指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的异或运算，并根据运算结果更新CPSR中条件标志位的值。该指令通常用于比较操作数1和操作数2是否相等。

TEQ R1，R2

；将寄存器R1的值与寄存器R2的值按位异或，并根据结果设置CPSR的标志位。

ADD指令

ADD{条件}{S} 目的寄存器，操作数1，操作数2

ADD指令用于把两个操作数相加，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。

ADD R0，R1，R2 ； R0 = R1 + R2

ADD R0，R1，#256 ； R0 = R1 + 256

ADD R0，R2，R3，LSL#1

； R0 = R2 + (R3 << 1)

； R0 = R2 + 2×R3

ADC指令

ADC{条件}{S} 目的寄存器，操作数1，操作数2

ADC指令用于把两个操作数相加，再加上CPSR中的C条件标志位的值，并将结果存放到目的寄存器中。它使用一个进位标志位，这样就可以做比32位大的数的加法。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。

两个128位数的加法：

ADDS R0，R4，R8 ；加低端的字，带进位 ADCS R1，R5，R9 ；加第二个字，带进位

ADCS R2，R6，R10 ；加第三个字，带进位

ADC R3，R7，R11 ；加第四个字

SUB指令

SUB{条件}{S} 目的寄存器，操作数1，操作数2

SUB指令用于把操作数1减去操作数2，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。

SUB R0，R1，R2 ； R0 = R1 - R2

SUB R0，R1，#256 ； R0 = R1 - 256

SUB R0，R2，R3，LSL #1

； R0 = R2 - (R3 << 1)

SBC指令

SBC{条件}{S} 目的寄存器，操作数1，操作数2

SBC指令用于把操作数1减去操作数2，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法。该指令可用于有符号数或无符号数的减法运算。

SBCS R0，R1，R2

；R0 = R1 - R2 - ！C，并根据结果设置CPSR的进位标志位

RSB指令

RSB指令的格式为：

RSB{条件}{S} 目的寄存器，操作数1，操作数2

RSB指令称为逆向减法指令，用于把操作数2减去操作数1，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令可用于有符号数或无符号数的减法运算。

RSB R0，R1，R2 ；R0 = R2 – R1

RSB R0，R1，#256 ；R0 = 256 – R1

RSB R0，R2，R3，LSL#1

； R0 = (R3 << 1) - R2

RSC指令

RSC指令的格式为：

RSC{条件}{S} 目的寄存器，操作数1，操作数2

RSC指令用于把操作数2减去操作数1，再减去CPSR中的C条件标志位的反码，并将结果存放到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令使用进位标志来表示借位，这样就可以做大于32位的减法。该指令可用于有符号数或无符号数的减法运算。

RSC R0，R1，R2 ；R0 = R2 – R1 - ！C

AND指令

AND指令的格式为：

AND{条件}{S} 目的寄存器，操作数1，操作数2

AND指令用于在两个操作数上进行逻辑与运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于屏蔽操作数1的某些位。

AND R0，R0，＃3

；该指令保持R0的0、1位，其余位清零。

ORR指令

ORR指令的格式为：

ORR{条件}{S} 目的寄存器，操作数1，操作数2

ORR指令用于在两个操作数上进行逻辑或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于设置操作数1的某些位。

ORR R0，R0，＃3

；该指令设置R0的0、1位，其余位保持不变。

EOR指令

EOR指令的格式为：

EOR{条件}{S} 目的寄存器，操作数1，操作数2

EOR指令用于在两个操作数上进行逻辑异或运算，并把结果放置到目的寄存器中。操作数1应是一个寄存器，操作数2可以是一个寄存器，被移位的寄存器，或一个立即数。该指令常用于反转操作数1的某些位。

EOR R0，R0，＃3

；该指令反转R0的0、1位，其余位保持不变。

乘法指令与乘加指令

ARM微处理器支持的乘法指令与乘加指令共有6条，可分为运算结果为32位和运算结果为64位两类，与前面的数据处理指令不同，指令中的所有操作数、目的寄存器必须为通用寄存器，不能对操作数使用立即数或被移位的寄存器，同时，目的寄存器和操作数1必须是不同的寄存器。

乘法指令与乘加指令共有以下6条：

MUL 32位乘法指令

MLA 32位乘加指令

SMULL 64位有符号数乘法指令

SMLAL 64位有符号数乘加指令

UMULL 64位无符号数乘法指令

UMLAL 64位无符号数乘加指令

MUL指令

MUL指令的格式为：

MUL{条件}{S} 目的寄存器，操作数1，操作数2

MUL指令完成将操作数1与操作数2的乘法运算，并把结果（低32位）放置到目的寄存器中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数或无符号数。

MUL R0，R1，R2

；R0 = R1 × R2低32位

;R1=0x00FFFFFF,R2=0x00123456,R0=0x55EDCBAA

;0x00FFFFFF*0x00123456=0x123455EDCBAA

SMULL指令

SMULL指令的格式为：

SMULL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

SMULL指令完成操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。

SMULL R0，R1，R2，R3

； R0 = （R2 × R3）的低32位；R1 = （R2 × R3）的高32位

;R2=0x00FFFFFF,R3=0x00123456

; R0=0x55EDCBAA,R1=0x00001234

;0x00FFFFFF*0x00123456=123455EDCBAA

SMLAL指令

SMLAL指令的格式为：

SMLAL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

SMLAL指令完成操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的有符号数。

对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。

对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。

SMLAL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位＋ R0 ；R1 = （R2 × R3）的高32位＋ R1

UMULL指令

UMULL指令的格式为：

UMULL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

UMULL指令完成操作数1与操作数2的乘法运算，并把结果的低32位放置到目的寄存器Low中，结果的高32位放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。

UMULL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位

；R1 = （R2 × R3）的高32位

UMLAL指令

UMLAL指令的格式为：

UMLAL{条件}{S} 目的寄存器Low，目的寄存器High，操作数1，操作数2

UMLAL指令完成操作数1与操作数2的乘法运算，并把结果的低32位同目的寄存器Low中的值相加后又放置到目的寄存器Low中，结果的高32位同目的寄存器High中的值相加后又放置到目的寄存器High中，同时可以根据运算结果设置CPSR中相应的条件标志位。其中，操作数1和操作数2均为32位的无符号数。

对于目的寄存器Low，在指令执行前存放64位加数的低32位，指令执行后存放结果的低32位。

对于目的寄存器High，在指令执行前存放64位加数的高32位，指令执行后存放结果的高32位。

UMLAL R0，R1，R2，R3

；R0 = （R2 × R3）的低32位＋ R0

；R1 = （R2 × R3）的高32位＋ R1

程序状态寄存器访问指令

ARM微处理器支持程序状态寄存器访问指令，用于在程序状态寄存器和通用寄存器之间传送数据，程序状态寄存器访问指令包括以下两条：

MRS 程序状态寄存器到通用寄存器的数据传送指令

MSR 通用寄存器到程序状态寄存器的数据传送指令

MRS指令

MRS指令的格式为：

MRS{条件} 通用寄存器，程序状态寄存器（CPSR或SPSR）

MRS指令用于将程序状态寄存器的内容传送到通用寄存器中。该指令一般用在以下几种情况：

当需要改变程序状态寄存器的内容时，可用MRS将程序状态寄存器的内容读入通用寄存器，修改后再写回程序状态寄存器。

当在异常处理或进程切换时，需要保存程序状态寄存器的值，可先用该指令读出程序状态寄存器的值，然后保存。

MRS R0，CPSR ；传送CPSR的内容到R0

MRS R0，SPSR ；传送SPSR的内容到R0

MSR指令

MSR指令的格式为：

MSR{条件} 程序状态寄存器（CPSR或SPSR）_<域>，操作数

MSR指令用于将操作数的内容传送到程序状态寄存器的特定域中。其中，操作数可以为通用寄存器或立即数。<域>用于设置程序状态寄存器中需要操作的位，32位的程序状态寄存器可分为4个域：

位[31：24]为条件标志位域，用f表示；

位[23：16]为状态位域，用s表示；

位[15：8]为扩展位域，用x表示；

位[7：0]为控制位域，用c表示；

该指令通常用于恢复或改变程序状态寄存器的内容，在使用时，一般要在MSR指令中指明将要操作的域。

MSR CPSR_cxsf，R0 ；传送R0的内容到CPSR

MSR SPSR_cxsf，R0 ；传送R0的内容到SPSR

MSR CPSR_c，R0

；传送R0的内容到SPSR，但仅仅修改CPSR中的控制位域

加载/存储指令

ARM微处理器支持加载/存储指令用于在寄存器和存储器之间传送数据，加载指令用于将存储器中的数据传送到寄存器，存储指令则完成相反的操作。常用的加载存储指令如下：

LDR 字数据加载指令

LDRB 字节数据加载指令

LDRH 半字数据加载指令

STR 字数据存储指令

STRB 字节数据存储指令

STRH 半字数据存储指令

LDR指令

LDR指令的格式为：

LDR{条件} 目的寄存器，<存储器地址>

LDR指令用于从存储器中将一个32位的字数据传送到目的寄存器中。该指令通常用于从存储器中读取32位的字数据到通用寄存器，然后对数据进行处理。当程序计数器PC作为目的寄存器时，指令从存储器中读取的字数据被当作目的地址，从而可以实现程序流程的跳转。该指令在程序设计中比较常用，且寻址方式灵活多样。

LDR R0，[R1] ；将存储器地址为R1的字数据读入寄存器R0

LDR R0，[R1，R2] ；将存储器地址为R1+R2的字数据读入寄存器R0

LDR R0，[R1，＃8] ；将存储器地址为R1+8的字数据读入寄存器R0

LDR R0，[R1，R2]！

；将存储器地址为R1+R2的字数据读入寄存器R0，并将新地址R1＋R2写入R1

LDR R0，[R1，＃8]！

；将存储器地址为R1+8的字数据读入寄存器R0，并将新地址R1＋8写入R1

LDR R0，[R1]，R2

；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1＋R2写入R1

LDR R0，[R1，R2，LSL＃2]！

；将存储器地址为R1＋R2×4的字数据读入寄存器R0，并将新地址R1＋R2×4写入R1

LDR R0，[R1]，R2，LSL＃2

；将存储器地址为R1的字数据读入寄存器R0，并将新地址R1＋R2×4写入R1

LDRB指令

LDRB指令的格式为：

LDR{条件}B 目的寄存器，<存储器地址>

LDRB指令用于从存储器中将一个8位的字节数据传送到目的寄存器中，同时将寄存器的高24位清零。该指令通常用于从存储器中读取8位的字节数据到通用寄存器，然后对数据进行处理。

LDRB R0，[R1]

；将存储器地址为R1的字节数据读入寄存器R0，并将R0的高24位清零

LDRB R0，[R1，＃8]

；将存储器地址为R1＋8的字节数据读入寄存器R0，并将R0的高24位清零

LDRH指令

LDRH指令的格式为：

LDR{条件}H 目的寄存器，<存储器地址>

LDRH指令用于从存储器中将一个16位的半字数据传送到目的寄存器中，同时将寄存器的高16位清零。该指令通常用于从存储器中读取16位的半字数据到通用寄存器，然后对数据进行处理。

LDRH R0，[R1]

；将存储器地址为R1的半字数据读入寄存器R0，并将R0的高16位清零

LDRH R0，[R1，＃8]

；将存储器地址为R1＋8的半字数据读入寄存器R0，并将R0的高16位清零

LDRH R0，[R1，R2]

；将存储器地址为R1＋R2的半字数据读入寄存器R0，并将R0的高16位清零

STR指令

STR指令的格式为：

STR{条件} 源寄存器，<存储器地址>

STR指令用于从源寄存器中将一个32位的字数据传送到存储器中。该指令在程序设计中比较常用，且寻址方式灵活多样，使用方式可参考指令LDR。

STR R0，[R1]，＃8

；将R0中的字数据写入以R1为地址的存储器中，并将新地址R1＋8写入R1

STR R0，[R1，＃8]

；将R0中的字数据写入以R1＋8为地址的存储器中

STRB指令

STRB指令的格式为：

STR{条件}B 源寄存器，<存储器地址>

STRB指令用于从源寄存器中将一个8位的字节数据传送到存储器中。该字节数据为源寄存器中的低8位。

STRB R0，[R1]

；将寄存器R0中的字节数据写入以R1为地址的存储器中

STRB R0，[R1，＃8]

；将寄存器R0中的字节数据写入以R1＋8为地址的存储器中

STRH指令

STRH指令的格式为：

STR{条件}H 源寄存器，<存储器地址>

STRH指令用于从源寄存器中将一个16位的半字数据传送到存储器中。该半字数据为源寄存器中的低16位。

STRH R0，[R1]

；将寄存器R0中的半字数据写入以R1为地址的存储器中

STRH R0，[R1，＃8]

；将寄存器R0中的半字数据写入以R1＋8为地址的存储器中

批量数据加载/存储指令

ARM微处理器所支持批量数据加载/存储指令可以一次在一片连续的存储器单元和多个寄存器之间传送数据，批量加载指令用于将一片连续的存储器中的数据传送到多个寄存器，批量数据存储指令则完成相反的操作。

常用的加载存储指令如下：

LDM 批量数据加载指令

STM 批量数据存储指令

LDM（或STM）指令

LDM（或STM）指令的格式为：

LDM（或STM）{条件}{类型} 基址寄存器{！}，寄存器列表{∧}

LDM（或STM）指令用于从由基址寄存器所指示的一片连续存储器到寄存器列表所指示的多个寄存器之间传送数据，该指令的常见用途是将多个寄存器的内容入栈或出栈。其中，{类型}为以下几种情况：

IA 每次传送后地址加1；

IB 每次传送前地址加1；

DA每次传送后地址减1；

DB 每次传送前地址减1；

FD 满递减堆栈；

ED 空递减堆栈；

FA 满递增堆栈；

EA 空递增堆栈；

{！}为可选后缀，若选用该后缀，则当数据传送完毕之后，将最后的地址写入基址寄存器，否则基址寄存器的内容不改变。

基址寄存器不允许为R15，寄存器列表可以为R0～R15的任意组合。

{∧}为可选后缀，当指令为LDM且寄存器列表中包含R15，选用该后缀时表示：除了正常的数据传送之外，还将SPSR复制到CPSR。

从子程序返回：

无嵌套

MOV PC,LR

有嵌套

STMFD R13!，{R0，R4-R12，LR}

；将寄存器列表中的寄存器（R0，R4到R12，LR）存入堆栈

……

LDMFD R13!，{R0，R4-R12，PC}

；将堆栈内容恢复到寄存器（R0，R4到R12，LR）

从异常返回（例如IRQ中断）：

无嵌套

SUBS PC,LR,#4

其他

SUBS LR，LR，＃4

STMFD R13!，{R0，R4-R12，LR}

；将寄存器列表中的寄存器（R0，R4到R12，LR）存入堆栈

LDMFD R13!，{R0，R4-R12，PC}^

；将堆栈内容恢复到寄存器（R0，R4到R12，LR）

数据交换指令(信号量操作指令）

ARM微处理器所支持数据交换指令能在存储器和寄存器之间交换数据。数据交换指令有如下两条：

SWP 字数据交换指令

SWPB 字节数据交换指令

SWP指令

SWP指令的格式为：

SWP{条件} 目的寄存器，源寄存器1，[源寄存器2]

SWP指令用于将源寄存器2所指向的存储器中的字数据传送到目的寄存器中，同时将源寄存器1中的字数据传送到源寄存器2所指向的存储器中。当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。

SWP R0，R1，[R2]

；将R2所指向的存储器中的字数据传送到R0，同时将R1中的字数据传送到R2所指向的存储单元

SWP R0，R0，[R1]

；该指令完成将R1所指向的存储器中的字数据与R0中的字数据交换

SWPB指令

SWPB指令的格式为：

SWP{条件}B 目的寄存器，源寄存器1，[源寄存器2]

SWPB指令用于将源寄存器2所指向的存储器中的字节数据传送到目的寄存器中，目的寄存器的高24清零，同时将源寄存器1中的字节数据传送到源寄存器2所指向的存储器中。显然，当源寄存器1和目的寄存器为同一个寄存器时，指令交换该寄存器和存储器的内容。

SWPB R0，R1，[R2]

；将R2所指向的存储器中的字节数据传送到R0，R0的高24位清零，同时将R1中的低8位数据传送到R2所指向的存储单元

SWPB R0，R0，[R1]

；该指令完成将R1所指向的存储器中的字节数据与R0中的低8位数据交换, R0的高24位清零

移位操作

ARM微处理器内嵌的桶型移位器（Barrel Shifter），支持数据的各种移位操作，移位操作在ARM指令集中不作为单独的指令使用，它只能作为指令格式中是一个字段，在汇编语言中表示为指令中的选项。例如，数据处理指令的第二个操作数为寄存器时，就可以加入移位操作选项对它进行各种移位操作。移位操作包括如下6种类型：

LSL 逻辑左移

ASL 算术左移

LSR 逻辑右移

ASR 算术右移

ROR 循环右移

RRX 带扩展的循环右移

LSL（或ASL）操作

LSL（或ASL）操作的格式为：

通用寄存器，LSL（或ASL）操作数

LSL（或ASL）可完成对通用寄存器中的内容进行逻辑（或算术）的左移操作，按操作数所指定的数量向左移位，低位用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～31）。

MOV R0, R1, LSL #2

；将R1中的内容左移两位后传送到R0中。

LSR操作

LSR操作的格式为：

通用寄存器，LSR 操作数

LSR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用零来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～32）。

MOV R0, R1, LSR #2

；将R1中的内容右移两位后传送到R0中，左端用零来填充。

ASR操作

ASR操作的格式为：

通用寄存器，ASR 操作数

ASR可完成对通用寄存器中的内容进行右移的操作，按操作数所指定的数量向右移位，左端用第31位的值来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～32）。

MOV R0, R1, ASR #2

；将R1中的内容右移两位后传送到R0中，左端用第31位的值来填充。

ROR操作

ROR操作的格式为：

通用寄存器，ROR 操作数

ROR可完成对通用寄存器中的内容进行循环右移的操作，按操作数所指定的数量向右循环移位，左端用右端移出的位来填充。其中，操作数可以是通用寄存器，也可以是立即数（1～31）。

MOV R0, R1, ROR #2

；将R1中的内容循环右移两位后传送到R0中。

RRX操作

RRX操作的格式为：

通用寄存器，RRX

RRX可完成对通用寄存器中的内容进行带扩展的循环右移的操作，按操作数所指定的数量向右循环移位，左端用进位标志位C来填充。

MOV R0, R1, RRX

；将R1中的内容进行带扩展的循环右移一位后传送到R0中。

协处理器指令

ARM微处理器可支持多达16个协处理器，用于各种协处理操作，在程序执行的过程中，每个协处理器只执行针对自身的协处理指令，忽略ARM处理器和其他协处理器的指令。

ARM的协处理器指令主要用于ARM处理器初始化ARM协处理器的数据处理操作，以及在ARM处理器的寄存器和协处理器的寄存器之间传送数据，和在ARM协处理器的寄存器和存储器之间传送数据。ARM协处理器指令包括以下5条：

CDP 协处理器数据操作指令

LDC 协处理器数据加载指令

STC 协处理器数据存储指令

MCR ARM处理器寄存器到协处理器寄存器的数据传送指令

MRC 协处理器寄存器到ARM处理器寄存器的数据传送指令

CDP指令

CDP指令的格式为：

CDP{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器协处理器操作码2

CDP指令用于ARM处理器通知ARM协处理器执行特定的操作,若协处理器不能成功完成特定的操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器和源寄存器均为协处理器的寄存器，指令不涉及ARM处理器的寄存器和存储器。

CDP P5，2，C12，C10，C3，4

；该指令完成协处理器P5的初始化

LDC指令

LDC指令的格式为：

LDC{条件}{L} 协处理器编码,目的寄存器，[源寄存器]

LDC指令用于将源寄存器所指向的存储器中的字数据传送到目的寄存器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。

LDC P6，CR1，[R4]

；将ARM处理器的寄存器R4所指向的存储器中的字数据传送到协处理器P6的寄存器CR1中。

STC指令

STC指令的格式为：

STC{条件}{L} 协处理器编码,源寄存器，[目的寄存器]

STC指令用于将源寄存器中的字数据传送到目的寄存器所指向的存储器中，若协处理器不能成功完成传送操作，则产生未定义指令异常。其中，{L}选项表示指令为长读取操作，如用于双精度数据的传输。

STC P8，CR8，[R2，＃4]！

；将协处理器P8的寄存器CR8中的字数据传送到ARM处理器的寄存器R2＋4所指向的存储器中，R2=R2+4。

MCR指令

MCR指令的格式为：

MCR{条件} 协处理器编码，协处理器操作码1，源寄存器，目的寄存器1，目的寄存器2{，协处理器操作码2}

MCR指令用于将ARM处理器寄存器中的数据传送到协处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，源寄存器为ARM处理器的寄存器，目的寄存器1和目的寄存器2均为协处理器的寄存器。

MCR P15，0，R0，C1，C0

；CP15 register 1:=R0

MRC指令

MRC指令的格式为：

MRC{条件} 协处理器编码，协处理器操作码1，目的寄存器，源寄存器1，源寄存器2，协处理器操作码2

MRC指令用于将协处理器寄存器中的数据传送到ARM处理器寄存器中,若协处理器不能成功完成操作，则产生未定义指令异常。其中协处理器操作码1和协处理器操作码2为协处理器将要执行的操作，目的寄存器为ARM处理器的寄存器，源寄存器1和源寄存器2均为协处理器的寄存器。

MRC P15，0，R0，C1，C0

；R0：=CP15 register 1

异常产生指令

ARM微处理器所支持的异常指令有如下两条：

SWI 软件中断指令

BKPT 断点中断指令

SWI指令

SWI指令的格式为：

SWI{条件} 24位的立即数

SWI指令用于产生软件中断，以便用户程序能调用操作系统的系统例程。操作系统在SWI的异常处理程序中提供相应的系统服务，指令中24位的立即数指定用户程序调用系统例程的类型，相关参数通过通用寄存器传递，当指令中24位的立即数被忽略时，用户程序调用系统例程的类型由通用寄存器R0的内容决定，同时，参数通过其他通用寄存器传递。

SWI 0x02

；该指令调用操作系统编号为02的系统例程。

BKPT指令

BKPT指令的格式为：

BKPT 16位的立即数

BKPT指令产生软件断点，引起Prefetch Abort 异常。可用于程序的调试。

u ARM体系结构除了支持执行效率很高的32位ARM指令集以外，同时支持16位的Thumb指令集。Thumb指令集是ARM指令集的一个子集，允许指令编码为16位的长度。与等价的32位代码相比较，Thumb指令集在保留32代码优势的同时，大大节省了系统的存储空间。

u 所有的Thumb指令都有对应的ARM指令，而且Thumb的编程模型也对应于ARM的编程模型，在应用程序的编写过程中，只要遵循一定调用的规则，Thumb子程序和ARM子程序就可以互相调用。当处理器在执行ARM程序段时，称ARM处理器处于ARM工作状态，当处理器在执行Thumb程序段时，称ARM处理器处于Thumb工作状态。

u 与ARM指令集相比较，Thumb指令集中的数据处理指令的操作数仍然是32位，指令地址也为32位，但Thumb指令集为实现16位的指令长度，舍弃了ARM指令集的一些特性，如大多数的Thumb指令是无条件执行的，而几乎所有的ARM指令都是有条件执行的；大多数的Thumb数据处理指令的目的寄存器与其中一个源寄存器相同。

u 由于Thumb指令的长度为16位，即只用ARM指令一半的位数来实现同样的功能，所以，要实现特定的程序功能，所需的Thumb指令的条数较ARM指令多。在一般的情况下，Thumb指令与ARM指令的时间效率和空间效率关系为：

u Thumb代码所需的存储空间约为ARM代码的60％～70％

u Thumb代码使用的指令数比ARM代码多约30％～40％

u 若使用32位数据宽度的存储器，ARM代码比Thumb代码快约40％

u 若使用16位数据宽度的存储器，Thumb代码比ARM代码快约40％～50％

u 与ARM代码相比较，使用Thumb代码，存储器的功耗会降低约30％

u 显然，ARM指令集和Thumb指令集各有其优点，若对系统的性能有较高要求，应使用32位的存储系统和ARM指令集，若对系统的成本及功耗有较高要求，则应使用16位的存储系统和Thumb指令集。当然，若两者结合使用，充分发挥其各自的优点，会取得更好的效果。