MIPS快速入门(原文+翻译):MIPS Architecture and Assembly Language Overview(持续更新中)

前言

发布该文章的网站已经无法访问,无法获得相关翻译授权,本人的翻译仅供大家参考学习,尽可能使用直译,并加上一些译者注(使用“ [1] ”的形式),以减少信息损失,水平有限,不妥之处还请见谅。

本文不得用于其他用途,侵删,转载请加上原文链接。

Adapted from: http://edge.mcs.dre.g.el.edu/GICL/people/sevy/architecture/MIPSRef(SPIM).html

点此获取 >>> 英文原文资源链接

其实我并不建议你看翻译,因为无论如何,翻译过后都会造成信息损失甚至错误,强烈建议直接看英文原文。

0 MIPS架构及汇编语言概述

0.1 数据类型及字面含义

0.1.1数据类型

  • 所有指令都是32位
  • 基本数据类型
    • 字节型:byte(8 bits)
    • 半字:halfword(2 bytes)
    • 字型:word(4 bytes)
  • 一个字符(character)需要1个字节的存储空间
  • 一个整数(integer)需要1个字(4个字节)的存储空间

译者注:在32位环境下,C语言的char是1个字节,short是2个字节,int是4个字节,可以对比学习,关于有无符号的问题,请先忽略,不妨之后深入学习MIPS数据及指令再了解。

0.1.2 字面含义[1]

  • 数字(numbers)按照原样输入,就是,例如:4
  • 字符(characters)被单引号括起来,例如:'b'
  • 字符串(strings)被双引号括起来,例如:"A string"

译者注
[1] 字面含义的英文为Literal,中文不妨理解为:不同类型数据的表示方法。

0.2 寄存器(registers)

  • 32个通用寄存器
  • 在汇编指令中,寄存器以$开头。访问(addressing)寄存器的形式有2种:
    • 使用寄存器的编号,例如,从$0$31[1]
    • 使用与编号等价的寄存器名称,例如,$t1$sp
  • 特殊的寄存器LoHi用于存储乘法或除法运算的结果
    • 不能直接访问LoHi寄存器,它们的内容通过特殊的指令访问:mfhi(move from Hi)和mflo(move from Lo)[2]
  • 栈的增长方向是从存储器的高地址走向低地址[3]

译者注
[1] MIPS有32个通用寄存器,编号为0~31。
[2] 这里不是完全直译,直译的话看不懂,给出你原文对比一下:not directly addressable; contents accessed with special instruction mfhi (“move
from Hi”) and mflo (“move from Lo”).
[3] 这意味着栈底在高地址,栈顶在低地址;数据入栈的时候,栈顶指针是从高地址往低地址方向走的,出栈反之。
[补充] 在此再补充一下“字节序”,它与硬件的设计有关,通常x86系列的硬件采用小端序,MIPS大部分与网络字节序一样,采用大端序,也有采用小端序的,不过后来增强了可移植性,采用双端序,既可以使用小端模式也可以使用大端模式。(参考链接在此

这是来自Goodman&Miller的图9.9[1]注:功能描述请参考原文,这里没有完全翻译,对于初学者来说没有意义。

寄存器编号 可代替的名字[2] 英文全称 (功能)描述
0 $zero zero 值恒为0
1 $at assembler temporary 汇编器保留寄存器
2-3 $v0 , $v1 values 值来自于表达式求值和函数结果
4-7 $a0 - $a3 arguments 存储子程序调用的前4个非浮点参数,在子程序中不会跨子程序保存
8-15 $t0 - $t7 temporaries 暂存寄存器
16-23 $s0 - $s7 saved values 通用寄存器
24-25 $t8 - $t9 temporaries 临时变量,与$t0 - $t7一样
26-27 $k0 , $k1 kernel reserved 操作系统内核保留寄存器,用于中断处理
28 $gp global pointer 全局指针
29 $sp stack pointer 栈指针,指向栈顶
30 $s8 / $fp saved values / frame pointer 帧指针,用于过程调用
31 $ra return address 返回地址

也参考了Britton的章节1.9,Sweetman的章节2.21,Larus的附录章节A.6。

译者注
[1] 译者此处将图片以表格形式表现了出来。
[2] 原文Alternative name,中文意思就是:与寄存器编号等价的名字,比如,$2$v0等价。
[补充1] 这里我们可以注意到,32个寄存器被分成了不同类别,它们都有不同的用途,虽然它们都是通用寄存器,但是使用的时候,还是应该尽量按照实际功能去使用,以免发生不可知的错误。
[补充2] 学习建议:这部分内容,看一看有大概印象即可,不要强行记忆,因为初学者不太可能看得懂这些都是什么,后面需要的时候再回看,再查阅即可。

1 程序结构

  • 纯文本文件中只有数据声明和程序代码[1](文件名的后缀为.s,以能够在SPIM模拟器运行[2]
  • 数据声明部分后面跟着程序代码部分[3]

译者注:
[1] 意思是:MIPS源程序要在文本编辑器进行编辑,包含数据声明和程序代码。
[2] 推荐使用MARS模拟器来进行运行MIPS程序,这款软件一定程度兼容SPIM,并且提供了更加丰富的插件。另外,MIPS源程序文件的后缀可以是.s,也可以是.asm
[3] 先声明数据,然后再写处理数据的代码。

1.1 数据声明

  • 放置在程序段中,使用编译器指令.data来标识
  • 声明在程序中使用的变量名;存储(的变量)会被分配到主内存(RAM)中

译者注:直译后表示很难受,可能我水平不够吧……我用汉语描述一遍

  • 在MIPS源程序进行数据声明的时候,需要先加上.data,再进行数据声明
  • 在程序中需要用到的数据,需要先在数据段进行声明,并为这些数据起名
  • 这些你声明好的变量(的值),在程序运行的时候,会被系统分配到主内存中

译者注:数据声明在源程序中应该是这样的

.data  # 我要开始写数据声明了!
	variable_name_1: .word 11 # 声明了一个变量(先不用管语法)
							  # 值:11
							  # 变量名:variable_name_1
	# <其他数据声明>……

1.2 代码

  • (代码需要)放在文本(text)部分,并用.text来标识
  • .text后面的文本)包含程序代码指令
  • 代码执行的起始点要给定一个标签,例如main
  • 主代码的结束点应该使用“退出系统调用(功能)”,看下面的系统调用篇

1.3 注释

在一行上,任何在#之后的内容,将会被(编译器)认为是注释[1]

译者注:
[1] 这里的注释,也就是所谓的“单行注释”。
[补充] 下面的1.4节在原文中是包含在1.3节的,译者这里将其单独拿出来,以强调MIPS源程序结构框架。

1.4 MIPS源程序结构框架示例

下面是MIPS汇编语言程序的模板:

# 注释部分给出了程序名和函数描述
# 文件名:Template.s 
# 这是最基本的MIPS汇编语言程序框架

 .data 	# 这行之后是变量声明
# ... 

.text	 # 这行之后的是指令 
 
main: 	# 指出代码的起始点(第一个要执行的指令) 
# ... 
 
# End of program, leave a blank line afterwards to make SPIM happy
# 程序的结尾留出一个空行,让SPIM高兴[1]

译者注:
[1] make SPIM happy……外国人太有趣了,这句话含义就是,程序结束的时候多一个空行,这样看起来程序美观好看。
[补充] 原文程序的注释太多了,程序结构都看不见了…让我们留下最宝贵的部分,删掉冗余部分

.data 
	# 此处进行数据声明

.text
main:	# 这是程序入口
	# 此处编辑程序代码

2 数据声明

数据声明的形式:

name:	storage_type	value(s)

以上语句的含义是:

  • 为变量创建一个仓库(storage)[1],它指定了数据类型,给定了变量名和变量的值
  • 变量的值通常会给定初始值;对于存储类型.space,给出要被分配的空间的数字[2]

注意:标签[3]后面总是跟着冒号:

译者注:
[1] 可以理解为存储变量的容器
[2] 也就是空间的大小
[3] 指的是变量名

例子:

var1: .word 3			# create a single integer variable with initial value 3 
array1: .byte 'a','b' 	# create a 2-element character array with elements initialized to a and b 
array2: .space 40 		# allocate 40 consecutive bytes, with storage uninitialized could be used as a 40-element character array
 					    # or a 10-element integer array; a comment should indicate which!

译者注:分别解释一下这3条

  1. 创建一个integer类型的变量,变量名为var2,变量的值初始化为3
  2. 创建一个字符数组array1,包含2个字符类型元素,它们的值分别被初始化为ab
  3. 创建一个空的空间array2,在内存中分配40个连续的字节,这个没有被初始化的storage可能是一个含有40个元素的字符数组,也可能是一个含有10个元素的integer数组,由于不确定,因此建议在注释中说明space的用途。

3 load/store[1]指令

  • RAM的访问,只能使用loadstore指令[2]
  • 其他的指令只能使用寄存器操作数

译者注:
[1] load意为“加载”,可以理解为“读取”,CPU从内存中读取信息;store意为“存储”,可以理解为“写入”,CPU向内存写入信息。
[2] MIPS为RICS指令集,相比x86,它的寻址方式很少,只有这两条指令可以访问内存,也就是说,其他指令的操作数,不允许出现内存操作数

load

# 从RAM源位置,复制1个字(4个字节)到目标寄存器
lw register_destination, RAM_source

# 从RAM源位置,复制1个字节到目标寄存器的低序字节
# 并且对字节进行符号扩展,填充到高位字节中
lb register_destination, RAM_source

store

# 将源寄存器中的字(型数据),存到目标RAM(地址)中
sw register_source, RAM_destination

# 将源寄存器中的低位字节,存到目标RAM中
sb register_source, RAM_destination

load immediate

# 加载立即数到目标寄存器
li register_destination, value

举例[1]

 .data 
	var1: .word 23 		# declare storage for var1; initial value is 23 

 .text 
__start: 
	 lw $t0, var1 		# load contents of RAM location into register $t0: $t0 = var1 
 	 li $t1, 5 			# $t1 = 5 ("load immediate") 
	 sw $t1, var1 		# store contents of register $t1 into RAM: var1 = $t1  done

译者注:
[1] 这里不再翻译,根据前面的内容相信你能理解
[补充] 注意,这些指令其实就是英文全称的缩写,记忆起来非常容易,其他指令也一样,要关注其英文全称。

4 间接寻址和基址寻址

仅被用于loadstore指令。

load address

la	$t0, var1
  • var1(可能是在程序中被定义的标签)的RAM地址复制到寄存器$0

indirect addressing

lw	$t2, ($t0)
  • 加载1个字大小的数据到$t2中,数据的地址在$t0中,数据在数据地址指向的内存单元中
sw	$t2, -12($t0)

未完成

5 算数运算指令

  • 最多使用3个操作数
  • 所有操作数都是寄存器;没有RAM或者直接寻址
  • 操作数的大小都是1个字
add	 $t0,$t1,$t2 	# $t0 = $t1 + $t2; add as signed (2's complement) integers 
sub	  $t2,$t3,$t4 	# $t2 = $t3 Ð $t4 
addi  $t2,$t3, 5 	# $t2 = $t3 + 5; "add immediate" (no sub immediate) 
addu  $t1,$t6,$t7   # $t1 = $t6 + $t7; add as unsigned integers 
subu  $t1,$t6,$t7   # $t1 = $t6 + $t7; subtract as unsigned integers 

mult  $t3,$t4 		
# multiply 32-bit quantities in $t3 and $t4, and store 64-bit 
# result in special registers Lo and Hi: (Hi,Lo) = $t3 * $t4 

div	  $t5,$t6 		
# Lo = $t5 / $t6 (integer quotient) 
# Hi = $t5 mod $t6 (remainder) 

mfhi   $t0	 # move quantity in special register Hi to $t0: $t0 = Hi 
mflo   $t1	 # move quantity in special register Lo to $t1: $t1 = Lo 
			 # used to get at result of product or quotient 

move   $t2,$t3 		# $t2 = $t3

译者注:
这里不翻译了,表达式能够看懂,注意观察指令的规律,使用分治思想理解记忆:

  1. 指令是英文全称的缩写,按照意思即可记忆
  2. 指令的后缀代表特殊的含义,例如i代表立即数,u代表无符号数

6 流程控制

  • 条件分支的比较,被内嵌到了指令之中

branches

b	target 		# unconditional branch to program label target 
				# 无条件跳转到程序标签target

beq 	$t0,$t1,target 		# branch to target if $t0 = $t1 
							# 如果$t0 = $t1,就跳转到target标签
							# 下面的同理,不再一一翻译

blt 	$t0,$t1,target 		# branch to target if $t0 < $t1 
ble 	$t0,$t1,target 		# branch to target if $t0 <= $t1 
bgt 	$t0,$t1,target 		# branch to target if $t0 > $t1 
bge 	$t0,$t1,target 		# branch to target if $t0 >= $t1 
bne 	$t0,$t1,target 		# branch to target if $t0 <> $t1

译者注:这里的指令,都是英文全称,比如beq就是branch equal,其余的读者自行查阅。

jumps

j	    target 		# unconditional jump to program label target 
					# 无条件跳转到程序标签target
					
jr 		$t3 		# jump to address contained in $t3 ("jump register")
					# 跳转到某地址,地址的值在寄存器$t3中

未完成
subroutine calls

subroutine call: “jump and link” instruction

jal		sub_label		 # "jump and link"

subroutine return: “jump register” instruction

jr	$ra		 # "jump register"

注意:

译者注:原文没有解释程序标签target,译者在这里补充一下

我给出你MIPS源程序的.text部分,我们知道,程序的入口是main标签,事实上,还可以类似地定义很多标签,跳转指令中的target指的就是这些,以下为示例:

.text            # 程序代码部分 

main:  
	<代码 1>
	j	target_1		# 无条件地跳转到标签target_1的位置
						# 再从该位置继续向下执行<代码 2>

target_1:
	<代码 2>

target_2:
	<代码 3>
……    

7 系统调用与I/O(SPIM模拟器[1]

译者注:
[1] MARS模拟器兼容了一部分SPIM的系统调用,基本是够用的,依然推荐使用MARS模拟器。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章