在上一章中,我们了解了地址这个调皮鬼,但是在万千数据中,我们不可能记住所有数据的存放的地址,这时,就需要用一个能够方便记忆的东西来代表数据的地址,进而代表数据本身。最简单的方式就是给数据起一个名字,而这个名字就对应指定的数据。这个“名字”就叫做“标识符”。
【资料图】
既然标识符能够代表指定的数据,那么它必然包含一些其他的信息,因为数据并不是单纯的一个数值。在前面几个章节讲解中,无论什么样的数据都至少包含三个重要元素:数据的值、数据的类型和数据的地址,至于数据究竟存储在哪里,并不是最重要的,因为只要知道数据的地址,就能够找到这个数据。
而使用标识符表示数据本身,那么标识符也应该包含这三个要素:数据的值、数据的类型和数据的地址。
但是我们要考虑到,数据是可以重复的,但是标识符是否可以重复呢?
很显然,不能!为什么呢?
因为引入标识符就是为了方便数据的可读性,我们看到标识符就能够很快清楚,标识符表达的具体含义。也就是说一旦标识符重复,就违反了我们的初衷。
那什么情况下,标识符能够“重复”呢?
很明显,当上一个标识符代表的数据被“销毁”后,同一个标识符就可以表示其他的数据,那数据销毁的标志是什么呢?这就需要对数据进行范围的限制,因为不论是理论中的数据还是自然界中的数据也同样拥有自己的“活动范围”或“有效范围”。
针对数据的“有效范围”称为数据的“生命周期”,也可以称为“作用域”,在作用域内,同样的标识符不能再次出现。这里存在一个问题:那就是一个班级是可能存在同名的学生,而这些同名的学生都可以在一个教室中“活动”。这是因为这些同名的学生可能属于不同的家庭,即所属范围不一样。
映射到编程语言中就是,数据的标识符在所属范围内应当是严格唯一的。只要所属范围不一样,那同名数据也互不影响。这里的“所属范围”也可以视为一种“作用域”,只不过这个“作用域”只存放数据。
在众多数据中,有一个特殊的存在,那就是函数。其实,函数是一种特殊的数据,它的内部不仅包含其他的数据,还有对数据的操作指令以及返回值。也就是说,“函数”本身就是一种数据类型,那该怎样定义出“函数”呢?
我们先考虑在数学中函数是如何表示的,在初等数学中,函数的表达式是f(x)=...,同时不同功能的函数的拥有不同的表达式,不同表达式的内部逻辑也可能是不一样的。例如直线的表达式:f(x)=ax+b
其中x是自变量,a和b是常数,而f是这个表达式的名字,(x)是名为f的函数的参数。而其中的f(x)就是这个表达式的声明,ax+b是表达式的定义,根据参数x求出的结果是函数f(x)的返回值或结果值。
以此类比,在C语言中,返回值的类型默认为int,即在声明和定义函数时,返回值类型一般可以不写。但参数的类型必须被指定出来。
大括号以及大括号中的内容就是名为add的函数的定义,而int add(int num1, int num2)就是函数的声明。一般而言,任何数据只有声明后,才能被够定义,定义又可以称为“实现”。定义是可以包含声明的。
这个名为add的函数的作用域就是双大括号之间的任何位置。在add函数中声明的所有数据只能在add函数内部使用,一旦超出add函数的范围,那么超出这个范围,其内部的数据就是无效的、不可访问的。
既然函数也是一种数据,那么就可以将函数内部的数据称作是函数的一些较为特殊的属性,因为这些属性只能在函数内部访问,在函数外部是不可访问的。函数内部的数据称为“局部数据”,而数据的载体一般又称为“变量”,于是“局部数据”有可以称为“局部变量”。而一些不能被修改的数据被称为“常量”。
那有没有办法能够让我们访问函数的局部变量呢?当然有!而且还很粗暴:第一种方法就是使用全局变量,全局嘛,不在任何函数内部,也就意为着谁都可以访问,没有任何限制,但会有安全问题。第二种方法就是使用共享区域的内存。
只要是被声明或这被定义出来的数据,就必然在会有一个对应的唯一的地址,只要想办法访问这个地址,就能够访问到函数的局部变量。那怎样保存数据的地址呢?指针!因为指针就是为了存储变量的地址而存在的。
标识符指的是数据本身,指针只存储数据的地址。
而指针本身就是一种数据,但标识符不是,标识符只是数据的助记符。