feat(*): c语言字符串的理解

Yanbin Zhu · Yanbin Zhu · commit e76cf27e9efc · 2024-10-01T21:39:09.000+08:00
diff --git a/data/blog/c语言/pointer.mdx b/data/blog/c语言/pointer.mdx
@@ -34,7 +34,7 @@ void increment(int* p) {
 
 变量地址而不是变量值传入函数，还有一个好处。对于需要大量存储空间的大型变量，复制变量值传入函数，非常浪费时间和空间，不如传入指针来得高效。
 
-# \& 运算符
+# \&  取地址符
 
 `&`运算符用来取出一个变量所在的内存地址。
 
diff --git a/data/blog/c语言/内存管理.mdx b/data/blog/c语言/内存管理.mdx
@@ -0,0 +1,50 @@
+---
+title: 内存管理
+date: '2024-10-01'
+tags: ['C语言']
+draft: false
+summary:  内存管理
+---
+
+
+# C 语言的内存管理，分成两部分。
+
+一部分是`系统管理`的，另一部分是`用户手动管理`的。
+
+`系统管理的内存`，主要是`函数内部的变量（局部变量）`。
+这部分变量在函数运行时进入内存，函数运行结束后自动从内存卸载。
+这些变量存放的区域称为`”栈“（stack）`，`”栈“所在的内存是系统自动管理的`。
+
+`用户手动管理的内存`，主要是`程序运行的整个过程中都存在的变量（全局变量）`，这些变量需要用户手动从内存释放。
+如果使用后忘记释放，它就一直占用内存，直到程序退出，这种情况称为`”内存泄漏“（memory leak）`。
+这些变量所在的内存称为`”堆“（heap）`，`”堆“所在的内存是用户手动管理的`。
+
+
+# void指针
+前面章节已经说过了，每一块内存都有地址，通过指针变量可以获取指定地址的内存块。
+`指针变量必须有类型，否则编译器无法知道，如何解读内存块保存的二进制数据。`
+但是，向系统请求内存的时候，有时不确定会有什么样的数据写入内存，需要先获得内存块，稍后再确定写入的数据类型。
+
+为了满足这种需求，C 语言提供了一种`不定类型的指针`，叫做` void 指针`。
+它只有内存块的地址信息，没有类型信息，等到使用该块内存的时候，再向编译器补充说明，里面的数据类型是什么。
+
+另一方面，void 指针等同于无类型指针，可以指向任意类型的数据，但是`不能解读数据`。
+
+`void 指针与其他所有类型指针之间是互相转换关系`，任一类型的指针都可以转为 void 指针，而 void 指针也可以转为任一类型的指针。
+```C
+int x = 10;
+
+void* p = &x; // 整数指针转为 void 指针
+int* q = p; // void 指针转为整数指针
+```
+上面示例演示了，整数指针和 void 指针如何互相转换。`&x`是一个整数指针，p是 void 指针，赋值时`&x`的地址会自动解释为 void 类型。
+同样的，`p`再赋值给整数指针`q`时，`p`的地址会自动解释为整数指针。
+
+注意，由于不知道 void 指针指向什么类型的值，所以不能用*运算符取出它指向的值。
+```C
+char a = 'X';
+void* p = &a;
+
+printf("%c\n", *p); // 报错
+```
+上面示例中，p是一个 void 指针，所以这时无法用*p取出指针指向的值。
diff --git a/data/blog/c语言/字符串.mdx b/data/blog/c语言/字符串.mdx
@@ -0,0 +1,91 @@
+---
+title: 字符串
+date: '2024-10-01'
+tags: ['C语言']
+draft: false
+summary:  字符串
+---
+
+
+# 定义
+
+C 语言没有单独的字符串类型，字符串被当作字符数组，即`char类型的数组`。
+
+编译器会给数组分配一段连续内存，所有字符储存在相邻的内存单元之中。
+在`字符串结尾`，C 语言`会自动添加一个全是二进制0的字节，写作\0字符，表示字符串结束`。
+字符\0不同于字符0，前者的 ASCII 码是0（二进制形式00000000），
+后者的 ASCII 码是48（二进制形式00110000）。
+所以，字符串“Hello”实际储存的数组是`{'H', 'e', 'l', 'l', 'o', '\0'}`。
+
+```C
+char localString[10];
+```
+上面示例声明了一个10个成员的字符数组，可以当作字符串。由于必须留一个位置给`\0`，所以最多只能容纳9个字符的字符串。
+
+
+字符串写成数组的形式，是非常麻烦的。C 语言提供了一种简写法，双引号之中的字符，会被自动视为字符数组。
+```C
+{'H', 'e', 'l', 'l', 'o', '\0'}
+
+// 等价于
+"Hello"
+```
+上面两种字符串的写法是等价的，内部存储方式都是一样的。双引号里面的字符串，不用自己添加结尾字符\0，C 语言会自动添加。
+
+注意，双引号里面是字符串，单引号里面是字符，两者不能互换。如果把Hello放在单引号里面，编译器会报错。
+
+
+# 字符串变量的声明
+
+```C
+// 写法一
+char s[14] = "Hello, world!";
+char s[] = "Hello, world!";
+
+// 写法二
+char* s = "Hello, world!";
+```
+上面两种写法都声明了一个字符串变量s。
+如果采用第一种写法，由于字符数组的长度可以让编译器自动计算，所以声明时可以省略字符数组的长度。
+
+
+`字符指针`和`字符数组`，这两种声明字符串变量的写法`基本是等价`的，但是`有两个差异`。
+
+## 第一个差异是，指针指向的字符串，在 C 语言内部被当作常量，不能修改字符串本身
+```C
+char* s = "Hello, world!";
+s[0] = 'z'; // 错误
+```
+上面代码使用指针，声明了一个字符串变量，然后修改了字符串的第一个字符。
+这种写法是错的，会导致难以预测的后果，执行时很可能会报错。
+
+为什么字符串声明为指针时不能修改，声明为数组时就可以修改？
+原因是系统会将字符串的字面量保存在内存的常量区，这个区是不允许用户修改的。
+`声明为指针时`，`指针变量存储的值是一个指向常量区的内存地址`，因此用户`不能通过这个地址去修改常量区`。
+但是，`声明为数组时`，编译器`会给数组单独分配一段内存`，字符串字面量会`被编译器解释成字符数组`，
+逐个`字符写入这段新分配的内存`之中，而`这段新内存是允许修改`的。
+
+
+## 第二个差异是，指针变量可以指向其它字符串
+
+```C
+char* s = "hello";
+s = "world";
+```
+上面示例中，字符指针可以指向另一个字符串。
+
+但是，字符数组变量不能指向另一个字符串。
+```C
+char s[] = "hello";
+s = "world"; // 报错
+```
+上面示例中，字符数组的数组名，总是指向初始化时的字符串地址，不能修改。
+
+为什么数组变量不能赋值为另一个数组？
+原因是`数组变量所在的地址无法改变`，或者说，编译器一旦为数组变量分配地址后，
+这个地址就绑定这个数组变量了，这种绑定关系是不变的。
+C 语言也因此规定，`数组变量是一个不可修改的左值`，即不能用赋值运算符为它重新赋值。
+
+
+## Refernce
+https://wangdoc.com/clang/string