summaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
authorWe-unite <3205135446@qq.com>2024-09-03 22:19:09 +0800
committerWe-unite <3205135446@qq.com>2024-09-08 12:39:42 +0800
commit1e0c20812454ae1c7e1cf83f953797ee042e831f (patch)
tree0a7955aa4b6a00d898710d10238f5068ab17f1ad
parent911305a600e37a42acf69037b313912178c7010d (diff)
downloadmyweb-1e0c20812454ae1c7e1cf83f953797ee042e831f.tar.gz
myweb-1e0c20812454ae1c7e1cf83f953797ee042e831f.zip
Add poetry in shenzhen and godo notes
-rw-r--r--code/projects/godo.html362
-rw-r--r--code/projects/godo.md318
-rw-r--r--code/projects/lcm_compile.html (renamed from code/ohos/lcm_compile.html)0
-rw-r--r--code/projects/lcm_compile.md (renamed from code/ohos/lcm_compile.md)0
-rw-r--r--code/projects/ohos_compile.html (renamed from code/ohos/ohos_compile.html)0
-rw-r--r--code/projects/ohos_compile.md (renamed from code/ohos/ohos_compile.md)0
-rw-r--r--common/CSS/highlight.css10
-rw-r--r--common/script4works.html7
-rw-r--r--common/script4works.js7
-rw-r--r--works/poetry.html21
10 files changed, 714 insertions, 11 deletions
diff --git a/code/projects/godo.html b/code/projects/godo.html
new file mode 100644
index 0000000..ed64840
--- /dev/null
+++ b/code/projects/godo.html
@@ -0,0 +1,362 @@
1<!DOCTYPE html>
2<html xmlns="http://www.w3.org/1999/xhtml" lang="" xml:lang="">
3
4<head>
5 <meta charset="utf-8" />
6 <meta name="generator" content="pandoc" />
7 <meta name="viewport" content="width=device-width, initial-scale=1.0, user-scalable=yes" />
8 <title>godo知识总结</title>
9 <link rel="stylesheet" href="https://test.qin-juan-ge-zhu.top/common/CSS/pandoc.css">
10 <script type="text/javascript" src="https://test.qin-juan-ge-zhu.top/common/js/myhighlight.js"></script>
11 <script type="text/javascript" src="https://test.qin-juan-ge-zhu.top/common/script4code.js"></script>
12</head>
13
14<body>
15 <div class="pandoc">
16 <div class="main">
17 <p class="title">godo知识总结</p>
18 <h1 id="背景说明">背景说明</h1>
19 <p>本文档对<a href="https://git.qin-juan-ge-zhu.top/godo">godo</a>编写过程中新了解到的技术、遇到的问题进行简要说明,以备所需。</p>
20 <h1 id="系统调用">系统调用</h1>
21 <p>As is universually acknowledged, 操作系统、尤其是类 Unix 操作系统,以系统调用的形式对应用程序提供服务。系统调用是名称,有系统调用号与之对应(同一版本的内核在不同架构的
22 cpu 上,系统调用号可能不一样)。有的时候我们需要了解一些内核行为,但却不知道从何下手。可以通过查看内核源码来学习。</p>
23 <p>系统调用可以在源码中查找到。由于本项目使用的是 centos 7,内核版本 3.10.0-1160、cpu 为 x86-64 架构,兹以该版本内核为例说明。</p>
24 <p>要查看 fork
25 的系统调用号,查看<code>arch/x86/syscalls/syscall_64.tbl</code>。想要查看其具体的实现,则在源码根目录下<strong>执行<code>grep -rInP "SYSCALL_DEFINE\d\(fork"</code></strong>,其中
26 SYSCALL_DEFINE+数字是 kernel
27 中定义的宏,展开即完整的函数声明。通过这种查找办法,我们可以快速地定位内核中对系统调用的处理函数,查看其工作原理。查看其他的内核相关内容也可以采取类似办法,即<strong>先用 grep
28 定位大致范围、看都有什么地方用到,然后找到真正起作用的地方,读相关代码。</strong></p>
29 <p>使用这些系统调用有两种办法:</p>
30 <ul>
31 <li>在 C 语言中直接调用同名函数,但大概率经过了 glibc 的封装</li>
32 <li>手动封装。如下:</li>
33 </ul>
34 <pre><code>#include &lt;stdio.h&gt;
35#include &lt;sys/syscall.h&gt;
36#include &lt;sys/types.h&gt;
37#include &lt;sys/wait.h&gt;
38#include &lt;unistd.h&gt;
39
40int main(){
41 pid_t pid = syscall(SYS_fork);
42 // syscall是一个变参函数,第一个参数是系统调用号,接下来的是系统调用的各个参数
43 // syscall定义在 unistd.h
44 // SYS_fork定义在 sys/syscall.h
45 if(pid == 0) {
46 printf(&quot;Child!\n&quot;);
47 } else {
48 printf(&quot;Parent!\n&quot;);
49 }
50 return 0;
51}</code></pre>
52 <p>这种封装方式与经常被用来当作 os 教材的 Linux-0.11/0.12 有所区别。Linux-0.11 环境上,unistd.h 大致如下:</p>
53 <pre><code>#ifndef _UNISTD_H
54#define _UNISTD_H
55
56...
57#include &lt;sys/stat.h&gt;
58#include &lt;sys/times.h&gt;
59#include &lt;sys/utsname.h&gt;
60#include &lt;utime.h&gt;
61
62#ifdef __LIBRARY__
63
64#define __NR_setup 0 /* used only by init, to get system going */
65#define __NR_exit 1
66#define __NR_fork 2
67#define __NR_read 3
68#define __NR_write 4
69#define __NR_open 5
70#define __NR_close 6
71...
72
73#define _syscall0(type,name) \
74 type name(void) \
75{ \
76long __res; \
77__asm__ volatile (&quot;int $0x80&quot; \
78 : &quot;=a&quot; (__res) \
79 : &quot;0&quot; (__NR_##name)); \
80if (__res &gt;= 0) \
81 return (type) __res; \
82errno = -__res; \
83return -1; \
84}
85
86#define _syscall1(type,name,atype,a) \
87type name(atype a) \
88{ \
89long __res; \
90__asm__ volatile (&quot;int $0x80&quot; \
91 : &quot;=a&quot; (__res) \
92 : &quot;0&quot; (__NR_##name),&quot;b&quot; ((long)(a))); \
93if (__res &gt;= 0) \
94 return (type) __res; \
95errno = -__res; \
96return -1; \
97}
98
99...
100#endif /* __LIBRARY__ */
101...
102
103#endif</code></pre>
104 <p>可以看到,Linux-0.11 上,封装的一般方法为:</p>
105 <pre><code>#define __LIBRARY__ // 一定要在unistd.h之前
106#include &lt;unistd.h&gt;
107#include &lt;stdio.h&gt;
108
109syscall0(int, fork); // 宏替换后这就是个名为fork的函数的具体实现了
110int main() {
111 if(fork() == 0) {
112 printf(&quot;Child!\n&quot;);
113 } else {
114 printf(&quot;Parent!\n&quot;);
115 }
116 return 0;
117}</code></pre>
118 <p>但是无论如何,一般情况下不推荐手动封装,这不是 release 版该有的做法。</p>
119 <p>此外,从汇编代码来看,Linux-0.11 所用的 80386
120 芯片,不提供专门的系统调用指令,因而该系统使用的是<code>int 0x80</code>中断指令,通过注册中断处理函数进行对应处理;而<strong>现代 x86 提供了专门的 syscall
121 指令</strong>,Linux 系统直接用该指令进行系统调用。</p>
122 <h2 id="系统调用中的进程与线程">系统调用中的进程与线程</h2>
123 <p>一般地,在 Linux 系统上,我们以 pid 指代进程号,而进程可以有多个线程。很显然,真正被调度执行的单元应该是线程,换言之,<strong>是 thread 而非 process 真正地对应着内核中
124 tasks 表里的一个 task,而每个 task 才具有独一无二的 id</strong>。</p>
125 <h3 id="常见系统调用的分析">常见系统调用的分析</h3>
126 <p>看看这个:</p>
127 <pre><code>extern int pthread_create (pthread_t *__restrict __newthread,
128 const pthread_attr_t *__restrict __attr,
129 void *(*__start_routine) (void *),
130 void *__restrict __arg) __THROWNL __nonnull ((1, 3));</code></pre>
131 <p><code>pthread_create</code>函数的第一个参数,就是一个 pthread_t 类型的指针,处理后将 task 的 id 写到指针指向的区域。</p>
132 <p>让我们来看一段简单的代码:</p>
133 <pre><code>// test.c
134#include &lt;stdio.h&gt;
135#include &lt;pthread.h&gt;
136#include &lt;sys/syscall.h&gt;
137#include &lt;sys/types.h&gt;
138#include &lt;unistd.h&gt;
139
140void *test(void *args) {
141 printf(&quot;Hello, I&#39;m %d\n&quot;, getpid());
142}
143
144int main() {
145 pthread_t pthid;
146 int pid;
147 pthread_create(&amp;pthid, NULL, test, NULL);
148 printf(&quot;main: thread %ld\n&quot;, pthid);
149 pthread_join(pthid, NULL);
150 if ((pid = fork()) == 0) {
151 printf(&quot;Hello, I&#39;m %d\n&quot;, getpid());
152 return 0;
153 }
154 printf(&quot;main: child process %d\n&quot;,pid);
155 if ((pid = syscall(SYS_fork)) == 0) {
156 printf(&quot;Hello, I&#39;m %d\n&quot;, getpid());
157 return 0;
158 }
159 printf(&quot;main: child process %d\n&quot;,pid);
160 return 0;
161}</code></pre>
162 <p>当我们使用<code>strace ./test</code>来查看上述代码时,会发现情况如下:</p>
163 <pre><code>clone(child_stack=0x7f3dd28bbff0, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0x7f3dd28bc9d0, tls=0x7f3dd28bc700, child_tidptr=0x7f3dd28bc9d0) = 21756
164write(1, &quot;main: thread 139903502108416\n&quot;, 29) = 29
165clone(child_stack=NULL, flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD, child_tidptr=0x7f3dd308e9d0) = 21757
166--- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=21757, si_uid=1000, si_status=0, si_utime=0, si_stime=0} ---
167write(1, &quot;main: child process 21757\n&quot;, 26) = 26
168fork() = 21758
169--- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=21758, si_uid=1000, si_status=0, si_utime=0, si_stime=0} ---
170write(1, &quot;main: child process 21758\n&quot;, 26) = 26
171exit_group(0) = ?
172+++ exited with 0 +++</code></pre>
173 <p>从这样的输出里,我们可以清晰地看到,<strong>无论是<code>pthread_create</code>还是<code>fork</code>(指库函数),本质上都是封装了<code>clone</code>系统调用,即使
174 Linux 本身提供了专门的 fork 系统调用。</strong>也许这是 glibc 和 Linux 都想在添加功能的基础上保证代码兼容性?花开两朵各表一枝了属于是。</p>
175 <p>这一结论也可以从 glibc 的代码中得到验证:</p>
176 <pre><code>// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/pt-fork.c
177pid_t
178__fork (void)
179{
180 return __libc_fork ();
181}
182strong_alias (__fork, fork)
183
184
185// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/fork.c
186pid_t
187__libc_fork (void)
188{
189 ... // 一堆不知所云的代码
190#ifdef ARCH_FORK
191 pid = ARCH_FORK ();
192#else
193# error &quot;ARCH_FORK must be defined so that the CLONE_SETTID flag is used&quot;
194 pid = INLINE_SYSCALL (fork, 0);
195#endif
196 ... // 又是一堆不知所云的代码
197}
198
199// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/x86_64/fork.c
200#define ARCH_FORK() \
201 INLINE_SYSCALL (clone, 4, \
202 CLONE_CHILD_SETTID | CLONE_CHILD_CLEARTID | SIGCHLD, 0, \
203 NULL, &amp;THREAD_SELF-&gt;tid)
204
205// 文件 glibc-2.18/sysdeps/unix/sysv/linux/x86_64/syscall.S
206
207/* Please consult the file sysdeps/unix/sysv/linux/x86-64/sysdep.h for
208 more information about the value -4095 used below. */
209 .text
210ENTRY (syscall)
211 movq %rdi, %rax /* Syscall number -&gt; rax. */
212 movq %rsi, %rdi /* shift arg1 - arg5. */
213 movq %rdx, %rsi
214 movq %rcx, %rdx
215 movq %r8, %r10
216 movq %r9, %r8
217 movq 8(%rsp),%r9 /* arg6 is on the stack. */
218 syscall /* Do the system call. */
219 cmpq $-4095, %rax /* Check %rax for error. */
220 jae SYSCALL_ERROR_LABEL /* Jump to error handler if error. */
221 ret /* Return to caller. */
222
223PSEUDO_END (syscall)</code></pre>
224 <p>可以看到,fork 库函数实际上是掉入了<code>__libc_fork</code>,在经过各种处理之后,如果 glibc 中该平台的相关代码里定义了 ARCH_FORK
225 宏,则调用之;否则会直接调用<code>INLINE_SYSCALL</code>(这是 glibc
226 各个平台的代码里都有的宏);而如果直接调用<code>syscall</code>函数手动封装系统调用,则调用什么就是什么。<code>syscall</code>函数调用过程涉及延迟绑定等问题,就不是这里的重点了,而且我也没太搞明白,有机会单开一篇吧。
227 </p>
228 <h3 id="进程与线程">进程与线程</h3>
229 <p>对于一个进程而言,它有很多线程,每个线程有一个号,但整个进程都有主线程的号,称为 tgid,只有一个 tgid 能真正地代表一个进程,而 pid 事实上是 task 的编号。</p>
230 <p>对于 netlink connector 而言,它听到的 fork 并不是 fork,而是 clone;对于 audit,也只能听到 clone 而听不到 fork。这是因为在内核中,fork 也是通过调用
231 clone 的处理函数来进行的。clone 创建的是一个 task,至于具体是进程还是线程,取决于用的 flag 参数,参见 manual 手册。</p>
232 <p>因而,无论使用 connector 还是 audit,拿到的都是 pid,只不过 connector 可以直接拿到 tgid、据此确定是进程还是线程,而 audit 只能拿到 pid,需要从 clone
233 的参数里查看是进程还是线程,且拿不到 tgid。这也就是我在项目中选择使用 connector 听进程消息的原因。</p>
234 <p>干巴巴说了这么多,其实就是想说,pid 也许在不同的语境下有不同含义。</p>
235 <h1 id="docker-使用的技术">docker 使用的技术</h1>
236 <h2 id="cgroup">cgroup</h2>
237 <p>Linux 下用来控制进程资源的东西。没学明白,留缺。姑且抄点书上的内容来占个位置吧。</p>
238 <p>cgroup 是 control group 的简写,是 Linux 内核提供的一个特性,用于限制和隔离一组进程对系统资源的使用,也即做进程的 QoS。控制的资源主要包括 cpu、内存、block
239 IO、网络带宽等。该特性自 2.6.24 开始进入内核主线,目前各大发行版都默认打开了该特性。</p>
240 <p>从实现角度,cgroup 实现了一个通用的进程分组框架,而不同类型资源的具体管理由各个 cgroup 子系统实现。截至内核 4.1,已经实现的子系统及其作用如下:</p>
241 <table>
242 <thead>
243 <tr class="header">
244 <th>子系统</th>
245 <th>作用</th>
246 </tr>
247 </thead>
248 <tbody>
249 <tr class="odd">
250 <td>devices</td>
251 <td>设备权限控制</td>
252 </tr>
253 <tr class="even">
254 <td>cpuset</td>
255 <td>分配指定的 cpu 和内存节点</td>
256 </tr>
257 <tr class="odd">
258 <td>cpu</td>
259 <td>控制 cpu 占用率</td>
260 </tr>
261 <tr class="even">
262 <td>cpuacct</td>
263 <td>统计 cpu 使用情况</td>
264 </tr>
265 <tr class="odd">
266 <td>memory</td>
267 <td>限制内存使用上限</td>
268 </tr>
269 <tr class="even">
270 <td>freezer</td>
271 <td>冻结暂停 cgroup 中的进程</td>
272 </tr>
273 <tr class="odd">
274 <td>net_cls</td>
275 <td>配合 tc(traffic controller)限制网络带宽</td>
276 </tr>
277 <tr class="even">
278 <td>net_prio</td>
279 <td>设置进程网络流量优先级</td>
280 </tr>
281 <tr class="odd">
282 <td>huge_tlb</td>
283 <td>限制 huge_tlb 的使用</td>
284 </tr>
285 <tr class="even">
286 <td>perf_event</td>
287 <td>允许 Perf 工具基于 cgroup 分组做性能监测</td>
288 </tr>
289 </tbody>
290 </table>
291 <p>cgroup 原生接口通过 cgroupfs 提供,类似于 procfs 和 sysfs,是一种虚拟文件系统。具体使用与分析参见《Docker 进阶与实战》。</p>
292 <h2 id="namespace">namespace</h2>
293 <p>namespace 是将内核的全局资源做封装,使每个 namespace 拥有独立的资源,进程在各自的 namespace 中对相同资源的使用不会互相干扰。比如主机名 hostname 作为全局资源,执行
294 sethostname 系统调用会影响到其他进程;内核通过实现 UTS namespace,将不同进程分割在不同的 namespace 中,实现了隔离,一个 namespace 修改主机名不影响别的
295 namespace。</p>
296 <p>目前内核实现了以下几种 namespace:</p>
297 <table>
298 <thead>
299 <tr class="header">
300 <th>namespace</th>
301 <th>作用</th>
302 </tr>
303 </thead>
304 <tbody>
305 <tr class="odd">
306 <td>IPC</td>
307 <td>隔离 System V IPC 和 POSIX 消息队列</td>
308 </tr>
309 <tr class="even">
310 <td>Network</td>
311 <td>隔离网络资源</td>
312 </tr>
313 <tr class="odd">
314 <td>Mount</td>
315 <td>隔离文件系统挂载点</td>
316 </tr>
317 <tr class="even">
318 <td>PID</td>
319 <td>隔离进程 ID</td>
320 </tr>
321 <tr class="odd">
322 <td>UTS</td>
323 <td>隔离主机名和域名</td>
324 </tr>
325 <tr class="even">
326 <td>User</td>
327 <td>隔离用户 ID 与组 ID</td>
328 </tr>
329 </tbody>
330 </table>
331 <p>对 namespace 的操作主要通过<code>clone/setns/unshare</code>三个系统调用来实现。详细的使用也不写了,没用过的东西就不全抄。记得读书和自己实验,补到这里。</p>
332 <h3 id="文件系统">文件系统</h3>
333 <p>众所周知,docker 的文件系统是分层的,有镜像文件等一堆东西。文件系统分为若干层,在开启 docker 的时候会被联合挂载到同一个点下,作为 docker
334 的根目录。这叫做联合挂载,即将多个目录和文件系统挂载到同一个目录下,其中可能有覆盖等。</p>
335 <p>docker 进程运行在宿主机的内核上,但是根文件系统又要用 docker 自己挂载的目录,且后来的进程也需要进入该目录。这里采用的技术是 pivot_root,该系统调用允许进程切换根目录。</p>
336 <p>在根目录挂载完成之后,docker 拉起一个初始 shell(正如 Linux-0.11 启动的时候也会有一个 shell 干活),这是 docker 中第一个进程,它调用 pivot_root
337 切换根目录。在切换完成之后,当我们执行 docker exec 时,这是一个 docker 的新的进程,但该进程不再 pivot_root,而是打开第一个进程的 namespace,通过 setns
338 系统调用,将自己的 namespace 设置为与其相同。由于 mnt 的 namespace 的存在,进程的根目录也就与第一个进程一样了。</p>
339 <h1 id="书籍列表">书籍列表</h1>
340 <p><strong>毕业之前读完这些属实是有点难为人了,一个比一个硬,一次性啃完能给我门牙崩了;但是定点投放耗材市场之后,估计也不会有啥精力琢磨这些玩意了</strong>。能读一点是一点吧。</p>
341 <p>感觉自己现在已经染上班味了,绝症,没得治。</p>
342 <ul>
343 <li>SRE:Google 运维解密</li>
344 <li>Linker and Loader</li>
345 <li>有空自己解析一下 ELF?</li>
346 <li>Docker 进阶与实战</li>
347 <li>containerd 原理剖析与实战</li>
348 <li>Linux 内核源码情景分析</li>
349 <li><a href="https://www.linuxfromscratch.org/lfs/">LFS</a> 网站,自己从软件包开始搭建 Linux</li>
350 <li>构建嵌入式 Linux 系统</li>
351 </ul>
352 <p>也许我应该把它们列入进阶版:</p>
353 <ul>
354 <li>gcc 技术大全</li>
355 <li>黑客调试技术大全</li>
356 </ul>
357 <script src="https://test.qin-juan-ge-zhu.top/common/js/comment.js"></script>
358 </div>
359 </div>
360</body>
361
362</html> \ No newline at end of file
diff --git a/code/projects/godo.md b/code/projects/godo.md
new file mode 100644
index 0000000..ec6e7f5
--- /dev/null
+++ b/code/projects/godo.md
@@ -0,0 +1,318 @@
1# 背景说明
2
3本文档对[godo](https://git.qin-juan-ge-zhu.top/godo)编写过程中新了解到的技术、遇到的问题进行简要说明,以备所需。
4
5# 系统调用
6
7As is universually acknowledged, 操作系统、尤其是类 Unix 操作系统,以系统调用的形式对应用程序提供服务。系统调用是名称,有系统调用号与之对应(同一版本的内核在不同架构的 cpu 上,系统调用号可能不一样)。有的时候我们需要了解一些内核行为,但却不知道从何下手。可以通过查看内核源码来学习。
8
9系统调用可以在源码中查找到。由于本项目使用的是 centos 7,内核版本 3.10.0-1160、cpu 为 x86-64 架构,兹以该版本内核为例说明。
10
11要查看 fork 的系统调用号,查看`arch/x86/syscalls/syscall_64.tbl`。想要查看其具体的实现,则在源码根目录下**执行`grep -rInP "SYSCALL_DEFINE\d\(fork"`**,其中 SYSCALL_DEFINE+数字是 kernel 中定义的宏,展开即完整的函数声明。通过这种查找办法,我们可以快速地定位内核中对系统调用的处理函数,查看其工作原理。查看其他的内核相关内容也可以采取类似办法,即**先用 grep 定位大致范围、看都有什么地方用到,然后找到真正起作用的地方,读相关代码。**
12
13使用这些系统调用有两种办法:
14
15- 在 C 语言中直接调用同名函数,但大概率经过了 glibc 的封装
16- 手动封装。如下:
17
18```c
19#include <stdio.h>
20#include <sys/syscall.h>
21#include <sys/types.h>
22#include <sys/wait.h>
23#include <unistd.h>
24
25int main(){
26 pid_t pid = syscall(SYS_fork);
27 // syscall是一个变参函数,第一个参数是系统调用号,接下来的是系统调用的各个参数
28 // syscall定义在 unistd.h
29 // SYS_fork定义在 sys/syscall.h
30 if(pid == 0) {
31 printf("Child!\n");
32 } else {
33 printf("Parent!\n");
34 }
35 return 0;
36}
37```
38
39这种封装方式与经常被用来当作 os 教材的 Linux-0.11/0.12 有所区别。Linux-0.11 环境上,unistd.h 大致如下:
40
41```c
42#ifndef _UNISTD_H
43#define _UNISTD_H
44
45...
46#include <sys/stat.h>
47#include <sys/times.h>
48#include <sys/utsname.h>
49#include <utime.h>
50
51#ifdef __LIBRARY__
52
53#define __NR_setup 0 /* used only by init, to get system going */
54#define __NR_exit 1
55#define __NR_fork 2
56#define __NR_read 3
57#define __NR_write 4
58#define __NR_open 5
59#define __NR_close 6
60...
61
62#define _syscall0(type,name) \
63 type name(void) \
64{ \
65long __res; \
66__asm__ volatile ("int $0x80" \
67 : "=a" (__res) \
68 : "0" (__NR_##name)); \
69if (__res >= 0) \
70 return (type) __res; \
71errno = -__res; \
72return -1; \
73}
74
75#define _syscall1(type,name,atype,a) \
76type name(atype a) \
77{ \
78long __res; \
79__asm__ volatile ("int $0x80" \
80 : "=a" (__res) \
81 : "0" (__NR_##name),"b" ((long)(a))); \
82if (__res >= 0) \
83 return (type) __res; \
84errno = -__res; \
85return -1; \
86}
87
88...
89#endif /* __LIBRARY__ */
90...
91
92#endif
93```
94
95可以看到,Linux-0.11 上,封装的一般方法为:
96
97```c
98#define __LIBRARY__ // 一定要在unistd.h之前
99#include <unistd.h>
100#include <stdio.h>
101
102syscall0(int, fork); // 宏替换后这就是个名为fork的函数的具体实现了
103int main() {
104 if(fork() == 0) {
105 printf("Child!\n");
106 } else {
107 printf("Parent!\n");
108 }
109 return 0;
110}
111```
112
113但是无论如何,一般情况下不推荐手动封装,这不是 release 版该有的做法。
114
115此外,从汇编代码来看,Linux-0.11 所用的 80386 芯片,不提供专门的系统调用指令,因而该系统使用的是`int 0x80`中断指令,通过注册中断处理函数进行对应处理;而**现代 x86 提供了专门的 syscall 指令**,Linux 系统直接用该指令进行系统调用。
116
117## 系统调用中的进程与线程
118
119一般地,在 Linux 系统上,我们以 pid 指代进程号,而进程可以有多个线程。很显然,真正被调度执行的单元应该是线程,换言之,**是 thread 而非 process 真正地对应着内核中 tasks 表里的一个 task,而每个 task 才具有独一无二的 id**。
120
121### 常见系统调用的分析
122
123看看这个:
124
125```c
126extern int pthread_create (pthread_t *__restrict __newthread,
127 const pthread_attr_t *__restrict __attr,
128 void *(*__start_routine) (void *),
129 void *__restrict __arg) __THROWNL __nonnull ((1, 3));
130```
131
132`pthread_create`函数的第一个参数,就是一个 pthread_t 类型的指针,处理后将 task 的 id 写到指针指向的区域。
133
134让我们来看一段简单的代码:
135
136```c
137// test.c
138#include <stdio.h>
139#include <pthread.h>
140#include <sys/syscall.h>
141#include <sys/types.h>
142#include <unistd.h>
143
144void *test(void *args) {
145 printf("Hello, I'm %d\n", getpid());
146}
147
148int main() {
149 pthread_t pthid;
150 int pid;
151 pthread_create(&pthid, NULL, test, NULL);
152 printf("main: thread %ld\n", pthid);
153 pthread_join(pthid, NULL);
154 if ((pid = fork()) == 0) {
155 printf("Hello, I'm %d\n", getpid());
156 return 0;
157 }
158 printf("main: child process %d\n",pid);
159 if ((pid = syscall(SYS_fork)) == 0) {
160 printf("Hello, I'm %d\n", getpid());
161 return 0;
162 }
163 printf("main: child process %d\n",pid);
164 return 0;
165}
166```
167
168当我们使用`strace ./test`来查看上述代码时,会发现情况如下:
169
170```c
171clone(child_stack=0x7f3dd28bbff0, flags=CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGHAND|CLONE_THREAD|CLONE_SYSVSEM|CLONE_SETTLS|CLONE_PARENT_SETTID|CLONE_CHILD_CLEARTID, parent_tidptr=0x7f3dd28bc9d0, tls=0x7f3dd28bc700, child_tidptr=0x7f3dd28bc9d0) = 21756
172write(1, "main: thread 139903502108416\n", 29) = 29
173clone(child_stack=NULL, flags=CLONE_CHILD_CLEARTID|CLONE_CHILD_SETTID|SIGCHLD, child_tidptr=0x7f3dd308e9d0) = 21757
174--- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=21757, si_uid=1000, si_status=0, si_utime=0, si_stime=0} ---
175write(1, "main: child process 21757\n", 26) = 26
176fork() = 21758
177--- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=21758, si_uid=1000, si_status=0, si_utime=0, si_stime=0} ---
178write(1, "main: child process 21758\n", 26) = 26
179exit_group(0) = ?
180+++ exited with 0 +++
181```
182
183从这样的输出里,我们可以清晰地看到,**无论是`pthread_create`还是`fork`(指库函数),本质上都是封装了`clone`系统调用,即使 Linux 本身提供了专门的 fork 系统调用。**也许这是 glibc 和 Linux 都想在添加功能的基础上保证代码兼容性?花开两朵各表一枝了属于是。
184
185这一结论也可以从 glibc 的代码中得到验证:
186
187```c
188// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/pt-fork.c
189pid_t
190__fork (void)
191{
192 return __libc_fork ();
193}
194strong_alias (__fork, fork)
195
196
197// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/fork.c
198pid_t
199__libc_fork (void)
200{
201 ... // 一堆不知所云的代码
202#ifdef ARCH_FORK
203 pid = ARCH_FORK ();
204#else
205# error "ARCH_FORK must be defined so that the CLONE_SETTID flag is used"
206 pid = INLINE_SYSCALL (fork, 0);
207#endif
208 ... // 又是一堆不知所云的代码
209}
210
211// 文件 glibc-2.18/nptl/sysdeps/unix/sysv/linux/x86_64/fork.c
212#define ARCH_FORK() \
213 INLINE_SYSCALL (clone, 4, \
214 CLONE_CHILD_SETTID | CLONE_CHILD_CLEARTID | SIGCHLD, 0, \
215 NULL, &THREAD_SELF->tid)
216
217// 文件 glibc-2.18/sysdeps/unix/sysv/linux/x86_64/syscall.S
218
219/* Please consult the file sysdeps/unix/sysv/linux/x86-64/sysdep.h for
220 more information about the value -4095 used below. */
221 .text
222ENTRY (syscall)
223 movq %rdi, %rax /* Syscall number -> rax. */
224 movq %rsi, %rdi /* shift arg1 - arg5. */
225 movq %rdx, %rsi
226 movq %rcx, %rdx
227 movq %r8, %r10
228 movq %r9, %r8
229 movq 8(%rsp),%r9 /* arg6 is on the stack. */
230 syscall /* Do the system call. */
231 cmpq $-4095, %rax /* Check %rax for error. */
232 jae SYSCALL_ERROR_LABEL /* Jump to error handler if error. */
233 ret /* Return to caller. */
234
235PSEUDO_END (syscall)
236```
237
238可以看到,fork 库函数实际上是掉入了`__libc_fork`,在经过各种处理之后,如果 glibc 中该平台的相关代码里定义了 ARCH_FORK 宏,则调用之;否则会直接调用`INLINE_SYSCALL`(这是 glibc 各个平台的代码里都有的宏);而如果直接调用`syscall`函数手动封装系统调用,则调用什么就是什么。`syscall`函数调用过程涉及延迟绑定等问题,就不是这里的重点了,而且我也没太搞明白,有机会单开一篇吧。
239
240### 进程与线程
241
242对于一个进程而言,它有很多线程,每个线程有一个号,但整个进程都有主线程的号,称为 tgid,只有一个 tgid 能真正地代表一个进程,而 pid 事实上是 task 的编号。
243
244对于 netlink connector 而言,它听到的 fork 并不是 fork,而是 clone;对于 audit,也只能听到 clone 而听不到 fork。这是因为在内核中,fork 也是通过调用 clone 的处理函数来进行的。clone 创建的是一个 task,至于具体是进程还是线程,取决于用的 flag 参数,参见 manual 手册。
245
246因而,无论使用 connector 还是 audit,拿到的都是 pid,只不过 connector 可以直接拿到 tgid、据此确定是进程还是线程,而 audit 只能拿到 pid,需要从 clone 的参数里查看是进程还是线程,且拿不到 tgid。这也就是我在项目中选择使用 connector 听进程消息的原因。
247
248干巴巴说了这么多,其实就是想说,pid 也许在不同的语境下有不同含义。
249
250# docker 使用的技术
251
252## cgroup
253
254Linux 下用来控制进程资源的东西。没学明白,留缺。姑且抄点书上的内容来占个位置吧。
255
256cgroup 是 control group 的简写,是 Linux 内核提供的一个特性,用于限制和隔离一组进程对系统资源的使用,也即做进程的 QoS。控制的资源主要包括 cpu、内存、block IO、网络带宽等。该特性自 2.6.24 开始进入内核主线,目前各大发行版都默认打开了该特性。
257
258从实现角度,cgroup 实现了一个通用的进程分组框架,而不同类型资源的具体管理由各个 cgroup 子系统实现。截至内核 4.1,已经实现的子系统及其作用如下:
259
260| 子系统 | 作用 |
261| ---------- | ----------------------------------------- |
262| devices | 设备权限控制 |
263| cpuset | 分配指定的 cpu 和内存节点 |
264| cpu | 控制 cpu 占用率 |
265| cpuacct | 统计 cpu 使用情况 |
266| memory | 限制内存使用上限 |
267| freezer | 冻结暂停 cgroup 中的进程 |
268| net_cls | 配合 tc(traffic controller)限制网络带宽 |
269| net_prio | 设置进程网络流量优先级 |
270| huge_tlb | 限制 huge_tlb 的使用 |
271| perf_event | 允许 Perf 工具基于 cgroup 分组做性能监测 |
272
273cgroup 原生接口通过 cgroupfs 提供,类似于 procfs 和 sysfs,是一种虚拟文件系统。具体使用与分析参见《Docker 进阶与实战》。
274
275## namespace
276
277namespace 是将内核的全局资源做封装,使每个 namespace 拥有独立的资源,进程在各自的 namespace 中对相同资源的使用不会互相干扰。比如主机名 hostname 作为全局资源,执行 sethostname 系统调用会影响到其他进程;内核通过实现 UTS namespace,将不同进程分割在不同的 namespace 中,实现了隔离,一个 namespace 修改主机名不影响别的 namespace。
278
279目前内核实现了以下几种 namespace:
280
281| namespace | 作用 |
282| --------- | ----------------------------------- |
283| IPC | 隔离 System V IPC 和 POSIX 消息队列 |
284| Network | 隔离网络资源 |
285| Mount | 隔离文件系统挂载点 |
286| PID | 隔离进程 ID |
287| UTS | 隔离主机名和域名 |
288| User | 隔离用户 ID 与组 ID |
289
290对 namespace 的操作主要通过`clone/setns/unshare`三个系统调用来实现。详细的使用也不写了,没用过的东西就不全抄。记得读书和自己实验,补到这里。
291
292### 文件系统
293
294众所周知,docker 的文件系统是分层的,有镜像文件等一堆东西。文件系统分为若干层,在开启 docker 的时候会被联合挂载到同一个点下,作为 docker 的根目录。这叫做联合挂载,即将多个目录和文件系统挂载到同一个目录下,其中可能有覆盖等。
295
296docker 进程运行在宿主机的内核上,但是根文件系统又要用 docker 自己挂载的目录,且后来的进程也需要进入该目录。这里采用的技术是 pivot_root,该系统调用允许进程切换根目录。
297
298在根目录挂载完成之后,docker 拉起一个初始 shell(正如 Linux-0.11 启动的时候也会有一个 shell 干活),这是 docker 中第一个进程,它调用 pivot_root 切换根目录。在切换完成之后,当我们执行 docker exec 时,这是一个 docker 的新的进程,但该进程不再 pivot_root,而是打开第一个进程的 namespace,通过 setns 系统调用,将自己的 namespace 设置为与其相同。由于 mnt 的 namespace 的存在,进程的根目录也就与第一个进程一样了。
299
300# 书籍列表
301
302**毕业之前读完这些属实是有点难为人了,一个比一个硬,一次性啃完能给我门牙崩了;但是定点投放耗材市场之后,估计也不会有啥精力琢磨这些玩意了**。能读一点是一点吧。
303
304感觉自己现在已经染上班味了,绝症,没得治。
305
306- SRE:Google 运维解密
307- Linker and Loader
308- 有空自己解析一下 ELF?
309- Docker 进阶与实战
310- containerd 原理剖析与实战
311- Linux 内核源码情景分析
312- [LFS](https://www.linuxfromscratch.org/lfs/) 网站,自己从软件包开始搭建 Linux
313- 构建嵌入式 Linux 系统
314
315也许我应该把它们列入进阶版:
316
317- gcc 技术大全
318- 黑客调试技术大全
diff --git a/code/ohos/lcm_compile.html b/code/projects/lcm_compile.html
index dbc8109..dbc8109 100644
--- a/code/ohos/lcm_compile.html
+++ b/code/projects/lcm_compile.html
diff --git a/code/ohos/lcm_compile.md b/code/projects/lcm_compile.md
index 8f34297..8f34297 100644
--- a/code/ohos/lcm_compile.md
+++ b/code/projects/lcm_compile.md
diff --git a/code/ohos/ohos_compile.html b/code/projects/ohos_compile.html
index bf72035..bf72035 100644
--- a/code/ohos/ohos_compile.html
+++ b/code/projects/ohos_compile.html
diff --git a/code/ohos/ohos_compile.md b/code/projects/ohos_compile.md
index 150ee25..150ee25 100644
--- a/code/ohos/ohos_compile.md
+++ b/code/projects/ohos_compile.md
diff --git a/common/CSS/highlight.css b/common/CSS/highlight.css
index 092a52b..14b71ed 100644
--- a/common/CSS/highlight.css
+++ b/common/CSS/highlight.css
@@ -73,7 +73,11 @@ pre .btn-tip {
73 border-radius: 4px; 73 border-radius: 4px;
74} 74}
75 75
76/* 代码复制时全选但不能被看到 */ 76/* 代码复制时全选但不能被看到
77code ::selection { 77 * 该功能是不道德的,用户想要怎么复制是人家的权利
78 * 即使是自己用起来也经常只需要复制一段
79 * 所以还是让用户自由复制吧
80 */
81/* code ::selection {
78 background-color: rgba(0, 0, 0, 0); 82 background-color: rgba(0, 0, 0, 0);
79} \ No newline at end of file 83} */ \ No newline at end of file
diff --git a/common/script4works.html b/common/script4works.html
index 0080751..b865bf1 100644
--- a/common/script4works.html
+++ b/common/script4works.html
@@ -156,10 +156,11 @@
156 <a href="https://www.qin-juan-ge-zhu.top/code/zeal.html">Zeal文档下载</a> 156 <a href="https://www.qin-juan-ge-zhu.top/code/zeal.html">Zeal文档下载</a>
157 </div> 157 </div>
158 158
159 <a onclick="clickit('grandson23')">-OHOS 文档</a> 159 <a onclick="clickit('grandson23')">-项目文档</a>
160 <div class="grandson" id="grandson23" style="display: none;"> 160 <div class="grandson" id="grandson23" style="display: none;">
161 <a href="https://www.qin-juan-ge-zhu.top/code/ohos/ohos_compile.html">OpenHarmony编译</a> 161 <a href="https://www.qin-juan-ge-zhu.top/code/projects/ohos_compile.html">OpenHarmony编译</a>
162 <a href="https://www.qin-juan-ge-zhu.top/code/ohos/lcm_compile.html">LCM交叉编译/a> 162 <a href="https://www.qin-juan-ge-zhu.top/code/projects/lcm_compile.html">LCM交叉编译</a>
163 <a href="https://www.qin-juan-ge-zhu.top/code/projects/godo.html">godo知识总结</a>
163 </div> 164 </div>
164 165
165 <a onclick="clickit('grandson24')">-功能网页</a> 166 <a onclick="clickit('grandson24')">-功能网页</a>
diff --git a/common/script4works.js b/common/script4works.js
index 68090f1..0ae78a2 100644
--- a/common/script4works.js
+++ b/common/script4works.js
@@ -157,10 +157,11 @@ document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code
157document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/zeal.html\">Zeal文档下载</a>"); 157document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/zeal.html\">Zeal文档下载</a>");
158document.writeln(" </div>"); 158document.writeln(" </div>");
159document.writeln(""); 159document.writeln("");
160document.writeln(" <a onclick=\"clickit(\'grandson23\')\">-OHOS 文档</a>"); 160document.writeln(" <a onclick=\"clickit(\'grandson23\')\">-项目文档</a>");
161document.writeln(" <div class=\"grandson\" id=\"grandson23\" style=\"display: none;\">"); 161document.writeln(" <div class=\"grandson\" id=\"grandson23\" style=\"display: none;\">");
162document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/ohos/ohos_compile.html\">OpenHarmony编译</a>"); 162document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/projects/ohos_compile.html\">OpenHarmony编译</a>");
163document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/ohos/lcm_compile.html\">LCM交叉编译/a>"); 163document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/projects/lcm_compile.html\">LCM交叉编译</a>");
164document.writeln(" <a href=\"https://www.qin-juan-ge-zhu.top/code/projects/godo.html\">godo知识总结</a>");
164document.writeln(" </div>"); 165document.writeln(" </div>");
165document.writeln(""); 166document.writeln("");
166document.writeln(" <a onclick=\"clickit(\'grandson24\')\">-功能网页</a>"); 167document.writeln(" <a onclick=\"clickit(\'grandson24\')\">-功能网页</a>");
diff --git a/works/poetry.html b/works/poetry.html
index 27fff26..e4dcbfa 100644
--- a/works/poetry.html
+++ b/works/poetry.html
@@ -61,7 +61,9 @@
61 <span role="listitem" class="md-toc-item md-toc-h1" data-ref="n172"><a class="md-toc-inner" 61 <span role="listitem" class="md-toc-item md-toc-h1" data-ref="n172"><a class="md-toc-inner"
62 href="#机上作">机上作</a></span><br> 62 href="#机上作">机上作</a></span><br>
63 <span role="listitem" class="md-toc-item md-toc-h1" data-ref="n172"><a class="md-toc-inner" 63 <span role="listitem" class="md-toc-item md-toc-h1" data-ref="n172"><a class="md-toc-inner"
64 href="#顺天三日">顺天三日</a></span><br> 64 href="#京师三日">京师三日</a></span><br>
65 <span role="listitem" class="md-toc-item md-toc-h1" data-ref="n172"><a class="md-toc-inner"
66 href="#深圳两首">深圳两首</a></span><br>
65 </p> 67 </p>
66 </div> 68 </div>
67 69
@@ -277,13 +279,28 @@
277 </p> 279 </p>
278 <p class="time"><span>23.2.11</span><br></p> 280 <p class="time"><span>23.2.11</span><br></p>
279 281
280 <h1 id="三日">三日<br></h1> 282 <h1 id="三日">三日<br></h1>
281 <p style="text-align: center;"><span>夜半登车辔,晨风谒主席。</span><br> 283 <p style="text-align: center;"><span>夜半登车辔,晨风谒主席。</span><br>
282 <span>一哭石鼓字,三叹党人碑。</span><br> 284 <span>一哭石鼓字,三叹党人碑。</span><br>
283 <span>皇史竟谁睹,长城岂世违?</span><br> 285 <span>皇史竟谁睹,长城岂世违?</span><br>
284 <span>不闻君主业,新月笑为炊。</span><br> 286 <span>不闻君主业,新月笑为炊。</span><br>
285 </p> 287 </p>
286 <p class="time"><span>23.12.20</span><br></p> 288 <p class="time"><span>23.12.20</span><br></p>
289
290 <h1 id="深圳两首">深圳两首<br></h1>
291 <p class="intro" style="text-align: center;"><span>至粤已期,犹记初来心绪,草诗聊记,未求音律。</span><br></p>
292 <p style="text-align: center;"><span>谁知一季竟重登,火炙云停更不同。</span><br>
293 <span>万木坦途长静伫,千帆江上寂无声。</span><br>
294 <span>砖石有汗层楼起,力者无言史简成。</span><br>
295 <span>换地英雄千万数,珠江惟见日当空。</span><br>
296 </p>
297
298 <p style="text-align: center;"><span>暑气蒸腾下,谁人奔走忙。</span><br>
299 <span>日仄未及饭,雨汗落衣裳。</span><br>
300 <span>广厦虽千万,安求七尺床。</span><br>
301 <span>入夜星灯火,心安岂吾乡?</span><br>
302 </p>
303 <p class="time"><span>24.7.14</span><br></p>
287 <script src="https://www.qin-juan-ge-zhu.top/common/js/comment4works.js"></script> 304 <script src="https://www.qin-juan-ge-zhu.top/common/js/comment4works.js"></script>
288 </div> 305 </div>
289 </div> 306 </div>