操作系统 · StackSense

操作系统是所有基础设施坐落的地板：进程怎么调度、内存怎么映射、I/O 怎么多路复用，直接决定了你写的服务的上限。这个模块的目标不是背概念，而是通过 xv6 这种能编译跑起来的教学内核把抽象拆开看一遍，之后再看 Linux 的行为就有参照物。

学完后你应该能回答

Linux 的 CFS 和 EEVDF 调度器是怎么分配 CPU 时间的？nice 值和 cgroup cpu.weight 的关系是什么？
cgroup v1 和 v2 的核心差异？容器里的 CPU / 内存限制底层走的是哪些 controller？
OOM killer 怎么打分（oom_score / oom_score_adj）？为什么内存最多的进程不一定先被杀？
futex 和用户态 mutex 的关系？无竞争时为什么几乎不走系统调用？
容器隔离涉及哪些 namespace（pid / net / mnt / uts / ipc / user）？user namespace 为什么是安全的关键？
seccomp / capabilities / AppArmor / SELinux 分别在哪一层限制进程？runc 默认拒绝哪些 syscall？
CFS 的 cpu.cfs_period_us / cpu.cfs_quota_us 组合会产生什么 throttle 现象？在线上延迟敏感服务上为什么常常要关 CPU limit？

如何用 strace 定位一个卡住的进程？perf 采样和 bpftrace 追踪各适合什么问题？
USE 方法（Utilization / Saturation / Errors）在排查机器卡顿时具体怎么逐项看？
perf record 采样栈为什么需要 frame pointer / libunwind / DWARF 三选一？它们各自的 overhead 和准确度差在哪？
eBPF 为什么被称为”内核里安全跑程序”？verifier 拦住了哪些类型的坑？
Top-down 方法学四象限（Frontend / Bad Speculation / Backend / Retiring）怎么判断一个热点循环到底卡在哪？

进程 / 线程

内核调度的两类基本单位，分别承担隔离和共享的角色。搞清楚它们的地址空间、文件描述符、信号是怎么分的。
虚拟内存

每个进程看到自己独占的连续地址空间，靠页表和 MMU 映射到物理内存。是理解 fork、mmap、OOM 的前置。
文件系统

inode、目录、日志、页缓存这一套。看懂后你能解释为什么 fsync 贵、为什么小文件多会慢。
并发与同步

锁、条件变量、信号量、无锁数据结构。写多线程代码绕不过去，也是 xv6 lock lab 的直接目标。
epoll

Linux 的高效 I/O 多路复用机制，Nginx / Redis 的事件循环底座。理解 LT / ET 模式是基本要求。
io_uring

Linux 新一代异步 I/O 接口，用共享环形队列把系统调用批处理化。高吞吐存储 / 网络栈正在往这里迁。
mmap

把文件或匿名内存映射进进程地址空间，共享内存和大文件随机访问的常用手段。用错会带来 SIGBUS 和诡异的页回写。
/proc

内核把运行时状态暴露成虚拟文件系统。线上排查时 /proc//maps、status、stack 是你最常打开的文件。
USE 方法

Brendan Gregg 的系统性排查框架：对每个资源看 Utilization / Saturation / Errors。机器卡住时按这三维扫一遍。
Top-down 方法学

Intel 的 Frontend / Bad Speculation / Backend / Retiring 四象限分析法。用来判断热点循环到底卡在 CPU 的哪一环。

MIT 6.1810 xv6 labs

教学级 Unix-like 内核的实验套件。一套做下来，syscall、页表、锁、文件系统从概念变成你自己改过的代码。
util: Unix utilities

用 xv6 的系统调用写小工具（xargs、find 等）。入门热身，熟悉 xv6 工作流。
syscall

往内核里加一个新系统调用。走完 trap 表、参数传递、返回值的全流程。
pgtbl: page tables

亲手动 RISC-V 的三级页表。做完你对虚拟地址翻译的理解会从 PPT 级别变成能画寄存器的级别。
lock

重构内核里粗粒度锁，优化并发性能。直面锁争用和锁拆分的取舍。
mmap

在 xv6 里实现 mmap / munmap。懂了之后你再看 Linux mmap 的行为会觉得自然。

OSTEP

三段式（虚拟化、并发、持久化）讲 OS，免费在线，语言直白。最适合当主线教材。
MIT 6.1810

MIT 操作系统课主页，讲义 / 视频 / lab 全开放。和 OSTEP 搭配食用效果最佳。
xv6 book

逐行讲 xv6 源码的配套小册子。做 lab 时的最高频参考。
LWN

Linux 内核社区的权威新闻站。想追踪调度器、内存、io_uring 等主线演进，这里是唯一选择。
The Linux Programming Interface

Michael Kerrisk 的 Linux 系统编程百科全书。Linux 系统调用行为有疑问时翻它一般都有答案。
Systems Performance（Brendan Gregg）

Linux 系统性能的大百科。CPU / memory / disk / network 四大块按 USE 方法展开。