Rust 并发笔记 (1)：所有权、类型与错误

3 minute read

Published: May 19, 2026

Rust 并发笔记 (1)：所有权、类型与错误

过去几个月在做一个叫 ChatPD 的项目，用 LLM 批量处理 arXiv 论文。这中间踩了不少 Rust 并发的坑。回过头看，Rust 的并发模型建立在几个看起来跟并发没什么关系的基础概念上——所有权、Send/Sync、Arc 和 Result。这篇笔记梳理它们。

1. 所有权与借用

Rust 在编译时消灭 data race。这不是什么运行时检测，也不是额外拼接到类型系统上的功能——它就是所有权机制的直接产物。三条规则：

// 规则1：每个值在任何时候只有一个所有者。
let s1 = String::from("hello");
let s2 = s1;           // s1 被 move 了——不能再用了
// println!("{}", s1); // ❌ 编译错误

// 规则2：要么一个可变引用，要么多个不可变引用。
let mut v = vec![1, 2, 3];
let r1 = &v;           // 共享引用
let r2 = &v;           // 可以有多个共享引用
// let r3 = &mut v;    // ❌ 有 & 在用就不能有 &mut

// 规则3：引用必须始终有效（没有悬垂指针）。
fn dangle() -> &String {
    let s = String::from("hello");
    &s  // ❌ s 在函数结束时被释放
}

跟并发的联系

在大多数语言里，两个线程同时访问同一数据且至少一个在写入，就是 data race。语言不会阻止它。Rust 的 borrow checker 在编译时就抓住了：

use std::thread;

let mut data = vec![1, 2, 3];

thread::spawn(move || {
    data.push(4);  // data 被 MOVE 进这个线程了
});

// println!("{:?}", data);  // ❌ data 已经不属于这里了

move 关键字把所有权转给了闭包。之后原线程就没有访问权。没有共享的可变状态，就没有 data race。 这个保证是编译时的，不是运行时的。

2. `Send` 和 `Sync`

这两个是 marker trait——编译器对大多数类型自动推导它们。它们回答两个问题：这个值能 move 到另一个线程吗？这个值的引用能跨线程共享吗？

`Send`：跨线程转移所有权

一个类型的值可以安全地 move 到另一个线程，它就是 Send。大多数类型都是：

fn is_send<T: Send>() {}

is_send::<i32>();         // ✅
is_send::<String>();       // ✅
is_send::<Mutex<i32>>();  // ✅

经典反例是 Rc<T>——它的引用计数用的是非原子操作：

use std::rc::Rc;
// is_send::<Rc<i32>>();    // ❌ Rc 不是 Send

Arc<T> 是它的 Send 版本。那个 “A” 就是 atomic 的意思：

use std::sync::Arc;
// is_send::<Arc<i32>>();     // ✅（前提是 T: Send + Sync）

`Sync`：跨线程共享引用

一个类型的引用（&T）可以安全地跨线程共享，它就是 Sync：

fn is_sync<T: Sync>() {}

is_sync::<i32>();         // ✅
is_sync::<Mutex<i32>>();  // ✅ Mutex 安全地提供内部可变性
// is_sync::<Rc<i32>>();  // ❌ Rc 两者都不是

`tokio::spawn` 报 `Send` 错怎么办

最常见的编译错误长这样：

error[E0277]: `Rc<i32>` cannot be sent between threads safely

常见原因就几个：Rc<T> 该换成 Arc<T>、RefCell<T> 该换成 Mutex<T> 或 RwLock<T>、结构体深处藏了个裸指针、或者依赖库引入了非 Send 的类型。确定是哪个类型的问题之后，修复通常是机械的。

3. `Arc<T>`——共享所有权的代价

Arc<T> 在并发 Rust 里遍地都是。在 ChatPD 的 pipeline 里，它承载着配置、计数器、abort flag、semaphore，在几十个 async task 之间传递。

`Arc::clone` 只是原子加一

use std::sync::Arc;

let config = Arc::new(vec![1, 2, 3]);  // 堆上分配一次
let h1 = Arc::clone(&config);           // 原子地给引用计数 +1
let h2 = Arc::clone(&config);           // 同样，不拷贝数据

// 三个 Arc 指向同一块堆内存

clone 便宜，但不免费——原子操作会因为核间的 cache line 弹跳消耗 CPU 周期。热循环里的计数器，直接用 AtomicUsize 更划算。

`Arc<RwLock<T>>`

异步 Rust 里大多数共享可变状态都用这个组合。这是 ChatPD 里的一个真实例子——全局限流闸门：

use std::sync::RwLock;
use std::time::Instant;
use once_cell::sync::Lazy;

// 全局限流闸门。每个请求发送前都读（高频），只在收到 429 时写（罕见）。
static RATE_LIMITED_UNTIL: Lazy<Arc<RwLock<Option<Instant>>>> =
    Lazy::new(|| Arc::new(RwLock::new(None)));

// 读路径：共享访问，常见情况下无争用
let until = *RATE_LIMITED_UNTIL.read().await;

// 写路径：独占，但很少触发
let mut guard = RATE_LIMITED_UNTIL.write().await;
*guard = Some(Instant::now() + Duration::from_secs(60));

这里用 RwLock 而不是 Mutex，因为读远超写。锁类型值得根据访问模式来选，而不是习惯性地用 Mutex。

`Arc` 不是必须的

pipeline 里的 DB writer 只被一个 task 使用：

pub async fn run_db_writer(
    mut rx: mpsc::Receiver<WriteRecord>,
    db_path: String,
) -> StagePerfSummary {
    let conn = rusqlite::Connection::open(&db_path)?;
    // conn 直接被这个 task 独占——没有 Arc，没有 Mutex，没有争用
    while let Some(record) = rx.recv().await { /* 写入 */ }
}

只有一个所有者的时候，通过 channel 或函数参数直接传所有权就行了，不需要 Arc。

4. `Result<T, E>`——错误不会自己消失

并发代码里错误处理更重要。一个 panic 的 task 把整个进程带走了。一个被静默吞掉的错误默默污染数据。Rust 的 Result 强制错误显式化，? 让传播简洁。

基本用法

fn read_config(path: &str) -> Result<String, std::io::Error> {
    let contents = std::fs::read_to_string(path)?;  // 失败了就返回 Err
    Ok(contents)
}

并发里的错误

多个 task 同时跑的时候，一个 task 的失败怎么让其他人知道？ChatPD 里有一个场景：LLM API key 的 quota 耗尽了。我们用一个 AtomicBool 广播这个致命错误：

use std::sync::atomic::{AtomicBool, Ordering};

let abort_flag = Arc::new(AtomicBool::new(false));

// 在 LLM worker 里检测到 quota 耗尽：
if err_str.contains("401") || err_str.contains("quota") {
    eprintln!("致命：API quota 耗尽，中止管道");
    abort_flag.store(true, Ordering::Relaxed);
    return;
}

// 其他 worker 在每个工作项开始前检查：
if abort_flag.load(Ordering::Relaxed) {
    return;  // 静默退出，不产生错误记录
}

这自然地把错误分成了三类：

类别	例子	处理
瞬时 (transient)	429、timeout	退避重试
终端 (terminal)	404、解析失败	写错误记录，继续
致命 (fatal)	401、quota 耗尽	设 abort flag，全部停止

`anyhow` vs `thiserror`

应用代码用 anyhow::Result<T>——它包装任意错误类型、附加上下文。库代码用 thiserror——调用方可以 match 具体的错误变体。区别在于调用方是否需要以编程方式区分错误类型。

5. 一个小练习

把四个概念拼在一起：创建线程，用 Arc<Mutex<T>> 共享状态，用 Result 处理错误。

use std::sync::{Arc, Mutex};
use std::thread;

struct SharedCounter {
    count: Mutex<u64>,
    name: String,
}

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let counter = Arc::new(SharedCounter {
        count: Mutex::new(0),
        name: "requests".to_string(),
    });

    let mut handles = vec![];
    for i in 0..4 {
        let counter = Arc::clone(&counter);
        handles.push(thread::spawn(move || {
            for _ in 0..100 {
                let mut count = counter.count.lock().unwrap();
                *count += 1;
            }
            println!("线程 {} 完成", i);
        }));
    }

    for h in handles { h.join().unwrap(); }

    let final_count = counter.count.lock().unwrap();
    println!("{}: {} 总计", counter.name, *final_count);
    Ok(())
}

这五行干了什么：

Arc::new(...)——堆上分配一次，和所有线程共享
Arc::clone(&counter)——每线程原子地引用计数 +1
move ||——把克隆的 Arc 所有权转给闭包
.lock().unwrap()——获取 mutex，递增，释放（guard 离开作用域时自动释放）
.join().unwrap()——等所有线程结束，有 panic 就传播

第二篇笔记覆盖并发工具箱：Mutex/RwLock/Atomic*、channel、并发控制的三种模式、错误传播策略。第三篇走查五个来自 ChatPD 生产的真实 bug——429 级联风暴、冷启动并发、DB 锁争用、致命错误广播、优雅停机——以及实际起作用的方案。

代码示例从 ChatPD、asterinas 和 mcpr 的生产 Rust 代码简化而来。

Anjie Xu

Rust 并发笔记 (1)：所有权、类型与错误

Rust 并发笔记 (1)：所有权、类型与错误

1. 所有权与借用

跟并发的联系

2. `Send` 和 `Sync`

`Send`：跨线程转移所有权

`Sync`：跨线程共享引用

`tokio::spawn` 报 `Send` 错怎么办

3. `Arc<T>`——共享所有权的代价

`Arc::clone` 只是原子加一

`Arc<RwLock<T>>`

`Arc` 不是必须的

4. `Result<T, E>`——错误不会自己消失

基本用法

并发里的错误

`anyhow` vs `thiserror`

5. 一个小练习

Leave a Comment

You May Also Enjoy

How I Design Claude Code Skills

How to Build AI Agents: Lessons from Five Projects

A Single-Molecule Bound on Cryptochrome Radical Pair Compass Sensitivity and Its Implications for Avian Magnetoreception

Docker socket 存在但连接被拒绝：一次 snap + apt 双安装的排障记录

Share on

Anjie Xu

Rust 并发笔记 (1)：所有权、类型与错误

1. 所有权与借用

跟并发的联系

2. Send 和 Sync

Send：跨线程转移所有权

Sync：跨线程共享引用

tokio::spawn 报 Send 错怎么办

3. Arc<T>——共享所有权的代价

Arc::clone 只是原子加一

Arc<RwLock<T>>

Arc 不是必须的

4. Result<T, E>——错误不会自己消失

基本用法

并发里的错误

anyhow vs thiserror

5. 一个小练习

Leave a Comment

You May Also Enjoy

How I Design Claude Code Skills

How to Build AI Agents: Lessons from Five Projects

A Single-Molecule Bound on Cryptochrome Radical Pair Compass Sensitivity and Its Implications for Avian Magnetoreception

Docker socket 存在但连接被拒绝：一次 snap + apt 双安装的排障记录

Share on

2. `Send` 和 `Sync`

`Send`：跨线程转移所有权

`Sync`：跨线程共享引用

`tokio::spawn` 报 `Send` 错怎么办

3. `Arc<T>`——共享所有权的代价

`Arc::clone` 只是原子加一

`Arc<RwLock<T>>`

`Arc` 不是必须的

4. `Result<T, E>`——错误不会自己消失

`anyhow` vs `thiserror`