查看原文
其他

多线程学习指南

CPP开发者 2022-07-01

The following article is from 程序喵大人 Author 程序喵大人

什么是多线程?

不介绍,基础知识,直接看维基百科:https://zh.wikipedia.org/wiki/%E5%A4%9A%E7%BA%BF%E7%A8%8B

为什么要用多线程?

不介绍,基础知识,和上面在一个链接。

C++多线程知识点

如何创建线程?

多线程有多种创建方式:pthread、std::thread、std::jthread。

这里我推荐学习C++11引入的std::thread,它较pthread更方便,且在C++中更加常用。

至于std::jthread,不用管,学完std::thread后自然就能学会std::jthread。

关于C++11的多线程具体介绍可以看c++11新特性之线程相关所有知识点

使用std::thread创建线程很简单,直接利用它的构造函数即可:

void func() {   
    xxxx;
}

int main() {  
    std::thread t(func);  
    if (t.joinable()) {    
        t.join();   
    }   
    return 0;
}

注意上面代码,我使用了一个joinable()和join(),为什么要这么做?

因为如果不这么调用,在thread生命周期结束时,程序会crash。原因直接看thread的析构函数:

~thread()
{   
    if (joinable())  
    std::terminate();
}

join()和detach()?

上面介绍了不调用join,程序会crash,其实也可以调用detach来避免程序crash,那它俩有什么区别?

join()表示阻塞等待子线程执行结束,子线程结束后才会继续往下执行。

detach()表示与当前对象分离,子线程无论做啥,无论是否执行结束都与我无关,爱咋咋地,最终靠操作系统回收相关资源。

joinable()是什么?

上面代码中出现了joinable(),可以简单理解为如果没有调用join()或者detach(),joinable()就返回true。如果调用了其中一个,joinable()就返回false。它主要就是为了搭配join()和detach()使用。

参数传递问题

多线程其实就是开启一个线程,运行某一个函数,上面的示例是运行的无参函数,那如何运行有参函数?怎么将参数传递进去?其实有好几种方法传递参数,我更倾向于使用的是lambda表达式,将有参函数+参数封装成无参函数,然后多线程调用。

示例代码:

#include <iostream>
#include <thread>

void func(int a, int b) { std::cout << "a + b = " << a + b << std::endl; }

int main() {    
    auto lambda = []() { func(1, 2); };    
    std::thread t(lambda);   
    if (t.joinable()) {    
        t.join();  
    }   
    return 0;
}

关于lambda表达式我之前写过文章介绍,可以看这里:

搞定c++11新特性std::function和lambda表达式

编译器如何实现lambda表达式?

成员函数问题

很多人可能还有疑问,如果多线程运行类对象的成员函数,这里可以使用和上面相同的方法,lambda表达式:

#include <iostream>
#include <memory>
#include <thread>

struct A {   
    void Print() { std::cout << "A\n"; }
};

int main() {   
    std::shared_ptr<A> a = std::make_shared<A>();   
    auto func = [a]() { a->Print(); };    
    std::thread t(func);   
    if (t.joinable()) {       
        t.join();  
    }   
    return 0;
}

小知识点

创建thread对象的常见方法有下面这两种:

std::thread a(func);

std::thread *a = new thread(func);
delete a;

有人在技术交流群里问过这两种方式的区别,相信仔细阅读过上面内容的你应该知道答案!

给个小提示:两者对象一个在堆上,一个在栈上,生命周期不同,即thread的析构函数调用时机不同,然后可以再结合上面介绍的~thread()的实现,思考一下。

为什么需要锁?

因为多线程读写数据可能存在线程安全问题,为了保证线程安全,其中一种方式就是使用锁。

关于线程安全问题,随便去个网站,比如维基百科、百度百科等,都能找到。

https://zh.wikipedia.org/wiki/%E7%BA%BF%E7%A8%8B%E5%AE%89%E5%85%A8

mutex有四种:

  • std::mutex:独占的互斥量,不能递归使用,不带超时功能
  • std::recursive_mutex:递归互斥量,可重入,不带超时功能
  • std::timed_mutex:带超时的互斥量,不能递归
  • std::recursive_timed_mutex:带超时的互斥量,可以递归使用

加解锁方式有三种:

  • std::lock_guard:可以RAII方式加锁
  • std::unique_lock:比lock_guard多了个手动加解锁的功能
  • std::scoped_lock:防止多个锁顺序问题导致的死锁问题而出世的一把锁

示例代码:

std::mutex mutex;

void func() {   
    std::lock_guard<std::mutex> lock(mutex);  
    xxxxxxx
}

原子操作

上面介绍过使用锁可以解决线程安全问题,其实简单的变量,比如整型变量等,可以使用原子操作,C++11的原子操作都在<atomic>中。

示例代码:

std::atomic<int> count;
  
int get() {   
    count.load();
}
  
void set(int c) {   
    count.store(c);
}

上面这两个函数可以在多线程中任意调用,不会出现线程安全问题。

条件变量

条件变量是一种同步机制,可以阻塞一个线程或多个线程,直到其他线程对这些线程通知才会解除阻塞。这种通知和阻塞就需要用到条件变量。

示例代码:

class CountDownLatch {  
   public:   
    explicit CountDownLatch(uint32_t count) : count_(count);
  
    void CountDown() {    
        std::unique_lock<std::mutex> lock(mutex_);    
        --count_;       
        if (count_ == 0) {        
            cv_.notify_all();      
        }   
  }
  
    void Await(uint32_t time_ms = 0) {       
        std::unique_lock<std::mutex> lock(mutex_);     
        while (count_ > 0) {        
            if (time_ms > 0) {            
                cv_.wait_for(lock, std::chrono::milliseconds(time_ms));          
                } else {            
                    cv_.wait(lock);       
                }     
         }   
  }
  
    uint32_t GetCount() const {      
        std::unique_lock<std::mutex> lock(mutex_);     
      return count_;    
  }
  
   private:   
    std::condition_variable cv_;  
    mutable std::mutex mutex_;  
    uint32_t count_ = 0;
  };

有关条件变量其实有两个坑需要注意,移步这里:使用条件变量的坑你知道吗

基于任务的并发

这块个人认为只需要了解async即可,通过async既可以达到并发的目的,也可以拿到并发执行后的结果。

示例代码:

#include <functional>
#include <future>
#include <iostream>
#include <thread>
  
using namespace std;
  
int func(int in) { return in + 1; }
  
int main() {  
    auto res = std::async(func, 5);   
    cout << res.get() << endl; // 阻塞直到函数返回   
    return 0;
  }

具体可以看:c++11新特性之线程相关所有知识点

也可以看我利用此种方式写的线程池:C++11线程池

其他

如何使线程休眠?

可以利用std::this_thread和chrono,它俩搭配使得线程休眠很方便,而且休眠时间也很清晰。可不像C语言的sleep,我每次使用C语言的sleep时都会特意去搜索一下,单位究竟是秒还是毫秒。

std::this_thread::sleep_for(std::chrono::milliseconds(10));

线程个数问题

很多人都会纠结线程池开多少个线程效率最高的问题,假设CPU个数为N,有的资料会介绍N个线程效率最高,有的资料会介绍2N个线程效率最高。在<thread>中通过以下函数可以获取CPU的个数:

static unsigned hardware_concurrency() noexcept;

至于需要开多少个线程,个人认为需要根据个性化需求实际测试,你测出来多少个线程性能最高,就开多少个线程。

死锁

死锁的定义可直接维基百科:https://zh.wikipedia.org/wiki/%E6%AD%BB%E9%94%81

- EOF -

推荐阅读  点击标题可跳转

1、C++ STL 容器如何解决线程安全的问题?

2、Qt 6.2 长周期版正式发布

3、如何理解互斥锁、条件变量、读写锁以及自旋锁?


关注『CPP开发者』

看精选C++技术文章 . 加C++开发者专属圈子

点赞和在看就是最大的支持❤️

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存