您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Go语言

Google资深工程师深度讲解Go语言

时间:2022-09-15 10:54:22  来源:  作者:月初影视解说

Download:https://www.itwangzi.cn/2262.html

本文基于Go版本:1.17.8

go version go1.17.8 darwin/amd64

 

原生Map 并发场景

 

package mAIn
import (
"fmt"
"sync"
"time"
)
func main() {
var wg sync.WaitGroup
m := make(map[int]struct{}, 0)
wg.Add(2)
go func() {
wg.Done()
for i := 0; i < 100000; i++ {
m[i] = struct{}{}
}
}()
go func() {
wg.Done()
for i := 0; i < 100000; i++ {
fmt.Println(m[i])
}
}()
wg.Wait()
time.Sleep(time.Second * 20)
}

多个协程同时写入出现fatal error: concurrent map read and map write的错误。如何解决该问题呢?那就需要給Map加上一把读写互斥锁sync.RWMutex。

测试代码如下:

package main
import (
"fmt"
"sync"
"time"
)
type Demo struct {
Data map[int]struct{}
Lock *sync.RWMutex
}
func (d Demo) Get(k int) {
d.Lock.RLock()
fmt.Println(d.Data[k])
d.Lock.RUnlock()
}
func (d Demo) Set(k int) {
d.Lock.Lock()
defer d.Lock.Unlock()
d.Data[k] = struct{}{}
}
func main() {
d := Demo{
Data: make(map[int]struct{}, 0),
Lock: new(sync.RWMutex),
}
for i := 0; i < 2000; i++ {
go d.Set(i)
go d.Get(i)
}
time.Sleep(time.Second * 20)
}

 

Sync.Map 概述

 

map是一种特殊的数据结构; 是一种元素对的无序集合,一个元素是key而对应的另一个元素是value,所以这个结构也称为关联数组或字典,是一种快速寻找值的理想结构;給定key可快速定位到value。

Go语言中Map(映射、字典)是一种内置的数据结构,它是一个无序的(key-value)对的集合。

*map初始化与存储的结构化*

Go语言原生Map并不是线程安全的,在解决并发读写Map的思路需要使用读写互斥锁(sync.RWMutex),这种方案简约直接,但是缺点也很明显,性能不会太高。而sync.Map在Go 1.9的版本中引入,它是一种并发安全的map,它的设计非常巧妙,充分利用原子操作(atomic)和互斥锁(mutex)的配合, 在使用sync.Map之后,对map的读写,不需要加入一大把锁,它通过空间换时间的方式,使用read(atomic.Value)和dirty(map[interface{}]*entry)两个原生map来进行读写分离,降低锁时间来提升效率。

 

核心思想

 

sync.Map核心原则就是尽量使用原子操作,最大程度上减少了锁的使用,从而接近lock free的效果。

 

  1. 使用了两个原生的map作为存储介质,分别为: 只读字典read(atomic.Value)和 脏字典dirty(map[interface{}]*entry)。
  2. 只读字典使用atomic.Value来承载,保证原子性与高性能;脏字典则使用互斥锁sync.Mutex来进行保护,保证读写之间的互斥关系。
  3. 只读字典和脏字典中的键值对集合并不是实时同步的,它们在某些时间段内可能会有不同。
  4. 只读字典和脏字典其实在本质都是map[interface{}]*entry类型, entry就是Map的value容器。
  5. entry是表示具体值的指针类型,也可以表示key已删除的状态。

 

通过这种设计,规避了原生map无法并发安全删除的问题,同时在变更某个键对应的value时也可以使用原子操作。

 

如何使用

 

package main
import (
"fmt"
"sync"
)
func main() {
var sm sync.Map
//1. 写入
sm.Store("张三", 18)
sm.Store("李四", 20)
//2. 读取
age, _ := sm.Load("张三")
fmt.Println(age.(int))
//3. 遍历
sm.Range(func(key, value interface{}) bool {
name := key.(string)
age := value.(int)
fmt.Println(name, age)
return true
})
//4. 删除
sm.Delete("李四")
age, ok := sm.Load("李四")
fmt.Println(age, ok)
//5. 读取或写入
sm.LoadOrStore("王二麻子", 100)
age, ok = sm.Load("王二麻子")
fmt.Println(age, ok)
}

sync.Map适用于读多写少的场景,

 

  1. 对于写多的场景,会导致read map缓存失效,需要加锁、导致冲突变多;
  2. 由于未命中read map次数过多,导致dirty map提升为read map,这是一个O(N)时间复杂度的操作,会进一步降低性能。
源码分析

 

先看一下sync.Map的数据结构:

type Map struct {
// 互斥锁 保护read 与 dirty
mu Mutex
// read map的 k,v(dirty) 是不变的, 删除只是打标记,插入新key会加锁写到dirty map 中
// 因此对read map的读取无需加锁。
read atomic.Value
// dirty map 对dirty map的操作需要持有互斥锁
dirty map[interface{}]*entry
// 当Load操作 read map中未找到,就会尝试从dirty中进行加载(不管是否存在), misses+1
// 当misses 达到dirty map 长度时,dirty被提升为read,并且重新分配dirty。
misses int
}
type readOnly struct {
m map[interface{}]*entry
// 为true时代表 dirty map中包含m中没有的元素
amended bool
}
type entry struct {
p unsafe.Pointer // *interface{}
}

 

  1. read是atomic.Value类型,可以并发的读,但是如果需要更新read,则需要加入互斥锁保护。
  2. read中存储的entry指针,可能会被并发的CAS(比较并交换)更新。但是如果更新一个之前已被删除entry,则需要先将其状态从删除状态改为nil,再拷贝到dirty map中去,然后再执行更新。
  3. dirty 是一个非线程安全的原始map。包含新写入的key,并且包含read中所有未被删除的key。这样可以快速的将dirty提升为read对外提供服务。如果dirty为nil,那么下一次写入时,会新建一个新的dirty,这个初始的dirty是read的一个拷贝,但除掉了其中已经被删除的key。
  4. 每当从read中读取失败,都会将 misses的计数值+1,dirty被提升为read`。

 

*entry.p的三种状态*

 

  1. read和dirty 原生map都存储都包含entry,它是一个指针,指向value read和dirty 各自维护一套key,而它指向都同一个value,只要修改了这个entry,对read和dirty都是可见的。而这个指针的状态有三个状态:
    • 当p == nil时,说明这个键值对已被删除,并且m.dirty==nil 或 m.dirty[k]指向该entry。
    • 当p == expunged时,说明这条键值对已被,并且m.dirty !=nil且m.dirty中没有这个key。
    • 其它情况,p指向一个正常值,表示实际interface{}的地址,并且被记录在m.read.m[key]中、如果这时m.dirty不为nil,那么它也被记录在m.dirty[key]中。两者实际上指向的是同一个值.
    • 当删除key时,并不实际删除。一个entry可以通过原子地设置p为nil删除。如果之后创建m.dirty,nil又会被原子地设置expunged,且不会拷贝dirty中。
    • 如果p不为expunged和entry相关联的这个value可以被原子地更新;p == expunged那么当它初次设置到m.entry之后才可以被更新。

 

sync.Map的数据结构

 

Load 读取

 

Load 函数具体实现方式

func (m *Map) Load(key interface{}) (value interface{}, ok bool) {
// 优先从read map中读取数据(无锁)
read, _ := m.read.Load().(readOnly)
e, ok := read.m[key]
// 如果不存在并且 read.amended 字段指明 dirty map中有read map中不存在的字段,则加锁尝试
// 从dirty map中加载
if !ok && read.amended {
// dirty map 不是线程安全的,所以需要加上互斥锁
m.mu.Lock()
// double check 避免在加锁的时候dirty map提升为read map
read, _ = m.read.Load().(readOnly)
e, ok = read.m[key]
// 任然没有在 read中找到这个key ,并且 amended 为true
if !ok && read.amended {
e, ok = m.dirty[key]
// 不管dirty中有没有找到,都增加misses 计数,该函数可能将dirty map提升为readmap
m.missLocked()
}
m.mu.Unlock()
}
if !ok {
return nil, false
}
return e.load()
}
// 从entry中原子地操作 load 实际interface{}
func (e *entry) load() (value interface{}, ok bool) {
p := atomic.LoadPointer(&e.p)
if p == nil || p == expunged {
return nil, false
}
return *(*interface{})(p), true
}
// 增加misses计数,并在必要的时候提升 dirty map
func (m *Map) missLocked() {
m.misses++
if m.misses < len(m.dirty) {
return
}
// dirty map 晋升
m.read.Store(readOnly{m: m.dirty})
m.dirty = nil
m.misses = 0
}

 

  1. 如果read 中 没有这个key,且amended为false,说明dirty为空,那就直接返回空或false。
  2. 如果read中没有这个key,且amended为true,说明dirty中可能存在我们要找的key,先上互斥锁在尝试去dirty中查找,在此之前,仍然有一个double check的操作,若还是没有在read中找到,那么就从dirty中找,不管dirty中有没有找到,都需要"记录一笔",因为在dirty被提升为read之前,都会进入这条路径。
Store 存储

 

Store 函数实现

func (m *Map) Store(key, value interface{}) {
// 如果read map 中存在该key 则尝试直接更改(由于修改的是 entry
//内部的pointer, 因此 dirty map 也可见)
read, _ := m.read.Load().(readOnly)
if e, ok := read.m[key]; ok && e.tryStore(&value) {
return
}
m.mu.Lock()
read, _ = m.read.Load().(readOnly)
if e, ok := read.m[key]; ok {
if e.unexpungeLocked() {
//如果 read map 中存在该key , 当p == expunged,则说明m.dirty != nil
// 并且 m.dirty 中不存在该key 值 此时:
// a. 将p的状态 由expunged 更改为nil
// b. dirty map 插入key
// c. 更新 entry.p = value (read map 和 dirty map 指向同一个entry )
m.dirty[key] = e
}
//如果read map中存在该key,且 p != expunged,直接更新该entry
//(此时m.dirty==nil或m.dirty[key]==e)
e.storeLocked(&value)
} else if e, ok := m.dirty[key]; ok {
// 如果 read map 中不存在该key, 但是dirty map 中存在该key,
//直接写入更新 entry(read map 中仍然没有这个key)
e.storeLocked(&value)
} else {
if !read.amended {
// 如果 read map 和dirty map 中都不存在该key,则:
// a. 如果dirty map 为空,则需要创建 dirty map,并从read map 中拷贝未删除的元素
// b. 更新amended 为true,并标记dirty map中存在read map中没有的key
// c. 将k ,v 写入dirty map中, read map不做改变
m.dirtyLocked()
m.read.Store(readOnly{m: read.m, amended: true})
}
m.dirty[key] = newEntry(value)
}
m.mu.Unlock()
}

 

Delete 删除

 

Delete 函数实现

func (m *Map) Delete(key interface{}) {
m.LoadAndDelete(key)
}
func (m *Map) LoadAndDelete(key interface{}) (value interface{}, loaded bool) {
// 从read map 中查找, 如果存在,则设置为nil
read, _ := m.read.Load().(readOnly)
e, ok := read.m[key]
if !ok && read.amended {
m.mu.Lock()
// double check
read, _ = m.read.Load().(readOnly)
e, ok = read.m[key]
// 如果 read map 中不存在,但dirty map中存在, 则直接从dirty map 删除
if !ok && read.amended {
e, ok = m.dirty[key]
delete(m.dirty, key)
m.missLocked()
}
m.mu.Unlock()
}
if ok {
//将 entry.p 设置为nil
return e.delete()
}
return nil, false
}
func (e *entry) delete() (value interface{}, ok bool) {
for {
p := atomic.LoadPointer(&e.p)
if p == nil || p == expunged {
return nil, false
}
//CAS操作
if atomic.CompareAndSwAppointer(&e.p, p, nil) {
return *(*interface{})(p), true
}
}
}

 

总结
  1. sync.Map是线程安全的,读取,插入,删除也都是保持着常数级O(1)的时间复杂度。
  2. 通过读写分离,降低锁时间来提高效率,适用于读多写少的场景。
测试性能代码

 

package _map
import (
"sync"
)
var (
myMap *MyMap
syncMap *sync.Map
)
type MyMap struct {
sync.RWMutex
m map[int]struct{}
}
func init() {
myMap = &MyMap{
m: make(map[int]struct{}, 0),
}
syncMap = new(sync.Map)
}
func mutexMapStore(k int) {
myMap.Lock()
myMap.m[k] = struct{}{}
myMap.Unlock()
}
func mutexMapLoad(k int) int {
myMap.RLock()
defer myMap.RUnlock()
if _, ok := myMap.m[k]; ok {
return 1
}
return 0
}
func mutexMapDelete(k int) {
myMap.Lock()
delete(myMap.m, k)
myMap.Unlock()
}
func syncMapStore(k, v int) {
syncMap.Store(k, v)
}
func syncMapLoad(k int) int {
if _, ok := syncMap.Load(k); ok {
return 1
}
return 0
}
func syncMapDelete(k int) {
syncMap.Delete(k)
}

 

Benchmark Test

 

package _map
import (
"math/rand"
"testing"
"time"
)
func BenchmarkMutexStoreParallel(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
k := r.Intn(1000000)
mutexMapStore(k)
}
})
}
func BenchmarkMutexMapStoreParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
k := r.Intn(1000000)
mutexMapStore(k)
}
})
}
func BenchmarkSyncMapStoreParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
// The loop body is executed b.N times total across all goroutines.
k := r.Intn(100000000)
syncMapStore(k, k)
}
})
}
func BenchmarkMutexMapLoadParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
k := r.Intn(100000000)
mutexMapLoad(k)
}
})
}
func BenchmarkSyncMapLoadParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
k := r.Intn(100000000)
syncMapLoad(k)
}
})
}
func BenchmarkMutexMapDeleteParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
// The loop body is executed b.N times total across all goroutines.
k := r.Intn(100000000)
mutexMapDelete(k)
}
})
}
func BenchmarkSyncMapDeleteParalell(b *testing.B) {
b.RunParallel(func(pb *testing.PB) {
r := rand.New(rand.NewSource(time.Now().Unix()))
for pb.Next() {
k := r.Intn(100000000)
syncMapDelete(k)
}
})
}

 

测试结果

 

goos: darwin
goarch: amd64
pkg: lib/sync/map
cpu: Intel(R) Core(TM) i7-9750H CPU @ 2.60GHz
BenchmarkMutexStoreParallel-12 9638028 136.0 ns/op 2 B/op 0 allocs/op
BenchmarkMutexMapStoreParalell-12 9125176 148.9 ns/op 0 B/op 0 allocs/op
BenchmarkSyncMapStoreParalell-12 4548318 294.9 ns/op 44 B/op 3 allocs/op
BenchmarkMutexMapLoadParalell-12 20580038 51.57 ns/op 0 B/op 0 allocs/op
BenchmarkSyncMapLoadParalell-12 91573840 12.51 ns/op 0 B/op 0 allocs/op
BenchmarkMutexMapDeleteParalell-12 9240199 152.4 ns/op 0 B/op 0 allocs/op
BenchmarkSyncMapDeleteParalell-12 99910771 12.19 ns/op 0 B/op 0 allocs/op
PASS



Tags:Go语言   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
宝藏级Go语言开源项目——教你自己动手开发互联网搜索引擎
DIYSearchEngine 是一个能够高速采集海量互联网数据的开源搜索引擎,采用 Go 语言开发。Github 地址:https://github.com/johnlui/DIYSearchEngine运行方法首先,给自己准备一杯...【详细内容】
2024-03-12  Search: Go语言  点击:(24)  评论:(0)  加入收藏
你是否想知道如何应对高并发?Go语言为你提供了答案!
并发编程是当前软件领域中不可忽视的一个关键概念。随着CPU等硬件的不断发展,我们都渴望让我们的程序运行速度更快、更快。而Go语言在语言层面天生支持并发,充分利用现代CPU的...【详细内容】
2023-12-29  Search: Go语言  点击:(110)  评论:(0)  加入收藏
Go语言实现GoF设计模式:适配器模式
简介适配器模式(Adapter)是最常用的结构型模式之一,在现实生活中,适配器模式也是处处可见,比如电源插头转换器,它可以让英式的插头工作在中式的插座上。GoF 对它的定义如下:Convert...【详细内容】
2023-12-12  Search: Go语言  点击:(209)  评论:(0)  加入收藏
Go语言字符串拼接方式与性能比较,分析过没?
在Go语言中,字符串拼接性能是相当高效的,主要原因有两点:一是字符串在Go中是不可变的(immutable),二是Go语言提供了strings.Builder类型来高效处理字符串拼接。1. 字符串是不可变...【详细内容】
2023-12-11  Search: Go语言  点击:(230)  评论:(0)  加入收藏
一篇学会AI与Go语言无缝对接
在当今应用开发领域,类似OpenAI API等生成式AI技术的蓬勃发展正在彻底改变着应用开发的格局。Python和JavaScript等语言已经拥有丰富的资源来支持这些技术,其中LangChain就是...【详细内容】
2023-12-04  Search: Go语言  点击:(143)  评论:(0)  加入收藏
20小时快速入门Go语言
Go语言是由Google开发的一种高效、简洁和并发性强的编程语言,其设计目标是使得程序员能够更加容易地创建可靠、高效的软件。尽管Go语言的语法相对其他编程语言来说可能更加陌...【详细内容】
2023-12-03  Search: Go语言  点击:(154)  评论:(0)  加入收藏
十个令人惊叹的Go语言技巧,让你的代码更加优雅
在开发生产项目的过程中,我注意到经常会发现自己在重复编写代码,使用某些技巧时没有意识到,直到后来回顾工作时才意识到。为了解决这个问题,我开发了一种解决方案,对我来说非常有...【详细内容】
2023-11-20  Search: Go语言  点击:(172)  评论:(0)  加入收藏
Go语言Context应用全攻略:异步编程利器
概述在 Go 语言中,Context(上下文)是一个非常重要的概念,特别是在处理请求时。允许在请求的整个生命周期内传递数据、控制请求的取消、处理超时等。本文将介绍 Go 语言中 Contex...【详细内容】
2023-11-06  Search: Go语言  点击:(304)  评论:(0)  加入收藏
Go语言高级特性:Context深入解读
概述在 Go 语言中,context(上下文)是一个非常重要的概念。它主要用于在多个 goroutine 之间传递请求特定任务的截止日期、取消信号以及其他请求范围的值。3. Context 的取消与...【详细内容】
2023-11-01  Search: Go语言  点击:(232)  评论:(0)  加入收藏
Go语言中如何实现JWT
什么JWTJWT(JSON Web Token)是一种开放标准(RFC 7519),定义了一种在各方之间安全传输信息的简洁方式。这些信息可以被验证和信任,因为它们是数字签名的。JWT由三部分组成,用.分隔。...【详细内容】
2023-09-11  Search: Go语言  点击:(250)  评论:(0)  加入收藏
▌简易百科推荐
宝藏级Go语言开源项目——教你自己动手开发互联网搜索引擎
DIYSearchEngine 是一个能够高速采集海量互联网数据的开源搜索引擎,采用 Go 语言开发。Github 地址:https://github.com/johnlui/DIYSearchEngine运行方法首先,给自己准备一杯...【详细内容】
2024-03-12  OSC开源社区    Tags:Go语言   点击:(24)  评论:(0)  加入收藏
Go Gin框架实现优雅地重启和停止
在Web应用程序中,有时候我们需要重启或停止服务器,无论是因为更新代码还是进行例行维护。在这种情景下,我们需要保证应用程序的可用性和数据的一致性。这就需要优雅地关闭和重...【详细内容】
2024-01-30  源自开发者  微信公众号  Tags:Go   点击:(68)  评论:(0)  加入收藏
如何让Go程序以后台进程或daemon方式运行
本文探讨了如何通过Go代码实现在后台运行的程序。最近我用Go语言开发了一个WebSocket服务,我希望它能在后台运行,并在异常退出时自动重新启动。我的整体思路是将程序转为后台...【详细内容】
2024-01-26  Go语言圈  微信公众号  Tags:Go程序   点击:(60)  评论:(0)  加入收藏
深入Go底层原理,重写Redis中间件实战
Go语言以其简洁、高效和并发性能而闻名,深入了解其底层原理可以帮助我们更好地利用其优势。在本文中,我们将探讨如何深入Go底层原理,以及如何利用这些知识重新实现一个简单的Re...【详细内容】
2024-01-25  547蓝色星球    Tags:Go   点击:(69)  评论:(0)  加入收藏
Go 内存优化与垃圾收集
Go提供了自动化的内存管理机制,但在某些情况下需要更精细的微调从而避免发生OOM错误。本文将讨论Go的垃圾收集器、应用程序内存优化以及如何防止OOM(Out-Of-Memory)错误。Go...【详细内容】
2024-01-15  DeepNoMind  微信公众号  Tags:Go   点击:(63)  评论:(0)  加入收藏
Go函数指针是如何让你的程序变慢的?
导读Go 语言的常规优化手段无需赘述,相信大家也能找到大量的经典教程。但基于 Go 的函数值问题,业界还没有太多深度讨论的内容分享。本文作者根据自己对 Go 代码的使用与调优...【详细内容】
2024-01-15  腾讯云开发者  微信公众号  Tags:Go函数   点击:(89)  评论:(0)  加入收藏
Go编程中调用外部命令的几种场景
在很多场合, 使用Go语言需要调用外部命令来完成一些特定的任务, 例如: 使用Go语言调用Linux命令来获取执行的结果,又或者调用第三方程序执行来完成额外的任务。在go的标准库...【详细内容】
2024-01-09  suntiger    Tags:Go编程   点击:(109)  评论:(0)  加入收藏
Go 语言不支持并发读写 Map,为什么?
Go语言的map类型不支持并发读写的主要原因是并发读写会导致数据竞态(data race),这意味着多个 goroutine 可能同时访问并修改同一个 map,从而引发不确定的结果。在Go语言的设计...【详细内容】
2024-01-05  Go语言圈  微信公众号  Tags:Go 语言   点击:(81)  评论:(0)  加入收藏
Go微服务入门到容器化实践
Go微服务入门到容器化实践Go 是一门高效、现代化、快速增长的编程语言,非常适合构建 Web 应用程序。而 Docker 是一种轻量级的容器化技术,能够使得您的应用程序在任何地方运行...【详细内容】
2024-01-01  大雷家吃饭    Tags:Go微服务   点击:(64)  评论:(0)  加入收藏
你是否想知道如何应对高并发?Go语言为你提供了答案!
并发编程是当前软件领域中不可忽视的一个关键概念。随着CPU等硬件的不断发展,我们都渴望让我们的程序运行速度更快、更快。而Go语言在语言层面天生支持并发,充分利用现代CPU的...【详细内容】
2023-12-29  灵墨AI探索室  微信公众号  Tags:Go语言   点击:(110)  评论:(0)  加入收藏
站内最新
站内热门
站内头条