博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
多线程下的false sharing问题+编程实践(待完善)
阅读量:4958 次
发布时间:2019-06-12

本文共 1673 字,大约阅读时间需要 5 分钟。

1.false sharing原因:

CPU loads memory into cache by "line"

Linux下获取cache line :

cat /proc/cpuinfo | grep cache_alignment

or cat /sys/devices/system/cpu/cpuN/cache/indexN/coherency_line_size 以及其他详尽的cpu cache信息

 

Maybe : get cacheline programatically ( via C language )

Multi-cpu contention algorithm "hardware write lock"

Maybe : cache algorithms "MESI"

 

2.程序示例

根据开启的线程数量,观察完成时间的scaling情况,同时观察CPU load

实践:验证the time waiting for memory is counted into CPU time?

 

3.数据在同一cache line的原因

Array is continuous

The linker lay out global or static data closely in the memory ( in the data segment? )

structs and C++ object layout is compact

Two individual objects on the heap happens to be nearby.(Especially for same kind of objects allocated using its own memory-pool or slab-allocator)

 

4.解决办法

1)reduce access of the false-sharing structure <= use thread stack or local storage

2)using alignment + pading to eliminate false-sharing

Reminder : the CACHE_LINE_SIZE must be defined at compiling time

c++0x syntax : [[ align(CACHE_LINZE_SIZE) ]] T data;

(可惜GCC现在仍然不支持alignment,)

GCC's externsion : __attribute__(( aligned(CACHE_LINE_SIZE) )) T data;

实践:A general wrapper to ensure 'correct individual ' : CacheLineStorage<T> (Maybe only useful for data object)

 

5. 最佳实践+总结

1)尽量减少线程间共享结构的频繁读写(尽管无需锁,依然会造成cache-line miss)

2)如果共享结构必须,则注意使在不同线程中频繁读取的数据位于不同的cache line上

 

6. 数据 + Profiling方法

Intel Pentium M:

Register <= 1;  L1d ~ 3;  L2 ~ 14; Main-Memory ~ 240; (cycles)

按2GHz CPU计算,cache-miss-time最大约为100ns (0.1us)?

TODO : 使用profiling工具来检查CPI和cache miss rate

 

参考文献:

Eliminate false sharing by Herb Sutter (nice blog and author!)

 

 

转载于:https://www.cnblogs.com/promise6522/archive/2012/01/11/2319957.html

你可能感兴趣的文章
java小技巧
查看>>
POJ 3204 Ikki's Story I - Road Reconstruction
查看>>
【BZOJ】2959: 长跑(lct+缩点)(暂时弃坑)
查看>>
iOS 加载图片选择imageNamed 方法还是 imageWithContentsOfFile?
查看>>
toad for oracle中文显示乱码
查看>>
SQL中Group By的使用
查看>>
错误org/aopalliance/intercept/MethodInterceptor解决方法
查看>>
Pylint在项目中的使用
查看>>
使用nginx做反向代理和负载均衡效果图
查看>>
access remote libvirtd
查看>>
(4) Orchard 开发之 Page 的信息存在哪?
查看>>
ASP.NET中 GridView(网格视图)的使用前台绑定
查看>>
深入了解Oracle ASM(二):ASM File number 1 文件目录
查看>>
Boosting(提升方法)之AdaBoost
查看>>
链接元素<a>
查看>>
Binding object to winForm controller through VS2010 Designer(通过VS2010设计器将对象绑定到winForm控件上)...
查看>>
Spring Boot实战笔记(二)-- Spring常用配置(Scope、Spring EL和资源调用)
查看>>
第二章:webdriver 控制浏览器窗口大小
查看>>
【动态规划】流水作业调度问题与Johnson法则
查看>>
Python&Selenium&Unittest&BeautifuReport 自动化测试并生成HTML自动化测试报告
查看>>