作者 | 花名有孚
来源 | rrd.me/fukFv
每个人都有自己的喜好,就像我喜欢Java一样。学习Java的乐趣之一在于它的深度和广度。在日常工作中,我们常常会遇到一些从未探索过的功能,比如线程。没错,就是Thread类。当我们构建高扩展性系统时,常常会遇到各种并发编程问题,本文将介绍一些关于线程的不常用方法和技术,无论你是初学者、高级用户还是Java专家,希望能从中有所收获。如果你有关于线程的其他见解,欢迎在评论区分享。
初学者篇
每个线程都有一个名称,创建线程时会分配一个简单的字符串作为线程名。默认名称是“Thread-0”、“Thread-1”、“Thread-2”等。Thread类提供了两种设置线程名称的方法:
通过线程构造函数:
class SuchThread extends Thread { public void run() { System.out.println("Hi Mom! " + getName()); } } SuchThread wow = new SuchThread("much-name");
通过setName方法:
wow.setName("Just another thread name");
线程名称是可变的,可以在运行时修改,不必在初始化时就指定。名称字段是一个简单的字符串对象,最多可达2³¹-1个字符(Integer.MAX_VALUE)。注意,线程名称不是唯一标识符,不同线程可以有相同的名称。使用null作为线程名会抛出异常,但“null”字符串是可以的。
使用线程名称调试问题
设置线程名称可以帮助调试问题。例如,在处理用户请求时,将事务ID附加到线程名称中,可以显著减少排查问题的时间。
"pool-1-thread-1" #17 prio=5 os_prio=31 tid=0x00007f9d620c9800nid=0x6d03 in Object.wait() [0x000000013ebcc000]
改进后的名称:
Thread.currentThread().setName(Context + TID + Params + current Time, ...);
使用jstack运行后,情况变得清晰:
"Queue Processing Thread, MessageID: AB5CAD, type:AnalyzeGraph, queue: ACTIVE_PROD, Transaction_ID: 5678956,Start Time: 30/12/2014 17:37" #17 prio=5 os_prio=31 tid=0x00007f9d620c9800nid=0x6d03 in Object.wait() [0x000000013ebcc000]
这样,当线程出现问题时,至少可以获取事务ID来开始排查。
线程还有一个有趣的属性——优先级。线程优先级在1(MIN_PRIORITY)到10(MAX_PRIORITY)之间,主线程默认是5(NORM_PRIORITY)。新线程默认继承父线程的优先级,如果没有设置,所有线程的优先级都是5。这个属性常被忽略,可以通过getPriority()和setPriority()方法获取和修改。
优先级的应用场景
并不是所有线程都是平等的,有些需要立即获得CPU注意力,有些只是后台任务。优先级就是用来告诉操作系统线程调度器的。在Takipi中,我们开发的错误跟踪工具中,处理用户异常的线程优先级是MAX_PRIORITY,而上报新部署情况的线程优先级较低。高优先级的线程并不总是能从JVM线程调度器那里获得更多时间。
在操作系统层面,每个新线程对应一个本地线程,Java线程的优先级会被转换为本地线程的优先级,不同平台可能不同。在Linux上,可以通过“-XX:+UseThreadPriorities”选项启用此功能。Java线程的优先级只是一个建议,不能覆盖所有本地优先级(Linux优先级从1到99,线程优先级在-20到20之间)。设置优先级可以影响每个线程获得的CPU时间,但不建议完全依赖优先级。
进阶篇
ThreadLocal是一个在Thread类之外实现的功能(java.lang.ThreadLocal),为每个线程存储一份唯一的数据。就像它的名字一样,它为线程提供了本地存储,每个线程实例的变量都是唯一的。可以自定义一些属性,就像它们存储在Thread线程内部一样。不过,需要注意一些潜在的问题。
创建ThreadLocal有两种推荐方式:静态变量或单例实例中的属性,这样可以是非静态的。它的作用域是全局的,但对访问它的线程而言是本地的。在下面的例子中,ThreadLocal存储了一个数据结构,方便访问:
public static class CriticalData { public int transactionId; public int username; } public static final ThreadLocal<CriticalData> globalData = new ThreadLocal<CriticalData>();
获取ThreadLocal对象后,可以通过globalData.set()和globalData.get()方法进行操作。
全局变量?这不是好事
确实如此。ThreadLocal可以存储事务ID,当代码中出现未捕获异常时非常有用。最佳实践是设置一个UncaughtExceptionHandler,这是Thread类本身支持的,但需要自己实现。一旦执行到UncaughtExceptionHandler,之前导致异常的所有变量都无法访问,因为那些栈帧已经被弹出。唯一能抓住的最后一根稻草就是ThreadLocal。
尝试这样做:
System.err.println("Transaction ID " + globalData.get().transactionId);
ThreadLocal还可以分配一块特定的内存,让工作线程作为缓存反复使用。需要注意的是,ThreadLocal会造成内存浪费,只要线程还活着,它就会一直存在,除非主动释放,否则不会被回收。因此,使用时应尽量保持简单。
回到Thread类。每个线程都有状态,要么是用户状态,要么是守护状态,即前台线程或后台线程。主线程默认是用户线程,每个新线程会从创建它的线程中继承线程状态。如果将一个线程设置为守护线程,它创建的所有线程也会被标记为守护线程。如果程序中所有线程都是守护线程,进程就会终止。可以通过setDaemon(true)和isDaemon()方法查看和设置线程状态。
何时使用守护线程?
如果进程不必等待某个线程结束即可终止,那么这个线程可以设置为守护线程。这可以避免正常关闭线程的麻烦,立即结束线程。如果一个执行操作的线程必须正确关闭以避免不良后果,那么它应该是用户线程。通常是关键事务,如数据库录入或更新,这些操作不能中断。
专家级
处理器亲和性让线程或进程绑定到特定的CPU核上,意味着特定线程只在特定CPU核上执行。通常,操作系统的线程调度器会根据自己的逻辑决定如何绑定,可能考虑线程优先级。
这样做的好处是提高CPU缓存命中率。如果线程只在一个核上运行,数据在缓存中的概率就大大提高。如果数据在CPU缓存中,就不需要从内存中重新加载。这几毫秒的节省可以用于执行代码,更好地利用分配的CPU时间。操作系统和硬件架构可能有优化,但处理器亲和性至少能减少线程切换CPU的概率。
处理器亲和性对吞吐量的影响需要通过测试来验证。虽然不总是能显著提升性能,但至少能使吞吐量更稳定。亲和策略可以细化到非常细的粒度,这取决于具体需求。高频交易行业是这一策略最能发挥作用的场景之一。
处理器亲和性的测试
Java没有原生支持处理器亲和性,但在Linux上可以通过taskset命令设置进程的亲和性。例如,要将Java进程绑定到特定CPU上:
taskset -c 1 "java AboutToBePinned"
如果是一个已运行的进程:
taskset -c 1 <pid>
要深入到线程级别,需要额外的代码。幸运的是,有一个开源库可以完成这项工作:Java-Thread-Affinity。这个库由OpenHFT的Peter Lawrey开发,是实现这一功能的最简单方式。快速看一下如何绑定某个线程,关于该库的更多细节,请参考其Github文档:
AffinityLock al = AffinityLock.acquireLock();
关于获取锁的更多高级选项,如根据不同策略选择CPU,Github上有详细说明。
结论
本文介绍了关于线程的5个知识点:线程名称、线程本地存储、优先级、守护线程以及处理器亲和性。希望这些内容能为你日常工作中的线程使用打开一扇新窗,期待你的反馈!如果你有关于线程处理的其他方法可以分享,欢迎不吝赐教。
以上就是关于线程的 5 个知识点的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号