
1. 引言与挑战
在数据可视化中,水平条形图(barh)常用于比较不同类别或项目的值。当需要在一个图表中展示多个相关但又需明确区分的类别组时,例如本例中“Alcohol”和“Formalin”两种存储协议下的数据,通常会考虑使用Matplotlib的子图(subplots)功能。然而,直接使用plt.subplots(2, 1, sharex=True)并尝试通过fig.subplots_adjust(hspace=0)来消除子图间距时,往往难以精确控制不同类别组内部条形与组间条形的相对间距,且在图例合并管理上也可能遇到挑战。例如,不同类别组的条形可能需要不同的高度或内部间距,这在分离的子图中实现起来较为繁琐,并且统一的图例也需要额外处理。
2. 优化方案:单轴结合辅助元素
为了克服上述挑战,一种更为灵活和精确的方案是:利用单个坐标轴绘制所有条形,并通过辅助绘图元素(如水平线plt.axhline和文本plt.text)来模拟类别分隔和标签。 这种方法允许我们对所有条形的y轴位置进行统一规划和精细控制,从而实现更灵活的布局和视觉效果。
2.1 核心思想
- 统一Y轴坐标系: 将所有条形(无论属于哪个类别)放置在同一个Y轴上,通过精心设计的Y坐标值来控制它们的位置和相互间距。
- 类别分隔线: 使用plt.axhline在不同类别组之间绘制一条水平线,作为视觉上的分隔符。
- 类别标签: 使用plt.text在相应类别组的旁边添加文本标签,明确指示每个组的名称。
- 图例管理: 由于所有条形都在一个轴上,图例的生成和管理变得更加直接。可以利用Matplotlib的图例机制,或者通过在label前添加下划线_来排除某些条形不显示在图例中。
3. 实现步骤与示例代码
下面我们将通过一个完整的示例来展示如何使用这种方法来重现目标图表。
import matplotlib.pyplot as plt
import numpy as np
# 设置图表风格
plt.style.use('default')
# 准备数据
# Alcohol类别数据
labels_alcohol = ['Borchers et al.', 'Donnelly et al.']
values_alcohol = [24, 1]
# Formalin类别数据
labels_formalin = ['Wang and Feng', 'van Haaren et al.', 'Borchers et al.', 'Gustafson et al.', 'Ebacher et al.']
values_formalin = [3, 3, 24, 52, 52]
# 定义图例标签和对应的填充图案
legend_labels = {
'No Change': '\\',
'Major Change': 'x',
'Minor Change': 'o'
}
# 创建一个新的图表和坐标轴
fig, ax = plt.subplots(figsize=(10, 6))
# --- 绘制 Alcohol 类别条形图 ---
# 为Alcohol类别条形定义Y轴位置和高度
# 这里我们将Alcohol的条形放置在较低的Y轴位置,并设置较小的height以增加间距
y_pos_alcohol = np.arange(len(labels_alcohol)) * 1.2 # 增加间距
bar_height_alcohol = 0.8 # 调整条形高度
# 绘制Alcohol条形
# 注意:为了控制图例,我们只在第一个代表“No Change”的条形上设置label,
# 其他同类别的条形通过在label前加下划线`_`来避免重复显示在图例中
ax.barh(y_pos_alcohol[0], values_alcohol[0], color='white', label='No Change', hatch=legend_labels['No Change'], edgecolor="black", height=bar_height_alcohol)
ax.barh(y_pos_alcohol[1], values_alcohol[1], color='white', label='Major Change', hatch=legend_labels['Major Change'], edgecolor="black", height=bar_height_alcohol)
# --- 绘制 Formalin 类别条形图 ---
# 为Formalin类别条形定义Y轴位置和高度
# Formalin的条形从Alcohol条形上方开始,并设置较大的height使其更紧密
# 预留一些空间给分隔线和类别标签
y_offset_formalin = y_pos_alcohol[-1] + 2.5 # 从Alcohol最后一个条形上方开始,预留2.5单位空间
y_pos_formalin = y_offset_formalin + np.arange(len(labels_formalin)) * 1.0 # 增加间距,但比Alcohol小
bar_height_formalin = 0.9 # 调整条形高度
# 绘制Formalin条形
ax.barh(y_pos_formalin[0], values_formalin[0], color='white', label='_No Change', hatch=legend_labels['No Change'], edgecolor="black", height=bar_height_formalin)
ax.barh(y_pos_formalin[1], values_formalin[1], color='white', label='_Major Change', hatch=legend_labels['Major Change'], edgecolor="black", height=bar_height_formalin)
ax.barh(y_pos_formalin[2], values_formalin[2], color='white', label='Minor Change', hatch=legend_labels['Minor Change'], edgecolor="black", height=bar_height_formalin)
ax.barh(y_pos_formalin[3], values_formalin[3], color='white', label='_No Change', hatch=legend_labels['No Change'], edgecolor="black", height=bar_height_formalin)
ax.barh(y_pos_formalin[4], values_formalin[4], color='white', label='_No Change', hatch=legend_labels['No Change'], edgecolor="black", height=bar_height_formalin)
# --- 添加类别分隔线 ---
# y值选择在两个类别组的中间
separator_y = y_pos_alcohol[-1] + (y_offset_formalin - y_pos_alcohol[-1]) / 2
ax.axhline(y=separator_y, xmin=-0.15, xmax=1.05, color='black', linewidth=0.8, linestyle='-', clip_on=False)
# --- 添加类别标签 ---
# 计算每个类别组的中心Y轴位置
center_y_alcohol = np.mean(y_pos_alcohol)
center_y_formalin = np.mean(y_pos_formalin)
# x轴位置需要根据数据最大值和图表宽度进行调整,以确保文本在图表外侧且不被裁剪
# 假设最大X值为52,我们可以在X轴右侧留出一些空间
max_x_value = max(max(values_alcohol), max(values_formalin))
# 可以尝试将文本放置在略微超出X轴范围的位置,并使用clip_on=False确保显示
text_x_position = max_x_value + 3 # 调整这个值以获得最佳视觉效果
ax.text(x=text_x_position, y=center_y_alcohol, s='Alcohol', rotation='vertical', clip_on=False, fontsize='x-large', ha='left', va='center')
ax.text(x=text_x_position, y=center_y_formalin, s='Formalin', rotation='vertical', clip_on=False, fontsize='x-large', ha='left', va='center')
# --- 设置Y轴刻度标签 ---
# 合并所有标签和对应的Y轴位置
all_labels = labels_alcohol + labels_formalin
all_y_pos = list(y_pos_alcohol) + list(y_pos_formalin)
ax.set_yticks(all_y_pos)
ax.set_yticklabels(all_labels)
ax.set_ylabel('') # 清除Y轴标题,因为类别标签已通过plt.text添加
# 设置X轴标签
ax.set_xlabel('Weeks Stored')
# 设置X轴范围,留出一些右侧空间给类别标签
ax.set_xlim(0, max_x_value + 10) # 适当增加X轴最大值,给右侧文本留空间
# 显示图例
ax.legend()
# 调整布局,确保所有元素可见
plt.tight_layout()
# 保存和显示图表
plt.savefig("Storage Protocol Plot_Optimized.pdf")
plt.show()4. 注意事项与技巧
-
Y轴位置规划:
- 为每个条形分配一个唯一的Y轴坐标。可以使用np.arange(n)作为基础,然后乘以一个因子(例如* 1.2或* 1.0)来调整条形之间的相对间距。
- 在不同类别组之间,通过增加y_offset来创建明显的视觉间隔。
- 确保所有Y轴标签(set_yticks和set_yticklabels)与条形的位置一一对应。
-
条形高度(height参数):
- barh函数的height参数控制条形在Y轴上的厚度。其默认值为0.8。
- 可以通过调整height来控制条形内部的紧密程度。例如,对于需要更稀疏布局的类别,可以设置较小的height值(如0.2);对于更紧密的布局,可以设置较大的height值(如0.9)。
-
图例管理:
- plt.legend()会自动收集所有带有label参数的绘图元素的标签。
- 如果某个条形代表的样式与已有的图例项相同,且您不希望它在图例中重复出现,可以在其label前添加一个下划线_(例如label='_No Change')。Matplotlib通常会忽略以_开头的标签。
- 更高级的图例控制可以使用ax.get_legend_handles_labels()来手动筛选和创建图例。
-
分隔线(plt.axhline):
- y参数指定水平线在Y轴上的位置。
- xmin和xmax参数控制水平线在X轴上的起始和结束比例(0到1代表坐标轴的完整范围)。通过设置小于0或大于1的值,并结合clip_on=False,可以让线条超出坐标轴边界,达到更好的视觉效果。
- clip_on=False:此参数非常重要,它允许绘图元素(如线条、文本)显示在坐标轴边界之外,对于在图表边缘添加辅助信息非常有用。
-
类别标签(plt.text):
- x和y参数指定文本的坐标位置。
- s参数是文本内容。
- rotation='vertical'使文本垂直显示。
- clip_on=False确保文本不会被裁剪。
- ha (horizontal alignment) 和 va (vertical alignment) 参数用于控制文本的对齐方式,例如ha='left'和va='center'。
- fontsize可以调整文本大小。
- 文本的x位置需要根据X轴的最大值和图表布局进行调整,以确保其位于条形图的右侧并有足够的空间。
-
X轴范围调整:
- ax.set_xlim()可以手动设置X轴的显示范围。为了给右侧的垂直类别标签留出空间,需要将X轴的最大值适当增大。
5. 总结
通过将多个类别组的数据绘制在单个Matplotlib坐标轴上,并辅以plt.axhline和plt.text进行视觉分隔和标签,我们能够实现比传统多子图方法更精细、更灵活的水平条形图布局。这种方法不仅简化了图例的管理,也为图表的整体美观性和专业性提供了更强的控制力,特别适用于需要在一个统一视图中展示相关但又需明确区分的数据集场景。掌握这些技巧,将有助于您创建更具表现力和洞察力的数据可视化作品。










