热力图是一种可视化方式,用不同颜色的方块或点表示数据的密集程度。在数据科学中,热力图是一种刻画数据相关性的方式,通常是按行或列对数据进行聚类,然后显示聚类矩阵。
Python 中有许多可以制作热力图的库,常用的包括 Seaborn、Matplotlib 等。这些库提供了丰富的热力图分类方法和样式设置,可以方便地制作漂亮的热力图。
import seaborn as sns
import matplotlib.pyplot as plt
# 加载示例数据集
flights = sns.load_dataset("flights").pivot("month", "year", "passengers")
# 绘制热力图 Heatmap
ax = sns.heatmap(flights, cmap="YlGnBu")
# 设置标题和标签
ax.set_title("Passengers Count (1000s)")
ax.set_xlabel("Year")
ax.set_ylabel("Month")
plt.show()
在这个例子中,我们使用 Seaborn 库加载示例数据集并进行了行列聚类,然后使用热力图展示出数据的密度情况。通过 cmap 参数可以设置颜色方案,这里使用了 YlGnBu,即黄绿蓝色。
另外,也可以通过其他参数设置热力图的样式,例如热力图颜色条的位置、文字字体和大小等等。最终,我们得到了一张漂亮的热力图!