在数据分析的世界中,数据处理与可视化是密不可分的两个环节。
Pandas作为Python数据处理的核心工具,以其强大的数据清洗、转换和分析能力,成为数据科学家和分析师的必备利器;
而Plotly则是交互式可视化的佼佼者,能够将复杂的数据以直观、动态的方式呈现出来。
当我们将Pandas与Plotly深度融合时,就能无缝衔接数据清洗、分析与可视化的全流程,大幅提升数据分析的效率和效果。
- 从Pandas数据结构到Plotly图表
1.1. Series 与 DataFrame 数据创建图表
Plotly提供了强大的plotly.express模块,能够直接读取Pandas的数据结构,如Series和DataFrame,并快速生成各种交互式图表。
例如,使用px.line(df)可以将一个时间序列的DataFrame转换为折线图,而px.bar(series)则可以将一个Series转换为条形图。
import pandas as pd
import numpy as np
import plotly.express as px
创建一个示例 DataFrame
data = {
"date": pd.date_range(start="2024-01-01", periods=100),
"sales": np.random.randint(100, 500, size=100),
}
df = pd.DataFrame(data)
使用 Plotly Express 创建折线图
fig = px.line(df, x="date", y="sales", title="时间序列销售数据")
fig.show()
在这个例子中,x='date'和y='sales'将DataFrame的列名映射到了图表的坐标轴上。
将数据中的某个列(Series)取出来,可以直接绘制条形图。