(31)Python时间序列
时间序列是一系列数据点,其中每个数据点与时间戳相关联。 一个简单的例子就是某个特定日子不同时间点股市中股票的价格。 另一个例子是一年中不同月份一个地区的降雨量。
在下面的例子中,我们将特定股票代码的每个季度的股票价格的值作为一个季度。将这些值作为csv文件捕获,然后使用pandas
库将它们组织为数据框。 然后,通过重新创建附加的Valuedate
列作为索引并删除旧的值列来将日期字段设置为数据帧的索引。
样本数据
以下是特定季度不同日期股票价格的样本数据。 数据保存在名为stock.csv 的文件中。
ValueDate Price
01-01-2018, 1042.05
02-01-2018, 1033.55
03-01-2018, 1029.7
04-01-2018, 1021.3
05-01-2018, 1015.4
...
...
...
...
23-03-2018, 1161.3
26-03-2018, 1167.6
27-03-2018, 1155.25
28-03-2018, 1154
创建时间序列
from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])
# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']
df.plot(figsize=(15, 6))
plt.show()
执行上面示例代码,得到以下结果 –
关注右侧公众号,随时随地查看教程
Python数据分析教程目录