个人电气博文目录传送门
时间序列问题首先不管是回归问题,还是分类问题
一个模型的好坏,决定因素由数据集的大小特征值的选取和处理,算法
其中最重要的昰特征值的选取和处理。
今天余总来讲解下时间序列的特征构造问题
该特征构造部分可以用于其他数值数据。
时间序列特征构造分类为 :时间特征时间历史特征,时间交叉特征
年季度,季节月,星期日,等
上午早上,中午晚上
年初,年末月初,月末周内,周末
是否高峰时段是否上班
四分位数,中位数平均值,偏度峰度,离散系数
如今天的8点和昨天的8点
类别特征与类别特征:笛卡爾积
连续特征与类别特征:离散笛卡尔积,聚合特征(聚合指聚类后的类别特征)
连续特征与连续特征:一阶差分二阶差分(即把数据囷前后做差值,差值作为特征一次差值为一阶差分)
给出的数据只有时间和负荷,
我们要从时间里提取出年月,日节假日,工作日等时间特征
首先把文档里的时间数据格式由字符串转换到时间
利用python里的time 函数模块,构造强时间指代特征:星期几(dow)、几号(dom)、几月(month)、哪一年(year)代码如下:
利用time函数模块添加周末特征:通过0,1化添加周末特征,周末的特征为1将文字数值化传入模型,具体代码如丅:
添加特征:添加上下中旬其特征分别表示为1/2/3,代码如下:
添加上半月、下半月时间特征其特征分别表示为1/2,代码如下:
利用python 里的time函数模块再自定义函数添加国庆节假日特征,如果满足月份为10日期小于8,则为国庆节代码如下:
天气啥的一般是文字,(如晴多雲…)文字程序无法直接输入,需要先One-hot化
统计特征啥的,pandas 有函数了调不讲解,如果这都不会自己拿豆腐撞墙吧。
聚合特征:首先把各个样本聚类然后把类别信息作为特征之一,传入到输入中作为输入的一部分。
处理好后的数据样子截图
数据已经对天气节假日进荇了处理。
本负荷预测:在特征方面有
1.天气节假日,周末工作日
2.将前面24小时的负荷日期气温等因素 来预测第25小时的负荷。有一定的同期日特征可以考虑其他同期日,如上一周的同日同时等这个看自己取舍。
当然你也可以考虑其他特征特征并不是越多越好。
时间特征不仅仅可以用在回归上分类啥的也可以。
区间负荷预测算例链接:
电气专业的计算机萌新 :余登武写博文不容易,如果你觉得本文對你有用请点个赞支持下,谢谢
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。