您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

如何将一个时间序列分解为周期序列和趋势序列的和?

时间:2023-03-07 12:27:34  来源:微信公众号  作者:人工智能技术
时间序列分解是时序分析中的重要方法,广泛应用于时间序列预测,时间序列异常检测,时间序列聚类等场景,在工业界有很多的落地应用。

一个时间序列往往是以下几类变化形式的叠加或耦合:

  • 长期趋势(Secular trend, T):长期趋势指现象在较长时期内持续发展变化的一种趋向或状态。
  • 季节变动(Seasonal Variation, S):季节波动是由于季节的变化引起的现象发展水平的规则变动
  • 循环波动(Cyclical Variation, C):循环波动指以若干年为期限,不具严格规则的周期性连续变动
  • 不规则波动(Irregular Variation, I): 不规则波动指由于众多偶然因素对时间序列造成的影响

其中循环波动和季节变动一般可整合分解为有规律的周期序列,而长期趋势则可整合分解为趋势序列。分解出这两种序列是时序分解中的重要课题。

本次文章为大家整理分解周期序列和趋势序列的方法。

概述

这里主要使用的技术是奇异谱分析(SSA),其是根据观测到的时间序列构造轨迹矩阵,并对轨迹矩阵进行分解和重构,从而提取出代表原时间序列不同成分的信号,如长期趋势信号、周期信号、噪声信号等,从而进一步对分解得到的信号进行分析。

算法流程如下:

  1. 根据原始时间序列构建轨迹矩阵 X
  2. 对矩阵X进行奇异值分解
  3. 按奇异值生成r个子矩阵
  4. 根据某一分组原则将子矩阵 Xi 分为 m个组
  5. 对子矩阵 Xi 进行对角均值化处理得到子序列!
  6. 对m个组中的子序列相加得到分组子序列。

矩阵分解

01 时间序列嵌入形成轨迹矩阵

输入:原始时间序列y,窗口长度L

显然矩阵X是一个汉克尔矩阵(每一条副对角线的元素都相等),矩阵的行数为窗口长度L,列数为N-L+1

02 奇异值分解

其中:

奇异值分解将轨迹矩阵 X 分解为酉矩阵 U,对角阵 ∑ 和酉矩阵V的线性组合。这意味着:

r表示矩阵X的非零特征根数也即矩阵的秩。

03 特征分组

不妨设根据某一分组原则将子矩阵分为了trend、periodic、noise 3组,对应的矩阵X分解得到的子序列将被组合为3部分。

04 对角平均化

其中:

代码实例

'''数据处理'''
import pandas as pd
import numpy as np
'''数据可视化'''
import matplotlib.pyplot as plt
plt.rcParams['figure.dpi'] = 800           #调整分辨率
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文
plt.rcParams['axes.unicode_minus']=False   #正常显示负号

###加载数据集###
file = r'D:/关注@公众号|机器学习研习院/crude-oil-price.csv'
oil_info = pd.read_csv(file,index_col='date')
price = oil_info['price']

# 算法封装
class SSA(object):
    
    __supported_types = (pd.Series,np.ndarray,list) #限制时间序列的输入类型
    
    def __init__(self,tseries,L):
        '''
        Args:
            tseries:原始时间序列
            L:窗口长度
        '''
        
        if not isinstance(tseries, self.__supported_types):
            rAIse TypeError("请确保时间序列的数据类型为Pandas Series,NumpPy array 或者list")
        else:
            self.orig_TS = pd.Series(tseries)
            
        self.N = len(tseries)        #原始时间序列长度
        if not 2 <= L <= self.N / 2:
            raise ValueError("窗口长度必须介于[2,N/2]")
        self.L = L                   #窗口长度,轨迹矩阵的行数
        self.K = self.N - self.L + 1 #轨迹矩阵的列数
        self.X = np.array([self.orig_TS.values[i:L+i] for i in range(0,self.K)]).T
        
        #奇异值分解
        self.U,self.Sigma,VH = np.linalg.svd(self.X)
        self.r = np.linalg.matrix_rank(self.X)    #矩阵的秩等于非零特征值的数量
        #每一个非零特征值都对应一个子矩阵,子矩阵对角平均化后得到原始时间序列的一个子序列
        self.TS_comps = np.zeros((self.N,self.r)) 
        
        #对角平均还原
        for i in range(self.r):
            X_elem = self.Sigma[i] * np.outer(self.U[:,i], VH[i,:]) 
            X_rev = X_elem[::-1]
            self.TS_comps[:,i] = [X_rev.diagonal(j).mean() for j in range(-X_rev.shape[0]+1, X_rev.shape[1])]
            
    def comps_to_df(self):
        '''
        将子序列数组转换成DataFrame类型
        '''
        cols = ["F{}".format(i) for i in range(self.r)]
        return pd.DataFrame(data=self.TS_comps,columns=cols,index=self.orig_TS.index)
    
    def reconsruct(self,indices):
        '''
        重构,可以是部分重构(相当于子序列的分组合并),
        也可以是全部合并(重构为原序列)
        Args:
            indices   重构所选择的子序列
        '''
        if isinstance(indices,int):
            indices = [indices]
        
        ts_vals = self.TS_comps[:,indices].sum(axis=1)
        return pd.Series(ts_vals,index=self.orig_TS.index)
    
    def vis(self):
        '''
        可视化子序列
        '''
        fig,axs = plt.subplots(self.r,sharex='all')
        for i in range(self.r):
            axs[i].plot(self.reconsruct(i),lw=1)
            

price_SSA = SSA(price,7)
comps_df = price_SSA.comps_to_df()
数据来源:
https://www.kaggle.com/code/naveenkonam1985/crude-oil-price-prediction/data


Tags:序列   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
Java中的序列化和反序列化它们的作用和用途是什么?
在 Java 中,序列化(Serialization)是指将对象转换为字节序列的过程,而反序列化(Deserialization)则是指将字节序列转换回对象的过程。序列化和反序列化主要用于在网络传输、持久化...【详细内容】
2023-12-26  Search: 序列  点击:(159)  评论:(0)  加入收藏
iphone序列号怎么查询?iphone序列号开头字母含义
iphone序列号的查询方式有5种,你可以在iPhone的“设置”应用程序中找到序列号,也可以在iCloud账户、iTunes、苹果官网或iPhone包装盒上查看序列号。1、在iPhone设置中查看:打开...【详细内容】
2023-12-13  Search: 序列  点击:(71)  评论:(0)  加入收藏
苹果iphone序列号怎么查询激活日期?
苹果激活日期查询是一项重要的操作,可帮助用户了解苹果手机的保障服务和支持期限。以下是查询iPhone激活日期的简单步骤,以iPhone13pro为例:步骤1:打开手机设置在手机桌面上,找到...【详细内容】
2023-12-12  Search: 序列  点击:(47)  评论:(0)  加入收藏
面向时间序列数据的深度学习应用综述
时间序列数据是指按照时间顺序排列的数据集合,如股票价格、气象数据、交通流量等。深度学习作为一种强大的机器学习技术,已经在时间序列数据分析中取得了显著的成果。本文将对...【详细内容】
2023-11-27  Search: 序列  点击:(112)  评论:(0)  加入收藏
Python数据序列化与反序列化:高效数据交换与存储
数据在计算机世界中流动不息,但在不同的应用程序、系统和语言之间共享和存储数据可能会涉及各种复杂性和挑战。Python提供了丰富的工具和库来处理数据序列化与反序列化,本文带...【详细内容】
2023-11-20  Search: 序列  点击:(228)  评论:(0)  加入收藏
Android数据对象序列化原理与应用
序列化与反序列化「序列化」是将对象转换为可以存储或传输的格式的过程。在计算机科学中,对象通常是指内存中的数据结构,如数组、列表、字典等。通过序列化,可以将这些对象转换...【详细内容】
2023-11-14  Search: 序列  点击:(273)  评论:(0)  加入收藏
一套晨起流瑜伽序列,让身体一天都充满活力
秋冬之际,不仅天气干燥,人也容易疲软,不管是清晨还是午后,都想躺着睡个足,却不知道秋冬这样的季节,最忌睡得太多。睡得多不仅会增加心血管疾病的风险,也会增加醉睡的可能性,建议年轻...【详细内容】
2023-11-13  Search: 序列  点击:(93)  评论:(0)  加入收藏
Python文件操作:JSON、CSV、TSV、Excel和Pickle文件序列化
文件操作是Python编程的重要部分,它涉及处理各种文件格式,包括JSON、CSV、TSV、Excel和Pickle。一、JSON文件操作1.1 什是JSON?JSON(JavaScript Object Notation)是一种轻量级数...【详细内容】
2023-10-26  Search: 序列  点击:(77)  评论:(0)  加入收藏
几个简单易学的瑜伽序列让你迅速提升
每一个高难度体式的完成的背后都是练习者长期坚持练习的结果第1套: 站立平衡体式 站立体式,建立双腿力量 适合初学者经常练习第2套: 坐姿体式 涉及扭转,后弯,灵活髋部等 非常全面...【详细内容】
2023-10-08  Search: 序列  点击:(51)  评论:(0)  加入收藏
什么是时间序列异常检测
时间序列异常检测是指在时间序列数据中发现不符合预期模式的数据点或数据集合的方法,它广泛应用于金融、制造业、能源等领域中,可以帮助企业及早发现异常,并采取相应措施,从而提...【详细内容】
2023-09-22  Search: 序列  点击:(202)  评论:(0)  加入收藏
▌简易百科推荐
小红书、视频号、抖音流量算法解析,干货满满,值得一看!
咱们中国现在可不是一般的牛!网上的网友已经破了十个亿啦!到了这个互联网的新时代,谁有更多的人流量,谁就能赢得更多的掌声哦~抖音、小红书、、视频号,是很多品牌必争的流量洼地...【详细内容】
2024-02-23  二手车小胖说    Tags:流量算法   点击:(13)  评论:(0)  加入收藏
雪花算法详解与Java实现:分布式唯一ID生成原理
SnowFlake 算法,是 Twitter 开源的分布式 ID 生成算法。其核心思想就是:使用一个 64 bit 的 long 型的数字作为全局唯一 ID。在分布式系统中的应用十分广泛,且 ID 引入了时间戳...【详细内容】
2024-02-03   一安未来  微信公众号  Tags:雪花算法   点击:(50)  评论:(0)  加入收藏
程序开发中常用的十种算法,你用过几种?
当编写程序时,了解和使用不同的算法对解决问题至关重要。以下是C#中常用的10种算法,每个算法都伴随着示例代码和详细说明。1. 冒泡排序 (Bubble Sort):冒泡排序是一种简单的比...【详细内容】
2024-01-17  架构师老卢  今日头条  Tags:算法   点击:(44)  评论:(0)  加入收藏
百度推荐排序技术的思考与实践
本文将分享百度在推荐排序方面的思考与实践。在整个工业界的推广搜场景上,特征设计通常都是采用离散化的设计,需要保证两方面的效果,一方面是记忆,另一方面是泛化。特征都是通过...【详细内容】
2024-01-09  DataFunTalk  微信公众号  Tags:百度推荐   点击:(77)  评论:(0)  加入收藏
什么是布隆过滤器?如何实现布隆过滤器?
以下我们介绍了什么是布隆过滤器?它的使用场景和执行流程,以及在 Redis 中它的使用,那么问题来了,在日常开发中,也就是在 Java 开发中,我们又将如何操作布隆过滤器呢?布隆过滤器(Blo...【详细内容】
2024-01-05  Java中文社群  微信公众号  Tags:布隆过滤器   点击:(87)  评论:(0)  加入收藏
面向推荐系统的深度强化学习算法研究与应用
随着互联网的快速发展,推荐系统在各个领域中扮演着重要的角色。传统的推荐算法在面对大规模、复杂的数据时存在一定的局限性。为了解决这一问题,深度强化学习算法应运而生。本...【详细内容】
2024-01-04  数码小风向    Tags:算法   点击:(96)  评论:(0)  加入收藏
非负矩阵分解算法:从非负数据中提取主题、特征等信息
非负矩阵分解算法(Non-negativeMatrixFactorization,简称NMF)是一种常用的数据分析和特征提取方法,主要用于从非负数据中提取主题、特征等有意义的信息。本文将介绍非负矩阵分解...【详细内容】
2024-01-02  毛晓峰    Tags:算法   点击:(63)  评论:(0)  加入收藏
再谈前端算法,你这回明白了吗?
楔子 -- 青蛙跳台阶一只青蛙一次可以跳上一级台阶,也可以跳上二级台阶,求该青蛙跳上一个n级的台阶总共需要多少种跳法。分析: 当n=1的时候,①只需要跳一次即可;只有一种跳法,即f(...【详细内容】
2023-12-28  前端爱好者  微信公众号  Tags:前端算法   点击:(108)  评论:(0)  加入收藏
三分钟学习二分查找
二分查找是一种在有序数组中查找元素的算法,通过不断将搜索区域分成两半来实现。你可能在日常生活中已经不知不觉地使用了大脑里的二分查找。最常见的例子是在字典中查找一个...【详细内容】
2023-12-22  小技术君  微信公众号  Tags:二分查找   点击:(78)  评论:(0)  加入收藏
强化学习算法在资源调度与优化中的应用
随着云计算和大数据技术的快速发展,资源调度与优化成为了现代计算系统中的重要问题。传统的资源调度算法往往基于静态规则或启发式方法,无法适应动态变化的环境和复杂的任务需...【详细内容】
2023-12-14  职场小达人欢晓    Tags:算法   点击:(165)  评论:(0)  加入收藏
站内最新
站内热门
站内头条