faspand的部落格

1.相关概念

1.1模态（Modality）

“模态”（Modality）指的是数据的不同类型或形式

1.2时序数据（Time Series Data)

1.2.1def.

时间序列是以规律的时间间隔采集的测量值的有序集合

1.2.2特征

数据点之间存在时间顺序

时间序列的顺序和时间间隔非常重要

依赖于时间，但不一定是时间的严格函数

1.2.3分类

研究对象

一元时间序列和多元时间序列

时间参数

离散时间序列和连续时间序列

统计特性

平稳时间序列和非平稳时间序列

分布规律

高斯型时间序列和非高斯型时间序列

高斯型时间序列是指数据遵循正态分布的时间序列

1.3文本数据（Textual Data）

1.3.1def.

不能参与算术运算的任何字符，也称为字符型数据。如英文字母、汉字、不作为数值使用的数字(以单引号开头)和其他可输入的字符

1.3.2特征

1、半结构化

文本数据既不是完全无结构的也不是完全结构化的。例如文本可能包含结构字段，如标题、作者、出版日期、长度、分类等，也可能包含大量的非结构化的数据，如摘要和内容。

2、高维

文本向量的维数一般都可以高达上万维，一般的数据挖掘、数据检索的方法由于计算量过大或代价高昂而不具有可行性。

3、高数据量

一般的文本库中都会存在最少数千个文本样本，对这些文本进行预处理、编码、挖掘等处理的工作量是非常庞大的，因而手工方法一般是不可行的。

4、语义性

文本数据中存在着一词多义、多词一义，在时间和空间上的上下文相关等情况。

2时序分析常用方法

2.1描述性时序分析

描述性时序分析又被称之为确定型时序分析，它主要是通过直观的数据比较或绘图观测，寻找序列中蕴含的发展规律。该方法简单直接，所以一般也是时序分析的第一步。

例如，1844 年，德国天文学家海因利希·史瓦贝在 Astronomische Nachrichten 报告了太阳黑子数量的周期性变化规律。其通过系统性的连续观测，发现太阳黑子的爆发呈现出 11 年作用的周期变化。

直观

对数据的要求很高，需要保证数据分布呈现出一定的规律性

2.2 统计时序分析

利用数理统计学相关的原理和方法来分析时间序列

2.2.1 频域分析

假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动

2.2.2 时域分析

参照事件发展过程中的惯性，从而通过惯性用统计来描述就是时间序列值之间存在的相关关系,拟合出适当的数学模型来描述这种规律

自回归 AR 模型

ARMA 模型:平稳时间序列分析过程

ARIMA 模型:非平稳序列随机分析过程

2.3 平稳时间序列检验

2.3.1 严平稳时间序列

序列所有的统计性质都不会随着时间的推移而发生变化

2.3.2 宽平稳时间序列

只要保证序列二阶矩平稳，就代表序列稳定

2.4 自相关(Autocorrelation)图

又称之为序列相关。在时间序列中，当我们使用以前的时间步长来计算时间序列观测的相关性时。由于时间序列的相关性与之前的相同系列的值进行了计算，就被称之为自相关

2.5 纯随机性检验

用来判断一个平稳序列是否随机=>纯随机序列是没有任何分析价值的

涉及两个统计量：Q 统计量和 LB 统计量（Ljung-Box）。

但由于 LB 统计量是 Q 统计量的修正，所以业界通常所称的 Q 统计量也就是 LB 统计量。

计算：Python 中，我们可以利用 statsmodels 统计计算库中的 acorr_ljungbox() 函数计算 LB 统计量，该函数默认会返回 LB 统计量和 LB 统计量的 P 值。如果 LB 统计量的 P 值小于 0.05，我们则认为该序列为非随机序列，否则就为随机序列。

2.6 ARMA（Autoregressive moving average）自回归移动平均模型

适用于平稳序列

2.6.1 分类

AR 自回归模型，MA 移动平均模型和 ARMA

AR模型

假设序列包含线性关系，然后使用 $x_{1}$ 至 $x_{t−1}$ 序列来预测 $x_{t}$。其中，$p$ 阶 AR 模型的公式为：

$X_{t}=c+\sum _{{i=1}}^{p}\varphi _{i}X_{{t-i}}+\varepsilon_{t}$

其中，$c$ 为常数项。$ε_{t}$ 被假设为平均数等于 0，标准差等于 $σ$的随机误差值。$σ$ 被假设为对于任何的 $t$ 都不变。$p$ 则代表落后期数。

MA模型

若随机过程 $x_{t}$ 为现在与过去 $q$ 期随机过程 $ε_{t},ε_{t−1},…,ε_{t−q}$ 之加权平均，则 $q$ 阶 MA 模型的公式为：

${x_{t}=\varepsilon _{t} + \theta _{1}\varepsilon _{t-1} +
\theta _{2}\varepsilon _{t-2} + \cdots + \theta
_{q}\varepsilon _{t-q}}$

其中，$θ_{1},…,θ_{q}$ 是参数，$ε_{t},ε_{t−1},…,ε_{t−q}$ 都是白噪声。

ARMA

ARMA 模型一般记作：$ARMA(p,q)$，即为 $p$ 阶 AR 和 $q$ 阶 MA 模型的组合。

建模过程

获取序列
通过平稳性检验
通过纯随机性检验
需要确定 $p$ 和 $q$ 的取值。一般来讲，确定二者的取值有 3 种方法，分别是 AIC（Akaike Information Criterion ），BIC（Bayesian Information Criterion ）和 HQIC（Hannan-Quinn Criterion ）。
搭建 ARMA 模型
模型评估

2.7 差分运算

目的：序列平稳的方法

差分运算实际上是一种从序列中提取确定性信息的方法

1阶差分：对两个序列相邻值（延迟 1 期 时间间隔）作减法运算

$\nabla x_t = x_t – x_{t-1}$

此时，如果对 $1$ 阶差分后的序列再进行一次 $1$ 阶差分运算，就可以记 $∇^{2}x_{t}$ 为 $x_{t}$ 的 $2$ 阶差分，公式如下：

$\nabla^2 x_t = \nabla x_t – \nabla x_{t-1}$

那么，依次类推，对 $p−1$ 阶差分后序列再进行一次 $1$ 阶差分运算，就可以记 $∇^{p}x_{t}$ 为 $x_{t}$ 的 $p$ 阶差分，公式如下：

$\nabla^p x_t = \nabla^{p-1} x_t – \nabla^{p-1} x_{t-1}$

除此之外，如果两个序列值之间延迟 $k$ 期再做减法运算称为 $k$ 步差分运算，记 $∇_kx^t$ 为 $x_t$ 的 $k$ 阶步差分，公式如下：

$\nabla_k x_t = x_t – x_{t-k}$

一般在差分时阶数不宜过大。原因在于差分其实是对信息提取加工的过程，每次差分都会带来信息损失，过度差分会导致有效信息损失而降低精度。一般情况下，线性变化通过 1 次差分即可平稳，非线性趋势 2，3 次差分也能变得平稳，一般差分次数不超过 2 次。

2.8 ARIMA 介绍及建模

非平稳

相比于 ARMA 模型中存在的 $p$, $q$ 参数，ARIMA 多了一个参数，那就是使非平稳序列成为平稳序列所做的差分阶数 $d$。所以，ARIMA 模型通常记作：$ARIMA(p,d,q)$。

2024年9月23日

现地前置——搞一张乐天数据卡

[warning]最近，有人说TalkU和Talk360这些用于过验证的拨号软件都无法使用，拨出会显示不显示电话号码，viber好像可以显示但是依旧无法通过eplus的电话验证，故最近购买乐天预付费电话卡抽票的请谨慎。[/warning]

本文是基于airisa大神的《关于远征live你所需要的一切》中2.4部分结合个人实践的补充

本人一直有个去霓虹看一场live的梦想，因疫情放开及eupd不做人的恶劣行径，这个愿望越来越强烈。

而日本大多数演唱会的抽选平台都需要一个日本手机号才能注册，日本手机号实名要求也是比较严格的。在《关于远征live你所需要的一切》中，airisa推荐了cmlink及乐天预付费卡两种卡，对比如下：

两者对比

参考链接：https://nga.178.com/read.php?pid=689882515&opt=128

	CMLINK	乐天一年预付款
资费	1700日元/月可买6(个月)赠1	首年6060日元/年续费5400日元/年不同渠道可能不同价
套餐包含	10G高速流量10条短信	3G高速流量其中2G可漫游
语音功能	有	可曲线实现
免费项	被叫/收短信	收短信
激活方式	日本激活	可国内激活
购买方式	中/日寄送	需转运寄送
漫游	需要申请，不含流量	可以(短信/流量)
挂失补卡	可以	不可以
中文客服	有	无

这张卡的漫游貌似是先绕法国再回东京，插在我的三星平板上激活的也是法国商店。缺点是延迟有些大，但日本原生IP是没问题的。

经过深思熟虑（穷），本人最终选择了乐天一年预付款卡

购买

该产品不发日本国外，需找转运平台运回国内。

购买还需国际卡组织的银行卡，若没有也可通过代购平台购买，下文中提到的jpgoodbuy亦有提供代购服务。

关于国内银行发行的国际卡组织银行卡，请移步海淘氪金不求人——申领国际卡组织银行卡。

办理页面：https://www.jpsimshop.com/view/item/000000000109?category_page_id=ct30

价格：最低6060yen/一年≈303rmb 即26块钱一个月

分类：

每月3GB流量
每月7GB流量
每月30GB流量

因为我们只需要拿来接受验证码所以流量无所谓，直接使用最低的套餐即可。

到期延长使用时间：https://www.jpsimshop.com/view/item/000000000110

转运

本人一直在使用jpgoodbuy进行转运，该家公司以邮政线路为主，EMS线路有95折优惠。如果只是转运一张sim卡的话，本人更推荐使用凤凰线。

凤凰关税补贴线运费表
重量	运费（日元）	运费（约人民币）	比青鸟A线省（元）		重量	运费（日元）	运费（约人民币）	比青鸟A线省（元）
0.3kg以内	650	34	69	35	1.5kg以内	2,400	127	146	19
0.5kg以内	900	48	69	21	1.6kg以内	2,550	135	193	58
0.6kg以内	1,050	56	106	50	1.7kg以内	2,700	143	193	50
0.7kg以内	1,200	64	106	42	1.8kg以内	2,850	151	193	42
0.8kg以内	1,350	72	106	34	1.9kg以内	3,000	159	193	34
0.9kg以内	1,500	80	106	26	2kg以内	3,150	167	193	26
1kg以内	1,650	87	106	19	2.1kg以内	3,300	175	241	66
1.1kg以内	1,800	95	146	51	2.2kg以内	3,450	183	241	58
1.2kg以内	1,950	103	146	43	2.3kg以内	3,600	191	241	50
1.3kg以内	2,100	111	146	35	2.4kg以内	3,750	199	241	42
1.4kg以内	2,250	119	146	27	2.5kg以内	3,900	207	241	34

*运费汇率按0.053左右计算所得，人民币价格仅供参考。实际计费汇率每日更新，请以JPGOODBUY官网显示为准。

这是我的aff链接，如果感兴趣的话可以通过此🔗链接注册

在购物网站上填入转运公司提供的地址，等待货物到达转运公司后即可操作发回国内。

使用

设备插入sim卡后即可使用，手机号码在大卡上有贴纸。极少数设备可能需要手动设置APN（接入点）

由于这张卡是数据卡，我们可以比较方便地购买到，但也使得这张卡原生无法接打电话，只可以接收短信。

我们可以使用网络电话曲线救国，解决这一问题。

笔者使用的是talk360，这一软件在电话接通前是不扣费的，而票务平台一般也只振铃验证，不需要实际接通，所以这个软件理论上是可以一直白嫖使用的。

笔者在注册时曾遇到检测网络环境的问题，可以直接使用sim卡的漫游流量通过网络检测。

对于票务平台的具体注册流程，笔者当时并未截图，网上亦有许多教程，在此不多做赘述，若有问题，可在评论区留言。

2024年9月23日

重生之我在厂工当牛马

本篇亦真亦假，有真有假，全是牢骚，毫无营养，建议勿看

回往已经度过的二十年，可以说是碌碌无为的二十年。在这个22岁生日即将到来的时刻，或许是时候静下心来，回顾这些杂乱的过往，从中找到人生前行的方向。

幼小

幼小时段绝对是对人生价值观和性格养成最重要的阶段，至少对我而言是如此。我相信我曾经那可恨的谎话连篇和说瞎话不眨眼甚至能把自己骗过去的缺点亦是在这一阶段养成的。感谢三年级的某位抖s组长，使我在完不成的任务面前选择了逃避，选择了谎言与欺骗。

我家里也许算是购入计算机比较早的家庭。2006年，我的家里添置了一台新蓝台式机，主机已找不见，LCD屏幕倒是有好好地陪我们搬了三次家，现在仍放在书房的角落吃灰。记得当时最喜欢的事情是看爸爸玩跑跑卡丁车，我自己是从来不玩的，每次都缠着爸爸让他玩给我看。第二喜欢的事情就是乱下软件乱折腾，搞得我家三天两头就得让我大爷来重装系统。电脑桌的抽屉里放着好几张用记号笔写着“xp”的盗版系统盘。每次重装系统我都守在一旁，看着ghost的进度条从0%慢慢增长到100%，~~甚至放下当时我最最最喜欢的和表哥用一堆玩具玩过家家。~~我相信我对计算机的兴趣就是从这里开始的。

后来家里又添置了一台上网本，性能极其羸弱。我曾半夜躲被窝里在记事本里瞎打一通，然后改后缀为exe，希望是能搞出一个能运行的程序，但可想而知，每次都是

当时当然是xp系统，现在顺手截个win11的意思意思得了（怎么还是win10风格的啦喂(#`O′)

现在回想起来着实可笑，但也纳闷为什么当时没有去尝试正经地学习一下，估计当时也没有去搜索引擎找教程的意识吧。

我曾上过两个幼儿园，第一个是家附近有一个叫儿童乐园的地方，进门后右手边便有一个小铁门，铁门里面便是我的第一个幼儿园了。关于这个幼儿园，我并没有多少印象，只记得我曾同其他人一起用屋顶滴下的不知什么水洗头，结果到上课时被老师拉到外面晒太阳，让我们晒干再进来。我当时十分不解：我洗头不应该是件好事吗，怎么还让我罚站？现在想起来也许是怕我们感冒，但为啥不给我们条毛巾擦擦呢。还有一次，我同另外一个小朋友用的相同的书包，随便拿了一个便没有拿到我的。

后来听爸爸讲，送我去幼儿园的第一天，我扒着幼儿园的铁门嚎啕大哭，爷爷狠心回家后，也不住地抹眼泪。

第二个幼儿园是机关幼儿园，在这里遇到了宝宝和茜茜两个好朋友。我记得当时有给她们用蜡笔画过金牌银牌，说她们是我最好的朋友。在这里，我见识到了成人的险恶：

一天下午，我的书包拉链坏了，我哭着去找老师，老师糊弄我说给我个小礼物，我便不哭了。直到现在我也没等着那份礼物。

我的方向感绝对是有够强的，我曾不小心跟比我大一级的班走到了另一个区域，然后在老师着急忙慌找我的时候我自己回到了教室。

我本来是应该晚一年入学的，但那一年突然放宽，我便上了小学。自此开始，我便常常是班级里年龄最小的，直到现在研究生，我也是出生最晚的。

小学一年级，我和茜茜一班，宝宝在另一个班级。

三年级，我的噩梦，正如开头所讲，班主任赋予小组长给组员布置作业的权力。我的组长是个纯纯的抖s，每周布置一大堆作业，自此之后，我逐渐开始不写作业，也因此被叫了家长。不知道当时为什么这么🐢，一点去和老师和家长沟通的意识都没有，骂了我就受着，如果能再来，我一定要把组长抽得像陀螺一样转。

大约是四五年级，班级里掀起了一阵写小说的风潮，我本人亦有幸用稚嫩的文笔换取到了数十根笔芯和泡腾片。当时学校停止征订我本人和好友都十分喜欢的《齐鲁少年》了，于是我就自己从其官网上偷漫画，自己找新闻、用word排版，让我爸妈打印，再卖给同学看。十分可惜，这些“非法出版物”一篇也没有留下来。当时植物大战僵尸2刚发布，我也有以其为背景画漫画，现在看来，我的功力是一点也没保留下来（详见后文插图）。

童年时期，在有爱的家庭里平平稳稳地长大，虽然是独生子女且大院里也没有同龄人，但是有常住我家的表哥陪我玩，我感觉我的童年是十分幸福的。最大的遗憾是没有学一门乐器，我的父母是非常尊重我的，在我当时懒癌发作表示不想学之后，他们也就没让我去学。虽说“种树最好的时间是20年前，其次是现在”，我深深表示赞同，然后懒癌发作至今还没开始。

初中

初中亦是我人生中非常重要的阶段。在这里，我遇到了三位良师，一位应该算是我的“狐朋狗友”，以及我的初恋也是目前唯一的暧昧对象。~~话说初中以后我的桃色时间怎么全没了？是不是幼儿园到小学玩伴几乎全是女生给提前预支了？~~

初一，数学老师兼班主任田老师。在他的教学下我的数学不能说是很好，但绝对是除了小一年级的98分之外最高光时刻。

初二，英语姚老师。她应该是刚刚毕业的大学生，~~现在去教小学语文了~~。我们之间有很多共同话题，也拜于此，我开始对英语有兴趣。对英语的印象也不在再是那个天天砸桌子的小学英语老师。

初三，英语李老师。和姚老师不同，他是一位有丰富教学经验的老教师，时光冲淡了我的记忆，唯一有印象的便是他十分有教学方法，使我的英语成绩突飞猛进。

我初中三年可以说是和我那位“狐朋狗友”“相碍相杀”，我本身是对懵懂的情愫持反对意见的，因为从小到大被灌输的都是早恋哒咩的思想。他（Y）当时有喜欢另一个女生，我好奇去问Y喜欢谁，他害羞说是另外一个女生（L），还让我去找和L住一个小区的和我玩得好的男生（Z）问L的QQ号。我本着为好兄弟两肋插刀的想法就在放学后找Z问了，结果Z说不知道，然后L听到了，L当场写了个纸条把QQ号给我了。第二天我傻乎乎地把纸条给Y了，之后不知怎么滴L和我就……

L还天天编鬼故事吓我，说啥教学楼半夜变平房、教室前面有吊死鬼。还真给我唬住了两年。我同桌天天搞他那什么“心光”，书和本子上必写一个“心光”，张嘴闭嘴也是一个又一个“心光”。我向他讨教也没问出个所以然来，只知道大概是从佛教不知道哪里搞出来的两个字，我都怀疑他是不是进了什么邪教。

16年的寒假，学校搬校区的那个寒假，入坑了二刺螈。我的入坑轨迹大抵是这样：IT之家的IT黑板报有在b站发，我当时在视频里看到b站还以为是啥不正经的网站；下载后发现央视的熊猫频道也有在b站投稿，把《熊了个猫》看完之后翻到了动画Tab页，当时首页banner是推荐的《恋爱研究所》，看完之后就收不住了，超炮魔禁挨个补。

之后的暑假，开始搞日轻来看，发现当时天角刚被制裁，又入了台版书的大坑。搞了《このすば》、《Re:0》、《文学少女》、《春物》等来看。某次午休看《このすば》还被班主任逮到，还好没翻到插图，只是责怪我怎么还看小孩子看的书。~~之后甚至还有带本子入校~~

初三那年，我有带手机入校，在借给另外一个同学打电话时被班主任抓到了。这时Y提议说他先想办法要回来，让我说这手机是Y的。我俩去找班主任后他不同意，班主任也一直以为这手机是Y的，放假那天下午和班主任澄清了，第二天我也去Y家里和他以及他父母表达了歉意。

高中

高中时，我和初恋因为进入了不同的学校，那段原本模糊不清的关系也随之结束。最大的遗憾，莫过于没能亲耳听她为我弹奏的那首生日快乐歌。

在高中，我遇到了两位非常优秀的历史老师——张老师和黄老师。他们都非常负责任，教学方式富有深度，启发了我对历史的兴趣。

语文张老师，她的乐观开朗感染着每一个学生。她总是充满活力，仿佛永远停留在青春年华，我从未敢揣测她的实际年龄，她的心态总像是一个快乐的小女生。她常常给我们播放《唐之韵》《宋之韵》，让我们感受诗人的人生及诗词的美。她还躲着年纪主任给我们放电影，甚至有一次放《罗密欧与朱丽叶》（1996年版）时，屏幕上男女主正抱着啃时，年级主任进来了，顿时尴尬住了。

入坑gal了，半夜拿sony xz1用krkr玩千恋万花，这辈子有了。

还入坑了postcrossing，与国外互寄了21张明信片，还有A岛上的一位大触给我手绘了丛雨的明信片，可惜的是完美的画作被邮戳稍稍破坏了下。集到了上海豫园的四枚风景戳和建国70周年纪念戳。

还尝试搞了一段时间的信息奥林匹克竞赛，没啥成就，半途而废。~~放弃的契机是教练让我们提前一天返校，我和爸妈吃烤鱼没有去，之后感觉没脸见老师就索性退出了。后来才知道大家都没有提前返校。~~

第一年新高考改革，又碰上疫情，在家里上网课摸了1个多月鱼，正当我感觉高考要完蛋之后，高考延迟来了。开学后过上了这辈子第一次住宿生活，每天晚上我们宿舍四个夜谈鉴证，还有个舍友常常yy张老师，我们谈天说地，一起喝一碗泡面，尽管有些离谱，但也让压抑的封闭高中生活增添了许多乐趣。算是难得的经历了。

写到这的时候，愈发感觉写得流水账，和日轻厕纸一样。不同的是厕纸还有送插画，我送的只是张涂鸦。

大学

我的化学成绩一塌糊涂，在得知我进入材料科学与工程专业继续学习时，我的化学老师给予我这样的评价：

还学化学呢？

大一转专业未果，大概是因为体育挂科的缘故，遂选择学习英语第二学位。当时的目标还是北理的软工（北理对英语要求貌似比较高），到了大四我也知道我瓶子里到底有多少水，最终也选择了厂工读研。

2022年6月，染上舞萌了，也加上了学校的音游群，突然多了好多兴趣相投的小伙伴。

与音游群的小伙伴们一块出勤，组织了两次百团大战，聊天吹水，给我一个社恐的大学生活增添了许多乐趣。

大学四年，学术上平平无奇，最终安全毕业。

感谢雷，他对我成功进入广工是有莫大帮助的。在申请夏令营时，是他在学校横跨大半个校园帮我找辅导员盖章，打印资料并邮寄给我。

感谢我的舍友们，我的占地面积绝对是最大的，过道被我占了一半，床底下全是我的东西，手台打起来噪音是如雷的。即便如此，我们还是相伴了四年，相信未来也会一直保持联系

感谢我的挚友们，在互帮互助中共同成长。与你们的相遇是我一生中最宝贵的财富

感谢我的恩师们。感谢梁老师从选题到答辩指导我的二学位论文，她总是一次又一次地指出我的低级错误，我最后却没当面正式道谢。也感谢这四年给我上过每一堂课的老师

In the future

这是陪伴我成长的两个家人，黑黑由于各种各样的原因早已离去，豆豆也于今年暑假回到了母星，结束了它那14年的狗生。豆豆于家里大宅建成之时来到我家，又在我家寻求变卖房产、我即将离开我长大的这块齐鲁大地时猝然离世。我总感觉这其中冥冥之中有些许联系。

在厂工，找到了一位好导师，他不关心浮于表面的繁文缛节，也不会强制要求工作时间，是一位真心实意为学生着想、醉心学术的好老师。

现在我仍面临着人生的重要抉择——以就业为目标还是以继续读博深造为目标。

总结

回首前二十年，我有以下几条要告诫自己的：

1.种树最好的时间是20年前，其次是现在

2.人生就是不断的相遇与分别，要好好珍惜身边的每一个人

3.世界就是一个巨大的草台班子，很多事情要勇于尝试

4.万事开头难，一件事只要坚持下去就是成功

5.外面的世界很精彩，要走出自己的舒适圈

6.香烟与酗酒是健康的大敌，死也不能碰

単純な日々がキラキラ

平凡的日子正閃閃發光

今は退屈なんて要らないね

此刻不需要說什麼無聊

いつでも思っていること

我總是心想

出会えたことが本当に嬉しいんだ

真的很高興能夠遇見你們

今日だってなんかドキドキしてる

就連今天也充滿悸動

大切なもの溢れてく

重要的事物逐漸滿溢

これからもずっと変わらず

今後也想就這樣繼續擁抱

騒がしい毎日を

喧鬧的每一天

大好きな君を

最喜歡的你們

出会えた奇跡を　抱きしめていたいんだ

以及這份相遇的奇蹟

2024年9月22日

博客

时序分析方法