耦合相位振子储备池计算的临界性

文献信息

标题 : Criticality in Reservoir Computer of Coupled Phase Oscillators
期刊 : Neurons and Cognition
作者 : Liang Wang, Huawei Fan .et.al
DOI : https://arxiv.org/abs/2108.06395v1
类型： 计算模拟
为什么读： 师兄给的

目的

设计了一个相位耦合振荡器（coupled phase oscillators）的人工神经网络，通过训练机器学习储备池（reservoir）计算技术来预测混沌，主要目的是观察临界态性质。

概念

reservoir computing (RC) : 也称 Echo state network ,
- reservoir 有很多节点，节点间连接是稀疏的（随机生成的矩阵，生成后保持不变），节点形成很多循环，所以也是一种 RNN，学习阶段会使用一种高效递归的架构使节点权重不断更新（真正需要训练的只有输出层，训练快 s）。
- RC 能忠实复现长期稳定混沌系统的本质，如吸引子和李雅普诺夫指数。
Lyapunov exponents : 李亚普诺夫指数，用于量化动力系统中无限接近的轨迹之间的分离率。
Lyapunov time : 是指一个动态系统出现混沌特性所需要的时间，李雅普诺夫时间表示系统可预测性的极限
Kuramoto model : 藏本模型，一种用来描述大量耦合振子的同步行为的数学模型。常见的版本中，每个振子都有一个固有的自然频率 $\omega_i$，并与所有其它振子以相同的强度耦合,任意两个振子之间的相互作用强度取决于它们相位差的正弦。。

方法

RC：

输入层： $H_{in} = \mathbb{R}^{N\times D_{in}}$
储备池层是由 N 个不同的相位振荡器组成，第 $i$ 个的动力学描述如下：$$ \dot{\theta}i(t) = (1-\alpha) \omega_i + \frac{\alpha}{N} \sum^{N}{j=1} a_{ij} sin[\theta_j(t)-\theta_i(t)] + \beta tanh \left[ b_i + \sum^{D_{in}}{j=1} h{ij}\mu_j(t) \right] $$
- $\theta_i(t) ,,, \dot{\theta}_i(t) ,,, \omega_i$ 表示第i个振荡器的即时相位、角频率和固有频率（（-1，1）随机），初始相位在 $[-\pi,\pi)$ 随机选择。
- 振荡器耦合关系是矩阵 $A$ 描述，元素从（0，1）中随机选择, $a_{ij} \in A$
- $\alpha$ 是调节储层节点相干度的广义参数
- $b \in \mathbb{R}^N$ 是节点对输入的 bias，（0，1）随机
- 在模拟中，该公式采用四阶 Runge-Kutta 方法求解，时间步长设置为 $\delta t = 5 \times 10^{-2}$
输出层：$H_{out} \in \mathbb{R}^{D{out}\times (N+D_{in}+1)}$ , 运算生成输出向量 $v(t) = H_{out} [b_{out};u(t);\Theta(t)]$
- $\Theta(t)$ 是储备池网络的状态向量
- 简单起见，bias 被统一设置为 1

训练的目标是找出一个合适的矩阵 $H_{out}$ 使输出向量 $v(t)$ 尽可能接近输入向量 $u(t+\Delta t)$ ,其中 $\Delta t$ 是数据采样间隔。 cost function 如下：

$$H_{out} = UV^T(VV^T + \lambda I)^{-1}$$

$I$ 是 identity matrix， $\lambda$ 是防止过拟合的参数
$U \in \mathbb{R}^{D_{out}\times L} $ , 第 k 列是 $u[(k+1)\Delta t]$
$V\in \mathbb{R}^{(D_{in} +N +1)\times L}$, 第 k 列是 $[b_{out};u(k\Delta T);\Theta(k\Delta t)]^{T}$

通过两个统计量刻画储层的集体行为：时间同步簇的阶参数和大小分布

The order parameter ： $r = \left<\left|\sum^{N}_{j=1} \frac{e^{i\theta_j}}{N}\right|\right>$
- $|\cdot|$ 、$\left<\cdot\right>$ 分别表示模块和时间平均函数
- $ r \in [0,1]$ , 从完全不同步到同步状态
a cluster of size $s$ is denoted as $p_s$

结果

当计算系统得到适当训练（准确预测几次 Lyapunov times 的系统演化并忠实复制动力学），储备池中的节点被同步成簇，簇的大小遵循幂律分布的临界特征。

没有输入的情况下，储层网络的集体行为，N = 500
a : 不同 $\alpha$ 参数对应 $r$ 的变化，灰色区域 $\alpha \in (0.65,0.71)$ 中快速变化
b : 上是相关矩阵，下是同步模式， $\alpha = 0.53$ ，同步簇的内容和大小都随时间变化
c : 具有不同耦合强度的同步簇的尺寸分布, 第三幅大致遵循幂律分布，拟合指数 $γ≈-1.3 $

$\alpha = 0.53$ 时 , properly trained $RC_g : (\beta,\lambda) = (0.477,1\times 10^{-7})$ ; poorly trained $RC_b : (\beta,\lambda) = (0.498,2\times 10^{-5})$
a : $RC_g$ 预测的 Lorenz （洛伦兹）混沌振荡器的状态演变, 预测范围约为10次 Lyapunov,最大Lyapunov指数约为1.03
b : $RC_g$ 预测的变量 $z$
c : 预测阶段同步簇的大小分布。灰色: 没有输入的原始网络的结果。红色: $RC_g$ 的测试结果蓝色同理，不过是 $RC_b$ 的

具有不同参数 $\alpha,\beta,\lambda$ 充分训练后的簇大小分布，所有分布遵循相同的幂律标度 $p_s \propto s^{\gamma} , \gamma \approx -1.7$

储层模型目标动力学和RC参数对临界性的影响（新的主要看 b1-d）
a : Kuramoto model 的结果
b1、c1 ： 对于混沌的 Rössler oscillator 的预测结果，预测时域为 3 Lyapunov times

优点/创新点

研究发现，尽管原始储层处于同步状态，但一旦机器得到适当的训练，储层中的振子就会以簇的形式同步，簇的大小遵循一个独特的幂律分布。分布指数与系统参数无关，但受目标系统动力学类型的影响。

缺点/不足

在文中提到了下面这个问题，但文章结果并没有很好的解答

如果在人工神经网络中可以观察到临界性，那它在机器学习中起什么作用？

研究采用的储层数量是500个，实际神经元数量远远超过这个数值

可能的结合点

储层计算的方法，即是动力学系统的研究材料，同时也是一种特别的循环神经网络
了解了一些研究临界态的相关方法和计算指标

其他参考

储备池计算（Reservoir Computing)
The “echo state” approach to analysing and training recurrent neural networks
Realtime computing without stable states: a new framework for neural computation based on perturbations
李亚普诺夫指数|维基百科
Lyapunov Exponent of Time Series
Chapter 7 Lyapunov Exponents
Lyapunov time | Wikipedia
藏本模型|维基百科
Rössler attractor | Wikipedia