Back

耦合相位振子储备池计算的临界性

论文精读第十八周 | 期刊 Neurons and Cognition | 作者 Liang Wang, Huawei Fan .et.al | 2020年

文献信息

目的

设计了一个相位耦合振荡器(coupled phase oscillators)的人工神经网络,通过训练机器学习 储备池(reservoir)计算技术来预测混沌,主要目的是观察临界态性质。

概念

  • reservoir computing (RC) : 也称 Echo state network ,
    • reservoir 有很多节点,节点间连接是稀疏的(随机生成的矩阵,生成后保持不变),节点形成很多循环,所以也是一种 RNN,学习阶段会使用一种高效递归的架构使节点权重不断更新(真正需要训练的只有输出层,训练快 s)。
    • RC 能忠实复现长期稳定混沌系统的本质,如吸引子和李雅普诺夫指数。
  • Lyapunov exponents : 李亚普诺夫指数,用于量化动力系统中无限接近的轨迹之间的分离率。
  • Lyapunov time : 是指一个动态系统出现混沌特性所需要的时间,李雅普诺夫时间表示系统可预测性的极限
  • Kuramoto model : 藏本模型,一种用来描述大量耦合振子的同步行为的数学模型。常见的版本中,每个振子都有一个固有的自然频率 $\omega_i$,并与所有其它振子以相同的强度耦合,任意两个振子之间的相互作用强度取决于它们相位差的正弦。。

方法

RC:

  • 输入层 : $H_{in} = \mathbb{R}^{N\times D_{in}}$

  • 储备池层是由 N 个不同的相位振荡器组成,第 $i$ 个的动力学描述如下:$$ \dot{\theta}i(t) = (1-\alpha) \omega_i + \frac{\alpha}{N} \sum^{N}{j=1} a_{ij} sin[\theta_j(t)-\theta_i(t)] + \beta tanh \left[ b_i + \sum^{D_{in}}{j=1} h{ij}\mu_j(t) \right] $$

    • $\theta_i(t) ,,, \dot{\theta}_i(t) ,,, \omega_i$ 表示第i个振荡器的即时相位、角频率和固有频率((-1,1)随机),初始相位在 $[-\pi,\pi)$ 随机选择。
    • 振荡器耦合关系是矩阵 $A$ 描述,元素从 (0,1)中随机选择, $a_{ij} \in A$
    • $\alpha$ 是调节储层节点相干度的广义参数
    • $b \in \mathbb{R}^N$ 是节点对输入的 bias,(0,1)随机
    • 在模拟中,该公式采用四阶 Runge-Kutta 方法求解,时间步长设置为 $\delta t = 5 \times 10^{-2}$
  • 输出层 :$H_{out} \in \mathbb{R}^{D{out}\times (N+D_{in}+1)}$ , 运算生成输出向量 $v(t) = H_{out} [b_{out};u(t);\Theta(t)]$

    • $\Theta(t)$ 是储备池网络的状态向量
    • 简单起见,bias 被统一设置为 1

训练的目标是找出一个合适的矩阵 $H_{out}$ 使输出向量 $v(t)$ 尽可能接近输入向量 $u(t+\Delta t)$ ,其中 $\Delta t$ 是数据采样间隔。 cost function 如下:

$$H_{out} = UV^T(VV^T + \lambda I)^{-1}$$

  • $I$ 是 identity matrix, $\lambda$ 是防止过拟合的参数
  • $U \in \mathbb{R}^{D_{out}\times L} $ , 第 k 列是 $u[(k+1)\Delta t]$
  • $V\in \mathbb{R}^{(D_{in} +N +1)\times L}$, 第 k 列是 $[b_{out};u(k\Delta T);\Theta(k\Delta t)]^{T}$

通过两个统计量刻画储层的集体行为:时间同步簇的阶参数和大小分布

  • The order parameter : $r = \left<\left|\sum^{N}_{j=1} \frac{e^{i\theta_j}}{N}\right|\right>$
    • $|\cdot|$ 、$\left<\cdot\right>$ 分别表示模块和时间平均函数
    • $ r \in [0,1]$ , 从完全不同步到同步状态
  • a cluster of size $s$ is denoted as $p_s$

结果

当计算系统得到适当训练(准确预测几次 Lyapunov times 的系统演化并忠实复制动力学),储备池中的节点被同步成簇,簇的大小遵循幂律分布的临界特征。

没有输入的情况下,储层网络的集体行为,N = 500

  • a : 不同 $\alpha$ 参数对应 $r$ 的变化,灰色区域 $\alpha \in (0.65,0.71)$ 中快速变化
  • b : 上是相关矩阵,下是同步模式, $\alpha = 0.53$ ,同步簇的内容和大小都随时间变化
  • c : 具有不同耦合强度的同步簇的尺寸分布, 第三幅大致遵循幂律分布,拟合指数 $γ≈-1.3 $

$\alpha = 0.53$ 时 , properly trained $RC_g : (\beta,\lambda) = (0.477,1\times 10^{-7})$ ; poorly trained $RC_b : (\beta,\lambda) = (0.498,2\times 10^{-5})$

  • a : $RC_g$ 预测的 Lorenz (洛伦兹) 混沌振荡器的状态演变, 预测范围约为10次 Lyapunov,最大Lyapunov指数约为1.03
  • b : $RC_g$ 预测的变量 $z$
  • c : 预测阶段同步簇的大小分布。灰色: 没有输入的原始网络的结果。红色: $RC_g$ 的测试结果 蓝色同理,不过是 $RC_b$ 的

具有不同参数 $\alpha,\beta,\lambda$ 充分训练后的簇大小分布,所有分布遵循相同的幂律标度 $p_s \propto s^{\gamma} , \gamma \approx -1.7$

储层模型目标动力学和RC参数对临界性的影响 (新的主要看 b1-d)

  • a : Kuramoto model 的结果
  • b1、c1 : 对于混沌的 Rössler oscillator 的预测结果,预测时域为 3 Lyapunov times

优点/创新点

研究发现,尽管原始储层处于同步状态,但一旦机器得到适当的训练,储层中的振子就会以簇的形式同步,簇的大小遵循一个独特的幂律分布。分布指数与系统参数无关,但受目标系统动力学类型的影响。

缺点/不足

  • 在文中提到了下面这个问题,但文章结果并没有很好的解答

如果在人工神经网络中可以观察到临界性,那它在机器学习中起什么作用?

  • 研究采用的储层数量是500个,实际神经元数量远远超过这个数值

可能的结合点

  • 储层计算的方法,即是动力学系统的研究材料,同时也是一种特别的循环神经网络
  • 了解了一些研究临界态的相关方法和计算指标

其他参考

Licensed under CC BY-NC-SA 4.0
Built with Hugo
Theme designed by DeathSprout