Learning to be Giant.

Center-Surround Mechanism for Edge Detection

|

在研究计算视觉模型的时候,Center-Surround机制是不得不提的,基本上是所有理论的前提。感性理解,Center-Surround机制就是通过对于receptive field当中不同位置对光的不同反应帮助生物视觉系统识别边缘信息。很早之前在做视觉注意(Visual Attention)的时候经常遇到Center-Surround,但是从来没有认真弄懂,只是默认它就等同于LoG(Laplacian of Gaussian)。如今又接触,终于了解清楚,于是记录下来。

Receptive Field

Retina Anatomy

上面这幅图(原图来自:Webvision)是我们所熟知的视网膜的大致解剖结构,在这里我们主要提一下photoreceptors、bipolar cells和ganglion cells。photoreceptors用来感知光,并将这一信号传给bipolar cell,并由bipolar cell传给ganglion cell,ganglion cell的轴突就是我们熟知的视神经,通过它将信号传递给大脑。

每个ganglion cell通过bipolar cell连接许多的photo-receptor,也就是说,ganglion cell将会接收到由这些photoreceptor传递来的信号,所以这些photo-receptor就叫做这个ganglion cell的receptive field。这样我们就知道,其实所谓的Receptive Field,就是一大堆能够感知光的photoreceptors。

On-Center Off-Surround vs. Off-Center On-Surround

Center Surround

上图(原图来自:hmc.edu)展示了连接在一个bipolar cell上面的photoreceptors被分为center和surround两个区域,构成一个类似圆环的结构。所以我们可以认为,reception field其实就是这种同心圆的构造。Receptive Field又被分成两种,一种叫做On-Center Off-Suround,另一种叫做Off-Center On-Suround,这两种field对光的反应完全不同。

Center Surround

上图(原图来自:hmc.edu)中展示的是Off-Center On-Surround。图中第二行是对应的ganglion cell向外输出信号的强度(神经通过信号频率来代表强度,频率越高强度越强)。我们发现,当中间部分的receptive field不接受光照,仅有surround部分接受光照的时候,信号强度最强。相应的,当surround不接受光照仅center接受光照的时候信号最弱。当两部分同时接受光照的时候信号强度略强于仅center部分接受光照;当两部分同时不接受光照时信号强度也略强于仅center部分接受光照。这其中的原因在于,在center-surround机制当中,在Off-Center的field里,center部分接受光照非但不会增强向外输送的信号,反而会抑制。这也就解释了为什么当两部分同时接受光照的时候的信号强度反而不如只有surround部分接受光照的信号强度强了,因为surround部分向外输出的信号强度还是那么强,可是center部分却抑制了向外输出的信号强度。

同样的道理也适用于On-Center Off-Surround的field。只要将上面描述的过程反过来:当光仅照射在center部分,向外输出的信号最强。

综上,我们知道,当中心和周围接受光照有差异的时候,ganglion cell会输出最强的信号。

Edge Detection

我们很熟悉LoG。我们现在考虑在一维情况下的边缘检测(检测一条暗的边缘),通过LoG我们可以得到下图(原图来自:Vision (Marr 1982))当中左上角这幅图所示的结果。

Edge Detection

Edge Detection

我们想象一下一个On-Center Off-Surround的Receptive Field经过边缘时候的场景(如上图)。在当前状态下,整个输出信号强度是baseline。首先,surround部分先进入无光的区域,这时候因为center部分还有光照,所以这个field整体的输出信号强度会逐渐增强,直到center部分到达了edge,信号强度达到顶峰。之后center部分进入到无光区域,这时候输出信号强度减弱,直到全部center部分都进入无光区域,这个时候强度减到最弱(因为被光照的surround部分会一直输出信号强度)。一直到整个field都进入了无光区域,信号强度又回到baseline。

前面我们说过,神经通过信号频率来代表强度,频率越高强度越强。因为如此,baseline频率应该是相对较低的一个频率(否则在大部分情况下都要维持这个频率很浪费资源)。由于baseline频率较低,那对于比baseline频率还低的信号(对于On-Center来说就是surround部分有光照而center没有)就没有办法表示了(如上图最左列第4行所示)。为了弥补这个缺陷,在每一个On-Center Off-Surround的field的位置,同时还有一个Off-Center On-Surround的field,两者位置是重叠的。由于我们知道这两这个对于光线的反应是相反的(上图最左列第2行),正好构成了LoG算子。上图中对于Thin Bar和Wide Bar的recording也可以进一步佐证这一点。

总结

Figure 2-7这幅图中的第三行和第五行是对生物进行实测得出的数据。我们看到,生物实际的反应和我们预测的(第二行和第四行)是一致的。由此我们可知,Center-Surround其实就是在视觉系统当中模拟的一个类似于LoG的filter,可以帮助生物对于边缘产生较为敏感的反应。所以这也结识了为什么在许多的Computational Vision和Neuroscience的实现中,Center-Surround被实现为了LoG或者DoG。至于为什么生物会形成一个类似于LoG算子的机制,我猜应该是LoG较为简单计算,而且检测zero-crossing是一个较为简单的检测方法吧。同时,通过center-surround机制,其实检测zero-crossing更为简单,因为如果有一侧的On-Center的信号强度特别强,另一侧Off-Center的强度特别强,那么很明显这个地方就是边缘(在Vision-Marr82的2.2节当中也有相应论述)。

如果这篇文章解释的还是不够清楚,这里有个视频我觉得解释的很好。我也是初学,理解难免会有偏差,如有错误,请不吝指出。

Comments