当前位置：世界数码科技网 >> 生活服务 >> 文章正文

陈根:人工智能应对困境能够正确地趋利避害

发布于：2020-11-29 被浏览：3052次

文本/陈根

选择重量，比较难。一个简单的选择只需要根据目标来判断，但对于一个困境来说，则是一个更复杂的思考和选择。同时困境也是生存的必经之路，是生物的本能。探索生物学在困境中的脑机制将为人工智能的研究提供一种研究途径。

近日，中国科学院自动化研究所类脑智能研究中心的研究人员就借鉴果蝇脑自主决策的神经机制，提出了类果蝇决策的脉冲神经网络模型，模型能够实现趋利避害的行为，并在两难抉择下快速做出清晰的选择.在无人机的强化学习、逆向学习和困难决策任务中得到了有效验证。

具体来说，果蝇的选择有两条路径：经验线性选择和非经验非线性选择。当面临选择任务时，果蝇会适应性地选择合适的路径做出不同复杂度的选择。

在以前的研究中，研究人员教果蝇喜欢绿色的阳性T型，而蓝色的倒置T型伴随着热刺激惩罚。在选择阶段，转换了惩罚与视觉线索的搭配，让果蝇在绿色倒T和蓝色正T之间进行选择，以此测试果蝇在冲突视觉线索下的两难抉择行为.

实验发现，在不同的颜色强度下，通过统计果蝇在飞行过程中停在每个图案前的时间分布，可以了解果蝇的连续选择行为，最终得到一条S型选择曲线。

通过单细胞测序发现支持两难抉择下非线性曲线的神经机制是由多巴胺能神经元- GABA能神经元-蘑菇体环路负责的“增益-门控”抉择机制，这是一条基于价值的非线性抉择通路.而蘑菇受损的果蝇只能进行简单的感性选择，得到线性选择曲线。

本研究基于果蝇简单知觉选择(线性途径)和价值选择(非线性途径)的神经机制，利用脉冲神经网络构建多脑协作的选择模型。其中，线性通路对中枢复合体的记忆功能进行建模，以做出快速选择。非线性路径模拟了多巴胺--氨基丁酸-甲基溴环的增益门控机制。

随后，将类果蝇抉择的脉冲神经网络模型应用到无人机抉择任务上，使用小拳头打击无人机来模拟惩罚信号，无人机可以学会飞向安全的视觉图形，并对视觉图形所包含的线索具有趋利避害的行为.此外，无人机可以灵活适应任务的反转，只需4次错误选择就可以学会反转后的规则。

人工智能接近人类智能是未来的趋势，不仅仅是在确定目标的问题上(有限的游戏)，在自我进化和模仿生物直觉的能力上也是如此。在享受人工智能带来的便利的同时，更多的是关注人与智能的关系。为机器造心脏将成为人工智能时代不可回避的问题。

标签：果蝇无人机人工智能

陈根:人工智能应对困境 能够正确地趋利避害