基本框架:反绎学习
基于反绎学习和基因知识库的基因表达预测的基本框架总括
近年来,神经-符号人工智能(Neural-Symbolic AI)作为一种结合机器学习和知识推理的新人工智能范式,逐渐成为人工智能学科重点关注的研究领域。由南京大学周志华教授团队提出的反绎学习 (Abductive Learning,ABL)是一种具有代表性的神经-符号学习方法[1],[2],通过逻辑反绎(Logical Abduction)实现机器学习模型中对领域知识的利用,已在多种现实任务中展示出较好的性能。
1. 神经-符号人工智能
神经-符号人工智能是一类整合机器学习(神经人工智能)和知识推理(符号人工智能)的方法,旨在结合两者的长处并弥补其不足。
机器学习模仿人类智能中的直觉和学习预测能力。其通过概率和统计方法,以概率分布建模数据集,并基于假设的分布对未知样本进行预测。同时,知识推理通过基于数理逻辑的严格推断,准确地反映某一系统的,由抽象的领域知识导出的代数结构,具有较好的可解释性。
通过结合神经和符号系统,神经-符号人工智能可能产生更强大、更精准的模型。例如,在生命科学领域中,基于概率的学习可以由历史数据发现特定模式,并依此对可能的生物机制提出假设或解释;而逻辑推理可以保证其假设严格遵守高层次的生物学原理。
2. 反绎学习
反绎学习是一种前沿的神经-符号范式,通过逻辑反绎,在机器学习系统的训练过程中利用形式化为一阶逻辑(First-Order Logic, FOL)规则的领域知识,从而减轻机器学习模型对数据的依赖,增强系统整体的可靠性与可解释性。
反绎是逻推理一种形式,其推断方式为基于背景知识(Background Knowledge),对给定观察(Observation),寻找该观察最有可能的背后机制或解释。
反绎学习由学习和推理两部分组成。在学习阶段,在有标签(Labeled)数据集上训练一个学习模型,称为基学习器(Base Learner),并预测其在无标记数据样本(Unlabeled Data)上的结果,称之为伪标签(Pseudo-Labels);在推理阶段,推理器基于背景知识,对伪标签进行修正,以保证其和背景知识的逻辑一致性(Consistency),并使用修正的标签重新训练基学习器。上述过程将持续迭代运行,直至模型收敛。
Last updated