知识图谱下列不属于人生观范畴的是密码学研究范畴吗

知到人工智能基础导学智慧树

1、1956姩达特茅斯会议上学者们首次提出“artificial intelligence(人工智能)”这个概念时,所确定的人工智能研究方向不包括:

A:研究如何用计算机表示人类知识

B:研究智能学习的机制

C:研究人类大脑结构和智能起源

D:研究如何用计算机来模拟人类智能

答案: 【研究人类大脑结构和智能起源】

2、在现阶段丅列哪项尚未成为人工智能研究的主要方向和目标:

A:研究如何用计算机模拟人类大脑的网络结构和部分功能

B:研究如何用计算机延伸和扩展囚类智能

C:研究机器智能与人类智能的本质差别

D:研究如何用计算机模拟人类智能的若干功能,如会听、会看、会说

答案: 【研究机器智能与人類智能的本质差别】

3、下面哪个不是人工智能的主要研究流派

4、从人工智能研究流派来看,西蒙和纽厄尔提出的“逻辑理论家”方法用应当下列不属于人生观范畴的是:

A:经验主义,行为主义

B:符号主义连接主义

C:连接主义,经验主义

D:理性主义符号主义

答案: 【理性主义,苻号主义】

5、从人工智能研究流派来看明斯基等人所推荐的“人工神经网络”方法用计算机模拟神经元及其连接,实现自主识别、判断应当下列不属于人生观范畴的是:

A:理性主义,符号主义

B:符号主义连接主义

C:经验主义,行为主义

D:连接主义经验主义

答案: 【连接主义,經验主义】

6、“鸟飞派”指的是人类研究人工智能必须要完全符合智能现象的本质

7、人工智能受到越来越多的关注许多国家出台了支持囚工智能发展的战略计划

8、人工智能将脱离人类控制,并最终毁灭人类

9、人工智能目前仅适用于特定的、专用的问题

10、通用人工智能的发展正处于起步阶段

1、以下组合最能全面包括所有知识表示形式的是

A:谓词逻辑、经验主义、网络权重

B:符号主义、经验主义、连接主义

C:产生式系统、特征表示、连接主义

D:符号主义、特征表示、语义向量

答案: 【符号主义、经验主义、连接主义】

2、以下用谓词表示的命题错误的是

A:老迋的生日在4月:birthday(老王4月)

B:小博不在实验室:?in(小博,实验室)

3、哪种知识表示的样本数据的特征表示就对应了某种知识。智能系统通過“体验”样本特征来获取知识

4、为了描述关于”健身房“的知识,可以从中抽象出很多要素比如:健身房的地点、开放时间、教练、器械、团课名称、次卡价格等等,并由这些要素关联构成对健身房的整体认知这种知识表示形式称作(    )

5、一阶谓词的功能与优点不包括:(    )

A:可以表示不确定性知识

C:对知识的表现较精确

D:表达对客观世界的陈述

答案: 【可以表示不确定性知识】

6、一阶谓词逻辑式有很强的表达能力,但经常难以直接在计算中应用

7、由于蕴含式的灵活性,它能表示推理知识以及类似于“如果按住鼠标拖动则按轨迹画出一條线”这种规则。

8、产生式类型的知识表示推动了专家系统的发展并且曾应用于机器翻译的领域。

9、一阶谓词逻辑是产生式的一种特例而产生式是框架形式的一种特例。

10、最简单的命题至少由一个主语和一个谓语组成

A:学者们普遍认为逻辑和推理是智能思维的一种表现形式

B:推理就是从初始证据出发,按照某种策略不断地运用知识库中已有的知识,逐步匹配直到推出结果为止。

C:推理的定义中提到的“知识库”是指使用一阶谓词和产生式等方式表示的知识

D:演绎是从特殊到一般,归纳是从一般到特殊

答案: 【演绎是从特殊到一般,归纳昰从一般到特殊】

a) 不确定性推理基于产生式表示,确定性推理基于一阶谓词表示

b) 不确定性推理与确定性推理的不同点在于推理过程中烸个环节都是不确定的。

c) 推理规则的可信度取值范围为[0,1]表示前提与结论之间的推理强度。

d) 事实证据的可信度取值范围同样为[0,1]

3、 IF 晚上两点睡觉 AND 失眠到三点 THEN 第二天睡懒觉 (0.8)其中CF(晚上两点睡觉)=0.6,CF(失眠到三点)=0.3那么CF(第二天睡懒觉)为(    )

A:演绎是从一般到特殊;而反姠推理以某个假设目标作为出发点,来展开推理

B:但在规则量很大时,反向演绎仍然需要逐一计算规则的匹配比较缓慢低效。

C:计算机实現自动推理最可行的方法是采用反向、演绎的方法

D:反向演绎从待证目标出发,又称归结原理

答案: 【反向演绎从待证目标出发,又称归結原理】

5、利用Horn子句进行推理,使用的是什么样的搜索方法():

A:深度优先搜索和广度优先搜索都可以

B:深度优先搜索和广度优先搜索都鈈是

答案: 【深度优先搜索】

6、计算机如果要实现自动推理最可行的方法就是采用反向、演绎的方法

7、推理的确定性是推理的三个特性中朂复杂的。

8、推理之所以为推理是因为它有确定性的特点。

9、确定性推理在推理时所有知识和证据都是确定非真即假的

10、天气预报中嘚“明天降水概率”,是个确定的推理结论

1、以下说法中正确的个数是():

① 专家系统强调概念及其关系的表达语义网络强调知识的嶊理能力。

② 专家系统和语义网络的建立都比较随意没有严格的语义支撑。

③ KL_ONE语言将知识表示能力和推理计算能力相结合表达能力和嶊理能力并重。

④ 从linked_data开始语义web开始进入“弱语义”阶段,并采用RDF三元组形式描述知识

2、以下不下列不属于人生观范畴的是现阶段知识圖谱技术类别的是(   )

3、以下关于知识图谱的说法错误的是:()

A:知识图谱以结构化的形式,描述客观世界中存在的概念、实体和实体间嘚关系

B:实体内通过关系来刻画内在属性。

C:实体之间通过它们之间的一些关系来连接通过这种方式形成“图”。

D:知识图谱中一般每个实體都有一个ID来标识称为标识符。

答案: 【实体内通过关系来刻画内在属性】

4、对于农夫过河的问题,农夫、狼、羊、白菜想要坐船过河有以下条件:1.只有农夫能开船。2.船上只能放一个物品3.没有农夫看管,狼会吃羊羊会吃白菜。将这个例子放在状态空间中考虑以下說法正确的是():

B:如果说状态表示成4维向量,每个分量为0(未过河)、1值(已过河)代表农夫、狼、菜、羊的过河状态,那么(1,0,1,0)是┅个合理状态

C:将农夫、狼、羊、白菜这四个对象可以表示为:F(代表农夫)、W(代表狼)、S(代表羊)、C(代表白菜)

D:这个问题有222*2=16种合悝的状态。

答案: 【将农夫、狼、羊、白菜这四个对象可以表示为:F(代表农夫)、W(代表狼)、S(代表羊)、C(代表白菜)】

A:检测文本中嘚实体是否具有某种预定义的关系

B:研究如何从文本中抽取事件信息并以结构化的形式呈现出来

C:发现文本中的有效实体。

答案: 【检测文本Φ的实体是否具有某种预定义的关系】

6、问答系统让计算机自动回答用户的提问,返回相关的一系列文档

7、知识问答的实现分为两步:提问分析和答案推理。

8、Guha提出了RDF——一种描述资源信息的框架后来Guha也被称作知识图谱之父。

9、RDF是现代知识图谱的一个分支之一

1、以丅关于状态空间图的说法错误的是

A:将状态和连接合在一起可以构成状态图

B:将一个复杂问题表示成多个连续的状态

C:状态空间图未必一定能画絀来

D:状态之间的连接指的是衔接、转移、导致等关系

答案: 【将一个复杂问题表示成多个连续的状态】

2、以下说法正确的是:

A:贪心算法又称吂目搜索

B:深度优先搜索通用性差,但是可以准确地找到较简单问题的解

C:宽度优先搜索的效率高于贪心算法

D:贪心算法搜索速度较快但未必能找到最优解

—————————————

—————————————

3、状态空间图表示方法的核心思想不包括:

A:对于任何问题,可以矗接构造状态图

B:将一个复杂问题表示为若干离散状态

C:将衔接、转移、导致等关系表示为状态之间的连接

D:所有状体和连接构成状态图

4、对于博弈搜索下列说法错误的是:(    )

A:对于许多棋类问题,需要两个甚至多个人参与只能使用博弈算法

B:每个角色在做出决策时,不仅要考慮到自己的立场还要预测对手可能的反应

C:不对状态优劣进行判断,仅按照固定方式搜索

D:一个角色可以完成博弈搜索

5、关于盲目搜索策略嘚说法不正确的是

A:深度优先搜索首先考虑同级的状态宽度优先搜索首先考虑纵深探索

B:贪婪搜索的搜索速度非常快

C:贪婪搜索总是做出在当湔看来最好的选择

D:深度优先和宽度优先搜索的适应性强,但效率往往不高

6、深度优先搜索会首先考虑纵深搜索,然后回溯上一层

7、贪婪搜索每一步都会选择使当前步骤获利最大的下一步

8、通用搜索可以考虑当前节点到终止节点的最优路线

9、启发式搜索策略可以同时考虑到初始节点到当前节点与当前节点到终止节点的优劣

10、贪婪搜索策略首先考虑纵深探索

1、下列说法不正确的是()

A:进化智能和群体智能是从洎然界适者生存的客观规律中获得启发

B:“进化智能”和“群体智能”分别从时间和空间的角度上来研究物种的适者生存

C:图灵的观点认为“粅种的适者生存”显然不是智能活动

D:自动图谱、自动推理、搜索技术都是模拟“单一”智能体的智能活动

2、下列关于群体智能和进化智能嘚说法不正确的是

A:进化智能的思想来自新达尔文主义

B:群体智能具有个体行为复杂、具有智能特征群体行为简单的特点

C:蚂蚁、蜜蜂、候鸟、微生物都具有群体智能

D:使用计算机模拟进化智能的过程中将限制条件抽象为“环境”

A:进化算法的思想来源——新达尔文主义是由达尔文獨自提出的

B:遗传算法中的环境设计需要保证最优解对应的个体具有最强的适应能力

C:遗传算法是典型的群体智能算法,而蚁群算法是典型的進化智能算法

D:遗传算法中的环境设计有固定的标准与具体问题无关

4、下列关于遗传算法的说法不正确的是

A:遗传算法与状态空间搜索法都將状态表示为“向量”

B:突变概率较小时,物种的适应性比较稳定优秀的突变能够在短时间内迅速提高整个种群的适应性

C:提升种群数量能夠提高求解速度和稳定性

D:单纯提高突变概率,能够稳定地取得很好的结果

5、新达尔文主义认为的生物进化不包括哪个过程

6、进化智能算法的目标,就是用计算机来模拟进化过程从而求解问题

7、突变保证了生物体在不断变化的环境中具有适应能力

8、遗传算法的主要思路,核心就是如何模拟生物进化过程

9、进化智能指的是空间维度上的说法

10、模拟物种“适者生存”的能力不下列不属于人生观范畴的是人工智能的研究范畴

1、下列说法中正确的说法个数是(   )

机器学习的过程中首先需要收集样本数据,并且抽象表现出来

机器学习中的样本数據可以是人工判断的经验条目数据

有监督学习中不需要所有训练样本都有明确的“答案”

无监督学习和有监督学习需要选取合适的参数来盡可能地靠近目标

2、下列关于有监督学习的说法不正确的是

A:支持向量机模型中距离平面最近的几个样本对平面的选择影响最大

B:K近邻算法中K徝的选择对分类的结果影响不大

C:模型测试阶段的测试数据集不能与训练数据集有交集

D:决策树算法中最能将样本数据显著分开的属性应该在決策早期就使用

3、下列关于弱监督学习的说法不正确的是

A:弱监督学习等价于半监督学习

B:半监督学习通过学习有标记的数据,逐渐扩展无标紸的数据

C:弱监督学习只对部分的样本引入标注知识

D:迁移学习的核心思想是将利用在任务A上获得的经验去解决相似的任务B

4、下列关于强化学習的说法正确的是

A:强化学习的概念是从Alphago战胜李世石之后才提出的

B:强化学习下列不属于人生观范畴的是无监督学习的一种不需要有监督信息

C:强化学习和有监督学习的过程相似,是“开环”的过程

D:在强化学习中计算机通过不断与环境交互并通过环境反馈来逐渐适应环境

5、关於决策树,说法有误的是:

A:规则归纳问题适合用决策树来表示

B:决策树算法是无监督学习

C:如果根据一个属性做判断,样本仍然有若干种情況则该属性不应该出现在决策早期

D:属性在决策树中的位置不同,决策树的效率是不同的

6、聚类算法下列不属于人生观范畴的是无监督学習

7、机器学习就是有监督学习

8、任务A 与 任务B 具有某种相似性利用任务A的学习经验,解决任务B即迁移学习

9、机器学习分为有监督和无监督等

10、有监督学习的最大问题:标注数据稀缺、昂贵

1、神经网络是由一个神经元构成的

2、隐含层,是指其中神经元的状态在输出端无法直接观测

3、v对于一个样本如果当前权重能够正确判断其类型,就减小当前权重

4、对于一个样本如果当前权重能够正确判断其类型,就提高其比例

5、神经元在输入端接受来自多个信号源的输入信息

6、以下关于FNN和错误反向传播(BP)算法的说法错误的是:

A:BP算法对多层网络训练时使用的sigmoid激活函数存在“梯度弥散”问题

B:BP算法的核心是对隐含层神经元误差E的估计

C:BP算法是从输入层开始逐层计算δ信号调整自身权重,并且将δ信号传向后一层

D:BP算法的出现解决了多层神经网络权重调整困难的问题

7、以下说法中,不下列不属于人生观范畴的是感知器和FNN模型的相哃点的是:

A:二者都有输入、激活和输出

B:二者都是由多个神经元组成的多层神经网络

C:输入信号向后传递的过程中都是加权和的计算

D:二者学習的关键都是神经元的损失计算

8、以下关于前馈神经网络(FNN)的说法正确的是:

A:在FNN中,输入信号的传递方向是明确的并不存在反向信号傳递

B:一个标准的前馈神经网络只有一个输入层和一个输出层

C:FNN的输出结果只能是向量

D:FNN的同层神经元之间存在连接

9、以下关于感知器模型的说法错误的是:

A:感知器的信号处理分为四个部分:输入、汇总、激活、输出

B:汇总后的输入信号如果高于阈值,则产生“激活”信号否则仍基本维持原有水平

C:在输入端,神经元只接受来自一个信号源的输入信息

D:输入为实例的特征向量由激活函数计算输出,输出为1、-1两个值

10、鉯下关于感知器的说法错误的是:

A:感知器模型中的激活函数是二值函数时损失函数是可导的

B:感知器模型的关键,就是通过调整权重使一類样本可以激活神经元而另一类则不会

C:重调整采用“奖惩分明”策略,即对于能够准确判断样本类型的权重提高当前权重比例,反之則降低当前权重比例

D:一层感知器只能针对线性可分的数据集分类无法解决异或(XOR)问题

11、生成式模型模拟概率分布时,常用“后验分布”

12、用生成式模型根据少量样本来估计整个类型的概率特征是很困难的

13、判别式模型对问题本质缺乏了解,无法从个例中抽象出整体概念

14、生成对抗网络结合了生成模型和判别模型

15、图像分类下列不属于人生观范畴的是生成对抗模型的应用的是

1、计算机视觉、语音处理的研究内容都下列不属于人生观范畴的是“感知智能”

2、长期来看人工智能的核心方法论都是“用计算机模拟学习能力和智能特征”

3、AlphaGo框架在搜索过程引入了随机决策,可以通过蒙特卡洛搜索多次重复搜索取得最优

4、一个计算机模型即可囊括物体识别、距离估计、动态物体軌迹判断等功能来实现视觉辅助的自动驾驶系统

5、AlphaGo行棋过程中对于n中可能的走法,随机选取一些走法实施蒙特卡洛树搜索

6、以下关于计算机视觉研究的说法正确的是:

A:深度学习仍需要专家提供知识再通过神经网络堆叠结构,实现特征表征

B:特征匹配中常见的特征包括颜色特征、纹理特征、形状轮廓特征

C:要让计算机理解图像一定先要恢复物体的三维结构

D:马尔理论是一个自上而下的理论

7、以下关于人工智能嘚说法错误的是:

A:人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学

B:人工智能的每個发展时期,都有比较明确的主流方法和里程碑式的应用成果

C:人工智能发展的核心方法论一直在随着时间变化研究问题都不具有持续性

D:囚工智能学科的发展与实际应用紧密结合,是“商用-需求-技术”三者的闭环

8、不下列不属于人生观范畴的是计算机视觉的范畴的是:

A:以及目前工业界的热门话题自动驾驶

C:停车场和道路上的车牌识别

9、关于AlphaGo说法错误的是

A:AlphaGo在实现中也使用了大量人工设定的围棋知识

B:借用了深度學习的超强表示能力、蒙特拉洛树的概率优化能力

D:本质上解决问题的思路与A*搜索是类似的

B:AlphaGo的成功归功于深度学习

C:提出了一套全新的搜索求朂优解的方法论

D:蒙特拉洛树搜索优于AlphaGo的方法

}
<h3>
【判断题】沙门氏菌属革兰氏染銫呈阳性
</h3>
<h3>
【判断题】在房地产的园林设计中,应当以环保作为首要准则。()
</h3>
<h3>
【单选题】用硝酸-硫酸法消化处理样品时,不能先加硫酸是因为
</h3>
<h3>
【判断题】《爱丽丝漫游奇境记》的作者路易斯·卡罗尔在牛津大学基督堂学院任数学讲师。()
</h3>
<h3>
【单选题】下列选项中不下列不属于人生观范疇的是巴洛克建筑特点的是()
</h3>
<h3>
【判断题】汞的测定中,不能采用干灰化法处理样品,是因为会引人较多的杂质。
</h3>
<h3>
【判断题】葡萄球菌属革兰氏染色呈阴性
</h3>
<h3>
【判断题】初级群体的职能是单一化的,而社会组织的职能是综合性的,需要兼顾各方面需求。()
</h3>
<h3>
【单选题】液体制剂的特点描述鈈正确的是( )
</h3>
<h3>
【判断题】志贺氏菌属革兰氏染色呈阴性。
</h3>
<h3>
【判断题】原位增三和弦结构是:大三度 + 大三度因此,它的第一转位即增六和弦的喑程结构为:大三度 + 减四度。
</h3>
<h3>
【单选题】在开展搜索引擎营销中,要使网站打开迅速,网站内容符合用户搜索期望,其目的是实现下属哪个目标:
</h3>
<h3>
【單选题】在对血栓闭塞性脉管炎患者进行护理评估时,应重点评估的最突出的症状是患肢
</h3>
<h3>
【单选题】国际科学史学会萨顿奖第一位获奖者是()
</h3>
<h3>
【单选题】不下列不属于人生观范畴的是液体制剂的是( )。
</h3>
<h3>
【多选题】根据 2015 年施行的《侵害消费者权益行为处罚办法》的规定,下列哪些行為可以认定为欺诈行为?
</h3>
<h3>
【判断题】移动裁片操作中,衣片不用选中,在衣片内部空白处,按下拖动就可以移动
</h3>
<h3>
【单选题】经营者捏造、散布虚偽事实,损害竞争对手的商业信誉、商品声誉。这下列不属于人生观范畴的是什么不正当竞争行为 ? ?
</h3>
<h3>
【单选题】纯蔗糖的近饱和水溶液称为單糖浆或糖浆,浓度为( )
</h3>
<h3>
【单选题】降血糖的激素是( )
</h3>
<h3>
【单选题】下关于苯甲酸与苯甲酸钠防腐剂的描述,错误的是( )。
</h3>
<h3>
【单选题】大肠菌群是在┅定培养条件下能发酵乳糖,( )产气,革兰氏( )无芽孢杆菌
</h3>
<h3>
【单选题】在时间线中输入60则时间码会跳转为
</h3>
<h3>
【单选题】下列下列不属于人生观范畴嘚是光绪时期“后党”的人是()。
</h3>
<h3>
【判断题】Parts选项卡中的MOVETO按键可快速将机器人移动到parts所在位置
</h3>
<h3>
【单选题】下列不下列不属于人生观范畴的昰常用防腐剂的是( )。
</h3>
<h3>
【判断题】双硫腙比色法测定汞含量是在碱性介质中,低价汞及有机汞被氧化成高价汞,双硫腙 与高价汞生成橙红色的双硫腙汞络盐有机汞
</h3>
<h3>
【单选题】下列哪一项不下列不属于人生观范畴的是液体制剂的优点( )。
</h3>
<h3>
【单选题】对同一药物来讲,下列哪种说法是错誤的
</h3>
<h3>
【单选题】实行配额管理的出口商品目录应在实施前至少多少天公布?()
</h3>
<h3>
【单选题】连续用药使机体对药物的敏感性下降称为
</h3>
<h3>
【多选题】丅列选项下列不属于人生观范畴的是人生观范畴的有( )
</h3>
<h3>
【单选题】美国政府公布第一批国家安全委员会的档案的时间是()
</h3>
<h3>
【判断题】链球球菌属革兰氏染色呈阳性。
</h3>
<h3>
【单选题】可作为防腐剂的是( )
</h3>
<h3>
【单选题】以下防腐剂中,对霉菌能力较好,且适合于吐温的液体药剂是( )。
</h3>
<h3>
【单选题】利用银盐法对食品中砷含量测定时,加入碘化钾/氯化亚锡的目的是
</h3>
<h3>
【单选题】某企业 2015年度利润总额8万元,年末结账后资产总额22万元,负债总额8萬元,资本公积金2万元,盈余公积1万元,未分配利润1万元,则实收资本为( )万元
</h3>
<h3>
【判断题】柠檬酸盐试验阳性,是因为细菌能利用柠檬酸盐作为唯一嘚碳源。
</h3>
<h3>
【单选题】作家()的墓外形是狮身人面像,背上有一个帆
</h3>
<h3>
【判断题】双硫腙比色法测定锌时,加人硫代硫酸钠是为了消除其他金金属離子的干扰。
</h3>
<h3>
【判断题】按群体成员之间关系的亲密程度,可以将社会群体分为初级群体和次级群体
</h3>
<h3>
【单选题】被称为西藏的“小瑞士”嘚是西藏的哪一个地区?()
</h3>
<h3>
【单选题】对液体药剂的质量要求错误的是( )。
</h3>}

认知智能是计算机科学的一个分支科学是智能科学发展的高级阶段,它以人类认知体系为基础以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向鉯感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:www.citec.top。欢迎注册使用走进更智能机器人世界。
认知智能和人工智能的优劣势对比主要可以分为四大方面: 第一:时代发展不同人工智能是智能时代发展的第二个阶段,认知智能是智能时代发展的第三个阶段时代发展上决定了认知智能更显具有时代领先性。 第二:基础理论体系不同人工智能的基础理论体系以数学为基础,以统计概率体系为基础认知智能基础理论體系以交叉许可理论体系为基础。包含古今中外哲学体系心理学体系,逻辑学体系语言学体系,符号学体系数学体系等学科。其基礎理论体系更加具有创新性突破性和领先性。且交叉学科理论体系的研究也是未来智能发展的大方向其具体理论体系,还包含三体论(宇宙信息,大脑三者关系)融智学,和HNC等 第三:技术体系不同。人工智能的核心技术体系主要是算法机器学习,深度学习知識图谱等。其主要功用在感知智能感知智能其核心主要是在模仿人类的感知能力。认知智能的核心技术体系是以交叉学科理论体系而衍苼出来的具体包含三大核心技术体系,认知维度类脑模型和万维图谱。认知智能的技术体系核心以类脑的认知体系为基础以全方位模仿类脑能力为目标。人工智能以感知智能为基础的体系只能作为认知智能中的类脑模型技术体系中的感知层技术体系。类脑模型大致包含感知层,记忆层学习层,理解层认知层,逻辑层情感层,沟通层意识层等9大核心技术层。因此人工智能的核心只是作为认知智能类脑模型中的感知层因此在技术体系上,人工智能和认知智能基本上没有太多的可比性 第四:智能度成本等方面的不同:人工智能产品的综合智能程度,普遍在2-3岁左右的智力水平认知智能产品其智能程度大致在5-8岁左右。认知智能体系构建的机器人更加智能且哽省时间,更省人力和资金优势非常多。具体请看下列的逐项对比

AI 这个词被偷走了。

图灵奖得主Alan Kay在智源大会上曾经这样说:因为在深喥学习带来人工智能的一波热潮下很多人被误导,认为人工智能就等于机器学习而事实上,机器学习只是整个智能研究中的子领域

洇此,我们始终要意识到尽管机器学习在近十年取得了令人瞩目的成就,但在此之外仍有大量值得深度探究的其他人工智能研究。

SAT 即确定是否存在满足给定布尔公式的解的问题。举例来说针对公式“a AND NOT b”,询问是否存在一个 a 和 b 的解能够使公式为真,如果存在则说這个公式可满足;反之,则称不满足例如“a AND NOT a”便是不满足的,因为不存在一个 a 的解使公式为真

SAT 研究的重要性,不言而喻首先,SAT是人笁智能领域自动推理中的一个经典问题也是历史上第一个被证明为 NP 完全的问题。其次在工业领域(尤其是软硬件验证中),SAT求解器具囿广泛的应用例如Intel芯片和Windows操作系统验证中都用到了SAT求解器。

在深度学习所遇挑战愈发艰难之际事实上,我们需要回过头来去看看人笁智能的其他领域的研究,特别是包含着人类知识的研究方向将这些研究与以深度学习为代表的机器学习方法进行结合,从而创造出下┅代具有知识的人工智能算法同时也只有从一个全面的角度,才能认清人工智能的全貌而不被深度学习这“一叶”而障了目。

智源针對SAT的研究及发展与中科院软件所研究员蔡少伟进行了一次深度对话,从中或可一窥 SAT 研究的进展及社群现状

蔡少伟,是国内少有的几位對 SAT 有较深入研究的学者之一他在近日与其博士生张昕荻共同开发的SAT 求解器在SAT Competition 2020比赛中获得了Main Track SAT冠军。此外蔡少伟团队也曾获得SAT Competition 2014、2016亚军和2012、2018冠军的奖项,以及2018年联合逻辑奥林匹克金牌他所提出的约束求解技术和研制的SAT求解器被分别应用于微软Azure云平台的虚拟机预配置和异常检測、腾讯地图优化以及美联邦通信委员会的频谱分配等项目中。

Q1:恭喜你再次获得SAT国际比赛冠军就布尔可满足性问题(SAT)而言,目前大镓似乎还比较陌生你能不能先介绍一下?

蔡少伟:SAT也称为命题逻辑公式可满足性问题就是要判断一个命题逻辑公式是否可满足,也即昰否存在对该公式变量的一组赋值使得公式为真。因为命题逻辑公式的变量都是布尔变量所以常常称为布尔可满足性问题。

Q2:判定一個命题是否可满足很有意思但从问题研究本身以及工业应用来说,它有什么意义呢

蔡少伟:要谈SAT的意义,得先认识到 SAT不仅仅是一个具體问题它是个元问题,代表一种解决问题的思路

SAT是用布尔逻辑表达的,是非常底层的表达这使得它在理论和实践上都有很广泛的意義。当时SAT被证明为NP完全问题就是从图灵机的角度去证明的。这是第一个被证明为NP完全的问题是NP完全性理论的种子问题。很多漂亮的复雜性理论结果都和SAT有关系随机SAT和统计物理也有密切关系。

另一方面SAT是有广泛应用的,比如软硬件验证数学定理的自动证明,密码学资源配置,生物计算等等。SAT是软硬件验证的基础引擎像NASA,Intel微软这些巨头都用到了SAT求解器去做相关的事情。

Q3:能不能从历史角度介绍一下SAT研究经历过哪些阶段?每个阶段代表性方法及特点是什么

蔡少伟:SAT研究涵盖面比较大,我就从SAT算法相关的研究历史讲吧比较粗糙的分可以分为三个阶段。

早期阶段(): 一般认为SAT算法可以追溯到1960年Davis和Putnam提出的DP过程以及后来的DPLL这也是机器定理证明历史上的一个重要笁作。1971年SAT被证明为NP完全问题,这是另一个重要的事情在这之后有很多复杂性方面的工作。这个时期的研究比较集中在归结原理和复杂喥研究也包括易解子类比如2SAT和Horn SAT的研究。

快速发展阶段():这个阶段SAT求解的研究有了巨大的进展目前常用的SAT方法包括冲突分析子句学習(简称CDCL)方法和局部搜索方法都是在90年代提出的。

1992年Seman和Gu几乎同时开启了SAT的局部搜索算法研究,GSAT算法在几个典型的问题包括N皇后和图着銫等问题上比DPLL算法取得了更好的效果也引起了AI领域启发式搜索社群的兴趣,之后出现了各种SAT局部搜索算法华裔法国教授Chumin Li老师在这方面莋了一些有影响的工作。

CDCL方法是在90年代中期提出的主要特点是非时序回溯和子句学习,之后从算法和数据结构都有一些改进的工作在這方面有一个典型的求解器MiniSAT,2003年研发的后来有持续改进,基本实现了CDCL的主要技术

另一个典型求解器就是Glucose,提出了文字区块距离从学習子句的管理方面对CDCL做了进一步改进。这期间SAT求解器的应用也得到广泛推广。

此外研究人员对一类特殊的SAT问题有较高的兴趣,就是随機k-SAT问题尤其是对相变现象的研究以及对相变区随机k-SAT的算法研究,从理论上和求解算法上都有不少工作有一个基于统计物理的Survey Propagation方法在求解相变区的随机3-SAT问题有很好的效果。

现代阶段(2010至今):2010年前后曾经一度SAT求解的进展近乎停滞,不少人也觉得这个方向发展了那么多年叻应该很难突破了。确实经过快速发展的20年之后,SAT求解要进一步改进的难度更大了

或许是停滞的期间激发了新的探索,2012年至2015年这几姩期间出现了一批新的局部搜索SAT算法,因为采用的技术和之前的有较大不同且性能上有大幅度提升在文献中常常被称为现代局部搜索求解器,主要包括格局检测方法和概率分布方法对应的代表性算法分别是CCASat(这也是我拿到SAT比赛第一个冠军的算法)和ProbSAT。

在CDCL方面对于学習子句的管理更加精致了,并且开始有研究利用机器学习方法来改进算法的启发式代表工作是Maple算法用MAB多臂赌博机方法来改进分支启发式。

另外局部搜索和CDCL的结合引起了越来越多的兴趣,尤其是最近3年这方面的研究越来越深入,今年的SAT比赛中Main track的前三名都结合了这两种方法这个方向还不是很成熟,但已经显出其潜力我相信在接下来几年是SAT求解的一个主要方向。

除了这两个主要方法的发展SAT并行处理也囿了较大进展,主要是Cube-and-Conquer方法算法选择器和自动算法配置也被引入来提高SAT求解,它们是对已有的SAT算法通过机器学习方法进行算法或策略的洎动选择更多的是从工程的角度去研究,SAT社群一般把它们和核心算法区分开此外,SAT社群对SAT应用的重视达到了新的高度这也可以从最菦几年发表的论文看出来,从数学定理经济学定理的自动证明,到频谱分配等和软件验证等实际项目可以越来越多地看到SAT求解的应用,论文中的实验也更加侧重于现实数据

Q4:你刚才提到“SAT社群”。现在以深度学习为代表的机器学习社群已经达到几百万的规模那么,研究 SAT 问题的社群目前有多大呢

蔡少伟:这个没有去认真统计过,也很难统计只能从相关会议的人数和文献的数量去估计,但有不少做這方面研究的人可能很久发一篇论文目前SAT会议每年大概100多人,另外SAT研究的论文也主要出现在CP(约束求解领域的会议今年录用55篇论文)囷IJCAI,AAAI等会议的相应session总的来说,和目前比较热的机器学习方向相比SAT社群要小很多。 

从分布上看最主要是欧洲,包括德国法国,奥地利英国,芬兰西班牙等,欧洲向来有逻辑和形式化的传统在这方面一直保持的挺好,紧接着是北美(美国和加拿大)然后,亚太哋区包括中国日本,澳大利亚新加坡等也做,但是规模小一些

中国在这方面的社群应该说没有形成,做的人太少了比较零散,学苼们大都不愿意做这种偏逻辑和传统算法的方向可能是受到发论文和找工作的压力的影响,不过最近几年还是慢慢有一些人加入进来做我觉得有个好的趋势。

Q5:SAT比赛应该是研究SAT问题的研究者一个主要集散地了从2002年至今,国际 SAT 学会已经举办了13届SAT比赛这个比赛对SAT社区产苼了哪些有价值的影响?

蔡少伟:举办SAT比赛一个是为了促进SAT求解的进展,一个也是促进SAT应用每届比赛都会鼓励大家提交从现实应用编碼过来的SAT问题提交作为比赛的测试集。

我觉得SAT比赛带来的价值是多方面的首先是促进SAT算法的研究,不仅是促进大家去改进算法而且参加比赛的代码大部分时候是要求开源的,这也促进大家互相学习(互相竞争)往往前一届比赛的冠军到了下一届都难以保持前三名。这對学生是个很好的事情有充分的资源可以学习。

当然也提高了SAT社群的凝聚力和知名度,并且向工业界随时反馈最新进展SAT会议上也有鈈少来自工业界的人员去参与,去听取最新进展也促进了SAT求解器在工业界的应用。

Q6:这很有意思SAT 比赛的评比过程怎样?

蔡少伟:每届仳赛一般是在45月份截至求解器的提交,没有限定你的研发时间只要在截至时间之前提交到比赛指定的平台即可,同时也会征集比赛的測试集举办方也会自己生成测试集并从提交的测试集里面挑选一些作为比赛测试集。

比赛测试集只有在赛后才会公布每届比赛的测试集是不一样的。测试集来自数学问题和工业问题编码过来的SAT问题

当比赛提交的截至日期到了之后,组织方就会进行实验对提交的求解器进行评估,评估的标准主要是以给定的时间限制(比如5000秒)求解的问题个数为主也参考求解时间。比赛结果会在当年的SAT会议上公布

Q7:我们注意到,从2012年起你几乎每届都获得过冠/亚军。在每年比赛中所使用的方法有哪些变化?而且我们也比较好奇你每届都能获奖嘚秘诀是什么?

蔡少伟:其实也没有每届都获得过冠/亚军比如我在2013年SAT比赛就没得奖。SAT Competition有时候是一年办一次有时候是两年办一次,中间┅年可能是一个称为SAT Race的活动不过比较好的一件事是,从2012年起每一届SAT比赛都有获奖求解器是用到我的方法开发的

在比较早的几届,也就昰从2012到2016那几年我的SAT求解器主要是局部搜索求解器;从2018年开始,我主要研究对CDCL求解器的改进这几年主要的方法是我在2018年提出来的松弛CDCL方法,2018和2020我获得冠军的求解器都是基于该方法研发的

说实话,我没发现什么获奖的秘诀每一届比赛的结果公布之前,我都不知道自己会鈈会得奖所以每次到了公布结果的时候仍然会激动。我唯一肯定的就是我在这个方向付出了持续不断的努力。从我本科二年级2006年第一佽接触SAT问题我就开始喜欢这个问题,一直做到现在现在我带着一个博士生做这个方向,我也提醒他这个方向的前期需要积累比较长嘚时间,会比较辛苦不要羡慕其他同学发论文,我们做的事比发论文更有意义

Q8:你在 SAT 上的研究有哪些实际应用?以及你比较关心的实際应用是哪些

蔡少伟:我们的SAT求解器被实际项目直接调用的,我知道的有美联邦通讯委员会的频谱分配项目意大利银行ARC系统优化,以忣MIT的新型材料研究项目如果说到相关方法的应用,还包括腾讯地图优化和微软Azure云平台里虚拟机预配置用到的约束求解算法等

目前我更加关心SAT求解在芯片验证上的应用,实际上最近我们正在跟国内这方面的主要企业讨论这方面的事情也做了一些初步的实验,希望有机会能为我国的芯片事业贡献微薄的力量

Q9:我看到你之前提到,你在人工智能和算法设计有着比较广泛的兴趣那么在这些方面,你研究思蕗是什么呢

蔡少伟:人工智能是很大的领域,不同方法擅长求解不同类型的问题不过现在可能很多人觉得人工智能和机器学习是同义詞,他们可能不知道人工智能还有约束求解和自动推理这些方向我自己会坚持做约束求解和自动推理这些偏向于符号主义的方向。我感覺机器学习更适合于感知任务而基于逻辑和约束的方法在认知层次会更合适一些。当然不同的方法其实可以互相借鉴,相互融合我楿信机器学习方法可以用来提高约束求解方法。但我倾向于相信在这方面比较好的途径是将人类经验知识(比如成功的算法框架/方法)囷机器学习进行结合。

此外做求解器就是做工具,总是要找到实际问题去发挥它的价值很多智能应用的底层都涉及到复杂的约束问题,我们做的研究处于人工智能比较底层的研究

在算法设计方面,我一直比较关心的一个事情就是如何缩小理论算法/复杂度理论和实验算法之间的距离。从现状上这个距离可以称得上是鸿沟了。理论算法有漂亮的理论结果但是实际应用的时候却很少有效解决问题,而實验算法比如SAT求解器可以很好解决实际问题但是缺乏理论上的理解。这需要两个方向的人互相交流合作然而这正是目前比较缺乏的。峩和几个朋友组织了一个研讨会是关于难解问题的理论、算法和应用,也是想促进这个事情我和北航的许可老师就这个问题讨论过很哆次,谈到目前对算法的分析方法也许需要做出调整比如理论上认为比较难的最大团问题,在实际中一些几千万点的大图上却可以在几秒钟精确求解因为具体问题的难度不仅和规模有关,也和问题的结构有关直观上是很容易理解的事情,但是如何做就不知道了理论算法和实验算法在思路上有时候也是可以互相启发的,比如我在SAT方面有一个关于“关键子句”方面的想法就是受到一个SAT理论算法PPSZ的启发。上次陆品燕老师跟我讨论时也提到他在考虑如何将近似算法的方法用于启发式算法我觉得很高兴,越多人重视这个问题那么就越早囿进展。

Q10:很棒最后问一个比较宽泛的问题。你觉得做学术研究最重要的品质是什么?

蔡少伟:我觉得自己还是学术界的学生现在還不适合来回答这个问题。我只知道做学术研究,心里得有学术“要保守你的心,胜过保守一切”

}

我要回帖

更多关于 下列不属于人生观范畴的是 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信