现在人工智能类学习中心多吗?

Success》被主会录用本文作者为圣母夶学计算机系 DM2 研究团队三年级博士生王达恒,导师是圣母大学计算机系助理教授蒋朦

对于博士学生来说,如何提高科研质量和产量一直昰学术生涯里的中心话题相较于高年级的博士生而言,刚踏入科研领域的低年级博士生往往由于缺乏足够的知识积淀与经验对于估计論文中稿的可能性与找出提高中稿率的办法显得力不从心。我自己作为一名刚刚跨过第二个学年的博士生对这一点的体验格外深刻。

理想情况下当我们开始一个新的以论文发表为导向的研究项目的时候,我们希望拥有合适的研究团队(其中包含多个技能互补的学者与专镓)足够清晰的研究问题,科学合理的研究方法以及定位恰当的目标会议。但在现实中我们往往很难在一开始就达到这样的配置。那么我们能否利用人工智能来从大量的成功经验(以往成功发表的论文)当中建立起预测模型来帮助我们判断呢更进一步地,我们是否能够让人工智能算法给我们推荐能够提高论文中稿率的办法呢是否邀请自己院系当中的另外一位教授参与进来就能够大大地提高项目成功的可能性?或者说有哪些优秀的文章值得一读、甚至必须一读以提高论文中稿率?这些都是非常实用且有趣的问题

客观上来说,每┅篇学术论文都是一个非常复杂的行为产物包含了多种不同类型的上下文信息。常见的成功发表论文一般会有多个作者一些框定研究領域和具体问题的关键词,大量的文献引用以及发表的会议信息。因此准确地判断一篇论文在目标会议上的命中率也是一个尤为困难嘚问题。而从数据中千千万万的备选中找出最具备技能互补性的研究者来推荐给我们更是困难。我们需要的是一个能够有效地表示论文荇为以及其上下文信息的载体

传统的方法是利用矩阵或者张量分解来得到低维度的数据对象表示。也就是说我们可以构建一个巨大的矩阵,其中包含了所有论文以及上下文项的信息然后通过分解这个矩阵来得到论文与上下文项的低维度表示。但这这并不适用于多个上丅文项属于同一种类型的情况例如在一篇论文中有多个作者与引用。而当我们的数据量变得更大的时候用单个庞大的矩阵来表示整个數据集显然也不是个高效的选择。

表征学习的方法为我们提供了一些较好的思路:如果我们能够学习到论文以及其包含的上下文项的向量表征的话我们关心的预测以及推荐问题将会迎刃而解。值得提到的是近两年比较流行网络嵌入学习这些方法基于保存节点与节点之间鄰近度的思路,能够将网中的节点快速地学习成向量表征当拥有了节点的向量表征之后,我们能够轻易地利用向量內积来运算出节点与節点之间的相似度从而帮我们完成节点分类与边预测等任务。但网络嵌入学习的方法并不能适用于我们的情况:我们关心的是由一组由哆类型上下文项构成的论文是否能够在未来成功发表而不是该篇论文是否和某一个作者在网中有较高的相似度。

针对于这些问题我们提出了全新的嵌入学习方法。首先我们将所有的行为看做一个多类型集合的结构。例如一篇论文就可以被看做一个由作者、关键词、目標会议、引用等四种类型组成的集合结构;其中作者、关键词、引用允许有多个上下文项而一篇论文只对应一个上下文项。

这样一个荇为的向量表征就可以由其包含的上下文项表征通过加权求和得到。

我们进一步通过运算行为向量的二阶模长(取双曲正玄值)来得到一個行为的成功率

之后,我们通过随机梯度下降的方法来优化实际行为成功率分布于预测行为成功率分布之间的距离最终学习得到数据集中所有行为以及上下文项的低维度向量表征。

在这里需要强调的有两点:1. 我们在低维度嵌入空间中保存了行为的成功特征(多类型上下攵项集合的结构);2. 在大多数时候我们的数据集中只包含了观测到的成功的行为,而不包含失败的行为数据因此,我们也需要通过全噺的负向采样的方式来构建训练负例为此,我们提出了两种创新的多类型上下文项集合负向采样方法

在第一种负向采样方法中,我们偠求生成的负例需要与对应的正例拥有相同的上下文项数量这样,我们能够避免完全随机采样所造成的不合理的负例子而很多时候,峩们会发现某一些类型的上下文项带有一些特点例如一篇文章可以对应多个作者,但通常只对应一个目标会议我们在此设计了我们更精细的第二种负向采样方法:要求生成负例的时候遵循正例的类型频率分布。这样我们能够生成更近似于正例但是并不存在的负例用于訓练。

我们搜集了接近一万篇公开发表的计算机领域相关论文用于实验

在预测任务当中,我们的模型表现优于所有网嵌入学习模型(LINEDeepWalk,Node2VecMetapath2Vec)以及经典的降维模型 PCA。其中第二种负向采样方法(Pn)优于第一种负向采样方法(Pt)。 而且当我们设置相对较高的权重给作者类型嘚时候我们能得到整体最优的效果。

在推荐任务中我们能得到一致的结论,我们的模型同样优于其他模型特别是对于相对较难的推薦作者任务和推荐引用任务(总量分别为12300与18971),我们的模型拥有更明显的优势

对于我们模型的优势,一个更直观的方法是把测试例中真實的文章与假文章在低维度嵌入空间中可视化出来我们可以看到左边的真实论文向量在空间中明显地延伸;而假论文的向量接近于原点。这样一长一短的文章向量显示了我们的预测模型有足够的能力去鉴别真实论文与假论文之间的差别从而提供准确地命中率预测给我们。

另外我们在实验过程中也有一些有趣的发现。

我们另外从Google Scholar中搜集了测试例中真实论文的引用数量从图中我们能够发现在我们模型中嘚到更高预测命中率的论文相较于预测命中率更低的论文明显得到了更多次的引用。这样的结论几乎出现在2001至2015所有的年份当中

最后,希朢我们的发现与研究对你有所帮助

论文原文可移步下载。 

雷锋网原创文章未经授权禁止转载。详情见

}

现在哪个人工智能最厉害?现茬学习人工智能毕业后好就业吗?

(英语)缩写为AI它是一门新的技术科学,研究和开发用于模拟扩展和扩展人类智能的理论,方法技术和应用。是计算机科学的一个分支它试图理解智能的本质,并产生一种以类似于人类智能的方式响应的新智能该领域的研究包括人技术,语音识别图像识别和自然。语言处理和专家 “人工智能”一词最初是在1956年在达特茅斯学会创造的。

从那时起研究人员开發了许多理论和原理,人工智能的概念也得到了扩展人工智能是一门具有挑战性的科学,从事这项工作的人必须了解计算机知识心理學和哲学。人工智能是一门非常广泛的科学由不同的领域组成,如机器学习计算机视觉等。一般来说人工智能研究的主要目标之一昰使机器能够完成人类智能通常所需的工作。复杂的工作但不同的时代和不同的人对这种“复杂的工作”有不同的理解。

例如重大的科学和工程计算应该由人类大脑进行。现在计算机不仅可以执行这样的计算而且可以比人脑更快更准确地完成计算。因此当代人不再看到这样的计算。这是一项“需要人类智能完成的复杂任务”可以看出,复杂工作的定义随着时代的发展和技术的进步而变化人工智能的具体目标自然随着时代的变化而演变。一方面它继续取得新的进展,另一方面它转向更有意义和更困难的目标。主要材料意味着鈳用于研究人工智能可实现人工智能技术的机器是计算机。人工智能的发展历史与计算机科学与技术的发展历史有关除了计算机科学,人工智能涉及许多学科如信息论,控制论自动化,仿生学生物学,心理学数学逻辑,语言学医学和哲学。

人工智能研究的主偠内容包括:知识表示自动推理和搜索方法,机器学习和知识获取知识处理系统,自然语言理解计算机视觉,智能机器人自动编程等。

现在在研究了人工智能之后,毕业后这是一个好工作吗

人工智能是发展方向。许多工作将被人工智能所取代。预计毕业后就業不会成为问题

版权声明:本文为快迭智能转载自互联网或原创文章

}

清华新闻网5月30日电(通讯员 曹蕾)2018年首届“全国大学生人工智能创新大赛”全国总决赛于5月25日-27日在广东省惠州市举行清华-商汤未来深度学习人工智能兴趣团队(下简称“未来深度学习团队”)的参赛项目项目《Beauty ID:基于深度学习打造最美证件照》在决赛中取得了大数据技术类冠军、综合银奖的成绩。

未来罙度学习团队队员在比赛现场 供图:智创大赛组委会

在本次智创大赛中未来深度学习团队与知名摄影工作室微笑时刻展开合作,致力于咑造一款能够大大缩短证件照后期处理时间的人工智能产品Beauty IDBeauty ID抓住在证件照领域,后期耗时长、劳动重复的商业痛点:市场上的摄影工作室拍摄一张简历证件照往往需要经过化妆、拍摄、后期三部分工作在成熟的摄影工作室中,后期占用了四成的人力资源;而在时间上後期占到了将近一半的时间。但在真正的后期处理过程中有很大部分的时间花在调整对称五官,美肤等一些常规既定动作上Beauty ID项目使用哆个图像算法协同融合处理,包括人脸关键点的提取和变换智能分割与裁切,设计并使用几何校正网络、几何扭曲网络、色彩增强网络等多网络联合处理达到智能后期的作用,帮助后期师节约70%左右的劳动时间投入到定制化的工作中去。

未来深度学习团队获大数据技术類冠军、综合银奖 供图:智创大赛组委会

本届“全国大学生人工智能创新大赛”于第二届科交会期间由中国高校科技成果交易会组委会舉办。本次大赛的主题是“创新驱动发展、智能改变生活”比赛采用网络初赛、现场总决赛的二级评审选拔赛制,初赛报名参赛项目共計208项经专家评审委员会核定,最终推荐36项优秀项目入围总决赛

本次参赛的项目组成员来自于清华-商汤未来深度学习人工智能兴趣团队,该团队是由校团委科创中心指导、鼓励学生发挥兴趣、自主实践创意创新研究的学生团体团队专注于计算机视觉领域相关的研究,致仂于将相关学术成果落地为校园场景下的产品鼓励和支持同学进行基于兴趣的自主研究和实践。团队目前由20多名清华在校生组成涵盖夲科、硕士、博士等多个年级和院系。

清华-商汤未来深度学习人工智能兴趣团队队员合影 供图:校团委科创中心

清华大学于2010年开始组建学苼科技兴趣团队先后已有未来航空、未来汽车、未来智能机器人、未来动漫等近30支学生科技兴趣团队成立。本着“兴趣先导、校企联合、学科交叉、学生自主”的建设理念兴趣团队以学生的科研兴趣和探索精神为出发点,以领域前沿为研究内容以资源匹配、专家指导、团队培养为手段,坚持“有兴趣、不功利、站得高、看得远”的基本定位充分联合校内外资源,推进创新教育、培养学生的研究兴趣與探索精神、鼓励学生自主创新与大胆尝试

目前,学生科技兴趣团队注册成员897人在研项目80余项,已完成项目240余项获得国内外科技比賽奖项72项,学生作为第一作者取得专利21项累计孵化出Colorwork、弱水无极、轻客、紫晶立方等20多个创业项目。

供稿:校团委科创中心 编辑:徐静 審核:襄楠

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信