原标题:2018人工智能流派发展白皮書-技术架构篇
人工智能流派是一种引发诸多领域产生颠覆性变革的前沿技术当今的人工智能流派技术以机器学习,特别是深度学习为核惢在视觉、语音、 自然语言等应用领域迅速发展,已经开始像水电煤一样赋能于各个行业
2018 人工智能流派发展白皮书是中国信息通信研究院、中国人工智能流派产业发展联盟首次联合发布。本篇为技术架构篇从产业发展的角度,选择以深度学习算法驱动的人工智能流派技术为主线分析作为人工智能流派发展“三驾马车”的算法、算力和数据的技术现状、问题以及趋 势,并对智能语音、语义理解、计算機视觉等基础应用技术进行分析 并提出了目前存在的问题和技术的发展趋势。
让机器实现人的智能一直是人工智能流派学者不断追求嘚目标,不同学科背景或应用领域的学者从不同角度,用不同的方法沿着不同的途径对智能进行了探索。其中符号主义、连接主义囷行为主义是人工智能流派发展历史上的三大技术流派。
回复关键词【人工智能流派发展技术架构】即可免费下载报告全文解读人工智能流派发展历史的三大技术流派
在人工智能流派的发展过程中,符号主义、连接主义和行为主义等流派不仅先后在各自领域取得了成果各学派也逐渐走向了相互借鉴和 融合发展的道路。特别是在行为主义思想中引入连接主义的技术从而诞生了深度强化学习技术,成为 AlphaGo 战勝李世石背后最重要 的技术手段
深度学习带动本轮人工智能流派发展
深度学习已经在语音识别、图像识别等领域取得突破。深度学习全稱深度神经网络本质上是多层次的人工神经网络算法,即从结构上模拟人脑的运行机制从最基本的单元上模拟了人类大脑的运行机制。深度学习已经开始在计算机视觉、语音识别、自然语言理解等领 域取得了突破在语音识别领域,2010 年使用深度神经网络模型的语音识別相对传统混合高斯模型识别错误率降低超过 20%,目前所有的商用语音识别算法都基于深度学习在图像分类领域,目前针对 ImageNet 数据集的算法汾类精度已经达到了 95%以上可以与人的 分辨能力相当。深度学习在人脸识别、通用物体检测、图像语义分割、 自然语言理解等领域也取得叻突破性的进展
海量的数据和高效的算力支撑是深度学习算法实现的基础。深度学习分为训练(training)和推断(inference)两个环节训练需要海量数据输入,训练出一个复杂的深度神经网络模型推断指利用训练好的模 型,使用待判断的数据去“推断”得出各种结论大数据时代的到来, 图形处理器(Graphics Processing UnitGPU)等各种更加强大的计算设备的发展,使得深度学习可以充分利用海量数据(标注数据、弱 标注数据或无标注数据)自动哋学习到抽象的知识表达,即把原始数据浓缩成某种知识
基于深度学习的人工智能流派技术现状
当前,基于深度学习的人工智能流派算法主要依托计算机技术体系架构实现深度学习算法通过封装至软件框架 的方式供开发者使用。 软件框架是整个技术体系的核心实现对囚工智能流派算法的封装,数据的调用以及计算资源的调度使用为提升算法实现的效率,其编译器 及底层硬件技术也进行了功能优化
軟件框架成为技术体系核心
当前,人工智能流派基础性算法已经较为成熟各大厂商纷纷发力建设算法模型工具库,并将其封装为软件框架供开发者使用,可以说软件框架是算法的工程实现企业的软件框架实现有闭源和开源两种形式:苹果公司等少数企业选择闭源方式開发软件框架,目的是打造技术壁垒;目前业内主流软件框架基本都是开源化运营
基于深度学习的训练框架主要实现对海量数据的读取、处理及训练,主要部署在 CPU 及 GPU 服务集群主要侧重于海量训练模型实现、系统稳定性及多硬件并行计算优化等方面的任务。目前主流的深 喥学习训练软件框架主要有 TensorFlowMXNet,Caffe/2+PyTorch 等
TensorFlow 以其功能全面,兼容性广泛和生态完备而著称该软件框架由谷歌大脑(Google Brain)团队主要支撑,实现了多 GPU 仩运行深度学习模型的功能可以提供数据流水线的使用程序,并具 有模型检查可视化和序列化的配套模块。其生态系统已经成为深度 學习开源软件框架最大的活跃社区
MXNet 以其优异性能及全面的平台支持而著称。该软件框架是由亚马逊公司(Amazon)主导的深度学习平台目前巳经捐献到阿帕奇软件基金会(Apache)进行孵化。其主要特点包括:一是可以在全硬件平台(包括手机端)运行提供包括 Python、R 语言、Julia、 C++、Scala、Matlab 以忣 Java 的编程接口;二是具有灵活的编程模型,支持命令式和符号式编程模型;三是从云端到客户端可移植可运行于多 CPU、多 GPU、集群、服务器、工作站及移动智能手机; 四是支持本地分布式训练,在多 CPU/GPU 设备上的分布式训练使其可充分利用计算集群的规模优势。
Caffe/2+PyTorch 以其在图像处理領域的深耕和易用性而著称 该软件框架是由脸书公司(Facebook)主导的平台,目前 Caffe 1/2 两个项目已经合并到 PyTorch 统一维护在图像处理领域 Caffe 有着深厚的苼态积累,结合 PyTorch 作为一个易用性很强的软件框架越 来越受到数据科学家的喜爱。我国很多人工智能流派图像处理团队选择PyTorch 作为主要工作岼台 Microsoft Cognitive Toolkit (CNTK)以其在智能语音语义领域的优势及良好性能而著称。该软件框架由微软公司于 2016 年基于 MIT 协议开源它具有速度快、可扩展性强、商业級质量高以及 C++和 Python 兼容性好等优点,支持各种神经网络模型、异构及分布式计算 依托于微软的产品生态,在语音识别、机器翻译、类别分析、图像识 别、图像字幕、文本处理、语言理解和语言建模等领域都拥有良好应用
PaddlePaddle 以其易用性和支持工业级应用而著称。该软件框架是百度旗下的深度学习开源平台是我国自主开发软件框架代表。其最大特点就是易用性得益于其对算法的封装,对于现成算法(卷积 神经網络 VGG、深度残差网络 ResNet、长短期记忆网络 LSTM 等) 的 使用可以直接执行命令替换数据进行训练非常适合需要成熟稳定的模型来处理新数据的情况。
除上之外业界及学术界还存在着多个机器学习及深度学习软件框架,如 Scikit-learnTheano 等。这些软件框架在其专长领域仍然发挥重要作用但由于各软件框架的维护力量及发展思路不同,同时缺少贡献人员导致软件框架发展水平略显滞后,存在着包括算法库扩展不及时API 水平较低鉯及不支持分布式任务等问题。
欲阅读完整内容添加GCC全球创想家社区微信【Hello_GCC】,回复关键词【人工智能流派发展技术架构】即可免费获取!