专家解读 - 工业互联网系列研究专题之二
在一篇文章里(专家解读 | 工业互联网系列研究专题之一),我们提到人工智能技术在工业制造领域已经收获了一些成果和实践。
然而,人工智能技术发展至今仍有一些问题没有解决,业界对于它的认识还存在模糊和误区,这使得人工智能技术在工业互联网的应用依然处于前期摸索和实践的阶段。在了解问题的关键之前,我们先正式认识一下人工智能技术。
在资本市场的助推下,“人工智能”这个词从原来的狭义定义逐渐炒作到了广义的定义,承载了更多投资意义。想要真正认识“人工智能”,我们需要从技术上明确其狭义的概念,如下图:
图1:人工智能/机器学习/深度学习
从技术领域范畴上讲,机器学习是人工智能的子类,而深度学习是机器学习的子类。实际上对于机器学习和深度学习来说, 放到人工智能的范畴,其统一的地方就是都要通过一定的算法对大量数据进行复杂的数学运算,这个过程叫训练。训练的目标是对一个业务问题的未来结果有很高精确度的预测,并放到实际的推理环境中应用。
机器学习比深度学习的历史早,在深度学习概念提出之前,机器学习领域的状态是算法工程师利用 LR、SVM、感知机等若干个模型和大量数学算法解决一个实际的问题,这个时候算法工程师更多的工作主要是在特征工程方面,很多时候特征的构造技法复杂多变,是否有用也取决于问题本身、数据样本、模型以及运气,而构造新特征的尝试往往很大部分都不能在实际工作中发挥作用。
机器学习可以定义为利用简单模型描述复杂特征。简单模型说的是算法本身并不复杂, 比如 LR(逻辑回归算法),参数和表达能力基本呈现一种线性关系,易于理解。复杂特征则是指在特征工程方面不断尝试使用各种技巧构造的可能有用、可能没用的特征,这部分特征的构造方式可能会利用各种数学计算,比如窗口滑动、离散化、归一化、开方、平方、笛卡尔积、多重笛卡尔积等等,而这些也需要底层设备具备很高的计算力。
深度学习的概念和技术提出以后, 大家发现通过神经网络算法技术可以进行一定程度的特征描述,例如在图像领域,通过 CNN(卷积神经网络) 提取图像特征并在此基础上进行分类,能解决线性不可分问题,可以利用计算机自动提取特征,可以代替算法工程师人工构造。当然这些图像数据本身的特征也相对简单,但是算法模型却是非常复杂,除了CNN,还有DNN(深度神经网络),RNN(循环神经网络),LSTM(长短时记忆单元)等神经网络算法,因此深度学习带来了模型复杂、不可解释的问题,也带来了对计算力更大的需求,算法工程师在神经网络结构设计方面要花大量的心思,通过大量的迭代计算来提升模型效果。可以认为深度学习是通过简单特征加上复杂模型来解决特征提取并进一步提升预测精度的另一种方式。
机器学习和深度学习这两种模式目前业界都在大量研究和实践,其针对AI算法模型开发的硬件环境、计算框架、并行计算模式以及算法技术等有不同的实现,从部署到模型训练开发以及推理应用, 整个编程环境和计算运行环境(Programming Model和Runtime)相比较于一般应用来说更为复杂,需要更大的算力来实现。
实际上最大的难点就是AI技术和工业行业数据的深度结合。两个方面,一个是关于底层AI技术的,包括AI基础设施(计算力、网络和存储)、计算框架、平台领域仍然有很多需要优化和发展的技术需要研究和实现,以适应工业领域中各种场景AI模型的训练要求;另一方面,在工业领域的企业,AI人才和组织欠缺,各个工业领域的工业数据繁杂而不同,不同场景应用诉求对于AI算法模型的开发设计和训练需要既懂行业数据和业务,又懂AI技术和算法的专家,无法针对不同的业务数据进行智能制造场景的AI算法训练,设计不同应用场景的推理模型,应用到实际的工业环境中,使能智能制造。
从上述的两个方面考虑, 我认为想要实现人工智能技术在工业互联网领域的应用使能,需要面对和解决以下三个维度的关键问题:
人工智能基础设施平台包括训练平台和推理平台, 这两个AI场景对于硬件和软件平台的技术要求非常专业,涉及到高性能的ICT技术(包括芯片技术), 众多的计算框架, 以及基于工程数学的大量算法模型的迭代开发, 基于计算框架的算力资源的管理调度, 整个底层技术生态复杂而多样, 需要具备综合ICT技术能力和实力的公司才能提供合适的AI技术方案。
工业领域的数据有行业属性, 采集(ETL)和处理过程(标注)具有工业特色, 比如针对工业智能视觉自动化检测场景,不同的工业制造产品的部件显而易见的不同而多样, 图片采集的场景和标注具有行业特性, 质检流程和标准也不同, 需要一一研究和实现。
我们知道人工智能算法开发最重要的要解决数据+特征+模型的问题, 工业大数据非常复杂多样, 处理算法模型开发过程中的特征工程在工业界是巨大的难关, 需要对机器学习以及深度学习的技术如何结合业务非常理解,不同的算法,要使用不同的特征工程达到同一个目标. 由于工业数据的特点, 需要开发高VC维的模型, VC维(Vapnik-Chervonenkis Dimension)又称VC理论, VC维反映了函数集的学习能力,VC维越大则模型或函数越复杂,学习能力就越强, 模型一定要与待解决的问题相匹配,如果模型过于简单,而问题本身的复杂度很高,就无法得到预期的精度. 而开发并训练好的模型也需要和具体要解决的业务继续进行推理落地, 开发AI应用系统对接原有的工业业务系统, 以做到使能,取得预期的效益,这也需要进一步针对模型进行推理部署,开发AI应用系统,需要熟悉相关工业互联网领域的应用和业务流程。
实际上, AI使能工业互联网要解决的上述三个维度的问题,也正是AI领域三大要素: 算力、数据、 算法在工业互联网领域的具体体现。下一篇将重点介绍和分析AI领域中的技术生态和核心诉求,请持续关注《专家解读 | 工业互联网系列研究专题》系列文章。
本文转自《新华三》