
回顾《从知识表示看人工智能(上)》,文中提到人工智能(Artificial Intelligence, AI)的核心是知识的表示,所以很多有关人工智能的问题都可以从知识表示的角度进行解释与回答。从IBM的“深蓝”计算机战胜国际象棋世界冠军卡斯帕罗夫,到AlphaGO战胜围棋九段高手李世石,以及AlphaGOZero不需要通过训练就能打败AlphaGO,这些AI的成功都离不开其中相关行业领域知识表示的成功。计算机视觉、语音、深度学习模型等都是人工智能知识表示的方式。这一次,智能算法研究中心的黄翰教授想和大家从人工智能的本质这一角度来看人工智能的应用。

目前,AI方面的专家在做行业应用时,客户经常建议他们去深度了解客户所在的行业,甚至钻研客户所在领域的业务,希望他们向行业专家靠拢。这种想法不难理解,但是不太现实。因为想要熟悉一个领域,必须要有一定时间的积累,这可能需要AI专家们放下手头与AI相关的工作,才能有充足的时间去深入了解其客户所在领域的知识。然而,AI专家们所掌握的技术往往具有较强的通用性,而且多数AI专家并不想只钻研某一行业的应用。但是某些应用的研发需要AI专家先熟悉相关行业知识,甚至成为业务专家,才能实现算法的落地。如此一来,AI专家们的额外学习时间成本很高,难度也很大,成为业务专家几乎不可能实现。这是目前人工智能应用的一个核心痛点,也是垂直领域中很多AI没有被深入研究或没有成功案例的主要原因。然而,让行业专家做AI也是不可靠的,因为他们很可能对AI技术和产品了解不够充分,从而导致开发过程中出现实施效率低、执行风险大的情况。

前几年,一些企业自组班底开展人工智能技术研发,但大部分都以失败告终。究其原因,虽然企业投入了大量的人力和物力,但是大多数企业缺乏研发经验,很多参与研发的行业专家对AI十分陌生,不了解如何使用AI技术,也不清楚运用AI时是否存在一些技术风险相关的问题,以至于行业专家即便能够高效地运用领域知识和技术,但仍然无法达到预期目标,难以研发出行业所需的AI。如果企业选择对AI进行定制,那在组建团队、采购物资和订购AI技术等方面都要付出更高的代价。因为虽然腾讯、阿里、百度等企业有对外提供免费和廉价的通用算法接口,但如果需要针对企业或行业定制特殊的算法,其造价是十分高昂的。

图1 百度AI定制服务
此外,人工智能的专家跟行业的应用专家利用公有平台进行合作仍困难重重。如《人工智能支撑平台(中)》所述,各大公司的公有云系列平台提供了不少算法产品的技术对接服务,即AI专家针对行业应用设计算法,将其上传平台,可供企业使用。然而,很多企业不想使用云服务,也不希望将算法和数据放在公有平台。他们无法做到每时每刻了解公有云的现状,担心在公有云上处理数据会有风险,也可能不利于产品落地。因此,企业更希望专家到企业中提供定制服务,但是在本地进行定制的成本特别高,风险也很高。目前的人工智能平台暂时无法很好地解决这个问题。

图2 公有云服务示意图
最后,我们了解到目前成功落地的AI产品多数是一些初级的人工智能,例如人脸识别、猫狗识别、物品识别、车牌识别等。这些AI应用所用到的并非行业知识或者领域知识,而是一些常识。也就是说,目前大部分AI的成功落地主要依赖于这些常识恰当的知识表示,而不是专业领域的知识表示。目前,利用专业领域的知识表示使AI成功落地的产品很少。如果一个AI产品在垂直领域能够实现成功落地,那么相关企业将会在AI行业中树立一个重要的标杆。比如说,某教学辅导APP能够实现拍照搜题功能,为学生们答疑解惑,还能向学生推荐相关题目,举一反三。因此,开发该APP的企业已成为教育辅导领域的一个标杆。

图3 猿辅导在线教育体系
综上所述,从人工智能的本质上看,现有的AI平台针对面向行业的应用还存在许多尚未解决的问题。那么理想的面向行业的人工智能平台应该是什么样的呢?
首先,为应用做支撑的AI平台一般需要为开发者在预演、售前论证、演示、原创研发和二次开发这五个阶段提供相应的服务。开发者希望AI平台能够提供充足的资源,并分别应用于以上五个阶段,以便通过AI支撑平台实现领域专业知识应用最大化,提高行业效率,节省成本。目前通用的AI平台都尚未实现这一点。
其次,当前AI支撑平台的目标是能够根据行业模式提供定制化服务,以降低开发风险和成本。如果想让人工智能专家不需要额外学习行业知识就能使算法轻松落地,让行业专家不需要熟悉AI技术就可以顺利地把算法部署在行业应用中,那么就要求AI支撑平台能够提供人工智能算法程序接口、相关测试用例以及充足的应用成功案例。现有的AI平台很少会提供测试用例,因为这可能会涉及与平台相关的利益问题。但如果不提供测试用例,很多想要使用AI平台算法的客户可能无法确定该算法是否适用于相关的行业应用,难以对算法做横向迁移。这就要求AI支撑平台提供一些人机交互的功能来辅助行业定制化服务。就像iPhone手机提供的Siri功能,可以为用户提供对话式的应答,让用户轻松获取想要的服务。

图4 Siri的智能应答
人机交互定制是非常昂贵的,但如果AI支撑平台能够提供相关的算法接口,便于AI专家与行业专家进行算法定制的交互,那么就可以加速算法的落地。AI支撑平台可以通过程序、接口、测试用例和成功案例四位一体,聚合算法基础,为行业从业人员提供可定制的人工智能算法服务,让行业负责顶层设计,各司其职,以减少成本,加快行业与算法的互相融合和迭代。
与此同时,我们希望AI支撑平台具备以下优势:
第一,相比当前主流的云服务平台,AI支撑平台要有能够应用于各种行业的基础算法和丰富案例,便于用户进行二次开发。
第二,AI支撑平台要经过实际场景的考验,能够保证算法的鲁棒性和泛化能力。目前的AI平台能够提供通用算法,但没有经过实际场景的考验,难以保证对用户的适用性。而关于如何构建让研发者愿意进行技术资源分享的生态,黄教授将在未来向大家做详尽的介绍。
第三,AI支撑平台要以容器的形式存在,能够轻松地为用户部署一个或者多个主机的服务器,以私有云的方式提供AI的技术壁垒以保护业务数据的安全。现有的AI平台只能通过互联网调用算法,软件开发工具包(Software Development Kit, SDK)较少,不适用于私有云,更不适用于局域网布局,因而限制了平台使用的灵活性。而以容器形式存在的AI支撑平台在架构上应该具备应用层、系统层、通讯层、算法层、模型层、数据层和设备层。其中,应用层可以支撑整个行业的应用。在系统层,可以采用Docker实现环境隔离,用类似kubernetes的集群管理来支撑整个应用,用Docker的镜像管理来实现硬件资源集中调配以及大数据的监控等等。在通讯层,可以运用人工智能应用平台的通信模块,包括但不限于TCP/IP、HTTP以及FTP协议。算法层将集成机器学习算法、深度学习算法等多种算法,是AI支撑平台的基础。模型层则为用户提供各类训练模型,帮助用户快速构建机器学习与深度学习的应用程序。数据层将对用户上传的原始数据进行处理和加密,同时确保平台带有标注数据集,能够为用户提供便利。设备层提供硬件基础,为平台做环境底层硬件的支撑,包括但不限于CPU、GPU、分布式存储资源池以及网络资源池。平台数据将在底层进行更新。

图5 理想AI支撑平台的整体架构
目前常用的平台基础设施有服务器、AI的技术应用等等。大数据可以来自互联网、传感网和物联网,还可以来自服务器与高性能芯片。AI支撑平台的核心是数据资源与运算之间的算法。该算法可以支撑计算智能、感知智能和认知智能,同时基于基础设施,运用平台技术生产具体的应用产品和行业解决方案。
总编:黄翰
责任编辑:袁中锦
文字:黄翰、李加利
图片:李加利、袁中锦
校稿:何莉怡
时间:2022年6月3日