无代码、可重用的人工智能将如何跨越人工智能的鸿沟
作者丨MichelleZhou
翻译丨李睿
策划丨孙淑娟
【51CTO.com快译】重复使用预先构建的人工智能解决方案和组件以及无需编码即可对其进行自定义,最终将允许企业创建人工智能解决方案,而无需雇佣人工智能专业人士或采用成本昂贵的 IT 资源。
人工智能技术先驱、麻省理工学院教授 J.C.R. Licklider 于 1960 年在他撰写的一篇名为《人机共生》开创性论文中对于未来世界进行了设想:“在预期的共生伙伴关系中,人类将设定目标、制定假设、确定标准,并进行评估。计算机将完成程序化工作,为技术和科学思维中的洞察力和决策铺平道路。”
在当今世界,这种计算机被称为“人工智能助理”。然而,开发人工智能助理是一个复杂、耗时的过程,需要深厚的人工智能专业知识和复杂的编程技能,更不用说收集、清理和注释训练此类人工智能助理所需的大量数据的工作。因此,在不同的应用程序和领域中重用人工智能助理的全部或部分内容是非常必要的。
人工智能学习人类技能很难
训练人工智能助理很困难,因为此类人工智能助理必须具备一定的人类技能,才能与人类协作并帮助人类完成有意义的任务,例如确定医疗保健治疗或提供职业指导。
人工智能必须学习人类语言
为了切实地帮助人类,人工智能助理必须掌握最重要的技能或许是人类语言,这样人工智能才能与用户交互、解释他们的自然语言输入,以及采用自然语言响应他们的请求。然而,由于多种原因,教授机器学习人类语言并非易事。
首先,人类表达是高度多样化和复杂的。如图 1 所示,例如,在人工智能助理(也称为人工智能聊天机器人或人工智能面试官)采用开放式问题面试求职者的应用程序中,求职者对此类问题的回答多样化并且十分复杂。
图 1. 一位人工智能助理在求职面试中提出一个开放式问题(“你在工作中面临的最大挑战是什么?”)。求职者的回答非常多样化和复杂,这使得训练人工智能正确识别和响应此类回答变得非常困难
其次,求职者可能会通过提出澄清性问题或提供不相关的回答来偏离主题。下面的示例(图 2)显示了考生对上述同一问题偏离主题的回答。人工智能助理必须正确识别和处理此类响应,才能继续对话。
图 2. 人工智能助理必须识别并正确处理三种不同的用户偏离主题回答,才能继续对话
第三,用户的表达可能模棱两可或不完整(图 3)。
图 3. 显示用户对人工智能问题的模棱两可回答的示例
人工智能必须学习人类的软技能
让机器学习人类技能变得更加困难的是,人工智能还需要学习人类的软技能才能成为人类的得力助手。就像具有软技能的优秀人类助手一样,人工智能必须能够读取人类的情绪,并在敏感情况下具有同理心。
一般来说,教授人工智能学习人类技能(语言技能和软技能等)很困难的原因,主要有三个:
首先,它通常需要人工智能专业知识和 IT 编程技能来弄清楚需要哪些方法或算法以及如何实施这些方法来训练人工智能。
例如,为了训练人工智能正确响应用户对开放式问题的高度多样化和复杂的响应,如图 1 和图 2 所示,必须知道可以使用哪些自然语言理解 (NLU) 技术(例如可以使用数据驱动的神经方法)或机器学习方法(例如监督或无监督学习)。而且,必须编写代码来收集数据,使用这些数据来训练各种 NLU 模型,并连接不同的训练模型。正如人工智能专家 Ziang Xiao 等人在这篇研究论文中所解释的那样,整个过程非常复杂,需要大量人工智能专业知识和编程技能。即使使用现成的机器学习方法也是如此。
其次,为了训练人工智能模型,必须有足够的训练数据。通过上面的例子,Ziang Xiao 等人为每个开放式问题收集了数以万计的用户回答,以训练人工智能助理在面试对话中使用此类问题。
第三,正如在研究中所描述的那样,从头开始训练人工智能助理通常是一个反复且耗时的过程。这个过程包括收集数据、清理和注释数据、训练模型和测试训练模型。如果训练后的模型表现不佳,则需要重复整个过程,直到训练后的模型合格为止。
然而,大多数组织没有内部人工智能专业知识或复杂的 IT 团队,更不用说训练人工智能助理所需的大量训练数据。这将使此类组织很难采用人工智能解决方案,从而造成潜在的人工智能鸿沟。
多级可重用、基于模型的认知人工智能
为了让人工智能得以广泛的应用,一种解决方案是预训练人工智能模型,这些模型可以直接重用或快速定制以适应不同的应用程序。与其完全从头开始构建模型,不如将其从预制部件拼凑起来会更容易、更快捷,就像采用发动机、车轮、制动器和其他组件组装汽车一样。
在构建人工智能助理的背景下,图 4 显示了一个基于模型的认知人工智能架构,其中三层人工智能组件相互叠加。每一层的人工智能组件都可以预先训练或预先构建,然后重用或轻松定制以支持不同的人工智能应用程序。
图 4. 基于模型的认知人工智能架构,在多个层次中具有可重用的人工智能
重用预训练的人工智能模型和引擎(人工智能助理的基础)
包括人工智能助理在内的任何人工智能系统都建立在人工智能 / 机器学习模型之上。根据模型的用途或训练方式,它们可分为两大类:
- 可用于不同人工智能应用程序的通用人工智能模型;
- 经过训练的专用人工智能模型或引擎特定的人工智能应用。会话代理是通用人工智能的一个例子,而物理机器人是专用人工智能的一个例子。
人工智能或机器学习模型包括数据驱动的神经(学习模型或符号模型。例如,BERT 和 GPT-3 是通用的、数据驱动的模型,通常在维基百科等大量公共数据上进行预训练。它们可以在人工智能应用程序中重复使用来处理自然语言表达。相比之下,诸如有限状态机之类的符号人工智能模型可以用作句法解析器,以识别和提取更精确的信息片段,例如,特定概念(实体),例如来自用户输入的日期或名称。
出于多种原因,通用人工智能模型通常不足以为特定的人工智能应用程序提供动力。首先,由于此类模型是在通用数据上训练的,因此它们可能无法解释特定领域的信息。如图 5 所示,预训练的通用人工智能语言模型可能“认为”表达式 B 更类似于表达式 A,而人类会识别出 B 实际上更类似于表达式 C。
图 5. 显示预训练语言模型缺失的示例。在这种情况下,在通用数据上预训练的语言模型将表达式 B 解释为与表达式 A 更相似,将其解释为与表达式 C 更相似
此外,通用人工智能模型本身不支持特定任务,例如管理对话或从对话中推断用户的需求和愿望。因此,必须构建专用人工智能模型来支持特定应用程序。
以聊天机器人形式的认知人工智能助理的创建为例。认知人工智能助理建立在通用人工智能模型之上,由三个额外的认知人工智能引擎提供支持,以确保与用户进行有效和高效的交互。特别是,主动聆听对话引擎使人工智能助理能够正确解释用户的输入,包括场景中不完整和模棱两可的表达(图 6a)。它还使人工智能助理能够处理任意用户中断,并维护对话场景以完成任务(图 6b)。
图 6a. 示例展示了认知人工智能对话引擎如何处理不同响应场景中的相同用户输入
图 6b. 展示了认知人工智能对话引擎如何处理对话中的用户中断并能够维护场景和聊天流的一个示例
虽然对话引擎确保了富有成效的互动,但个人洞察推理引擎则可以更深入地了解每个用户,并实现更深入的个性化参与。作为个人学习伙伴或个人健康助理的人工智能助理可以鼓励其用户根据他们独特的个性特征坚持学习或研究课程,这是他们的独特之处(图 7)。
此外,对话特定的语言引擎可以帮助人工智能助理在对话过程中更好地解读用户表达。例如,情感分析引擎可以自动检测用户输入中表达的情感,而问题检测引擎可以识别用户输入是问题还是需要人工智能助理做出响应的请求。
构建在这里描述的任何人工智能模型或引擎都需要巨大的技能和努力。因此,非常需要使此类模型和引擎可重复使用。通过精心设计和实施,讨论过的所有认知人工智能引擎都可以重用。例如,主动倾听对话引擎可以用对话数据进行预训练,以检测不同的对话场景(例如用户正在找借口或澄清问题)。该引擎可以预先构建优化逻辑,在处理用户中断时始终尝试平衡用户体验和任务完成。
同样,结合项目反应理论 (IRT) 和大数据分析,个人洞察引擎可以根据个人数据进行预训练,这些数据体现了他们的沟通模式与其独特特征(例如,社交行为或现实世界的工作之间的关系表现)。然后,只要对话是用自然语言进行的,就可以重用该引擎来推断任何对话中的个人见解。
重用预建的人工智能功能单元(人工智能助理的功能)
通用人工智能模型和特定人工智能引擎可以为人工智能助理提供基础智能,而完整的人工智能解决方案需要完成特定任务或提供特定服务。例如,当人工智能面试官就特定主题(如图 1 所示)与求职者交谈时,其目标是从求职者那里获取有关该主题的相关信息,并使用收集到的信息来评估求职者是否适合某个工作角色。
因此,需要各种人工智能功能单元来支持特定的任务或服务。在认知人工智能助理的背景下,一种服务是与用户交互并满足他们的需求(例如完成交易)。例如,可以构建特定主题的人工智能通信单元,每个单元都可以让人工智能助理与用户就特定主题进行交流。因此,对话库将包含多个人工智能通信单元,每个单元都支持特定任务。
图 7 显示了一个示例人工智能通信单元,它使人工智能助理能够与用户(例如求职者)就特定主题进行对话。
图 7. 以人工智能通信单元为例,它使人工智能助理能够与其用户讨论特定主题。它包括多个条件操作(响应),人工智能助理可以根据用户在讨论期间的操作来执行这些操作。在这里可以检测用户动作,并且能够使用预训练的语言模型(例如架构底部两层提到的模型)生成人工智能动作
在基于模型的架构中,可以对人工智能功能单元进行预训练以直接重用。它们也可以通过合并新的条件和相应的动作来组合或扩展。
重复使用预先构建的人工智能解决方案(人工智能助理)
基于模型的认知人工智能架构的顶层是一组端到端的人工智能解决方案模板。在制作认知人工智能助理的背景下,这个顶层由各种人工智能助理模板组成。这些模板预先定义了人工智能助理要执行的特定任务流,以及在交互过程中支持人工智能功能的相关知识库。例如,人工智能求职面试模板包括一组人工智能助理与求职者交谈的面试问题,以及用于回答与工作相关的常见问题解答的知识库。类似地,人工智能个人健康管理员模板可以概述人工智能助理需要执行的一组任务,例如检查健康状况以及提供护理说明或提醒。
这样的模板可以直接重用以创建人工智能助理,还可以快速定制以满足特定需求。
可重用的人工智能支持无代码人工智能
在创建人工智能解决方案时,可重用的人工智能组件或系统不仅可以节省时间和精力,还可以快速、无代码地定制可重用的组件。由于每个人工智能解决方案都可能需要进行某些定制,因此无代码人工智能进一步促进人工智能的应用,并加快了人工智能系统的上市时间。以下是几个无需编码即可自定义可重用人工智能组件的示例。
人工智能解决方案模板无代码定制
假设人力资源招聘人员希望创建人工智能面试官。招聘人员可以重复使用人工智能面试官模板,即编辑模板中的面试问题或与工作相关的常见问题解答以构建自定义人工智能面试官(图 8a)。模板重用和无代码定制极大地简化了端到端人工智能解决方案的创建,特别是对于不知道如何编码或缺乏深厚 IT 技能的工作人员来说。
图 8a. 人工智能面试官模板的无代码定制,因此人工智能可以询问人力资源招聘人员设计的特定问题。在这里,招聘人员添加了“你最喜欢目前工作中的什么?”这个问题,现有的人工智能通信单元将自动处理有关此主题的讨论
人工智能功能单元无代码定制
继续以上面的例子为例,假设招聘人员希望人工智能面试官问求职者这个问题 “你最喜欢目前工作中的什么?”,如果应聘者的回答是“与客户互动”,那么招聘人员希望人工智能面试官提出一个后续问题,“你能举一个喜欢与客户互动的例子吗?”
由于没有任何预先构建的人工智能通信单元处理这种特定情况,招聘人员将需要自定义人工智能通信。如图 8b 所示,招聘人员可以通过指示用户响应和相应的人工智能面试官操作,包括后续问题来轻松做到这一点。同样,所有定制都可以在没有编码的情况下完成。
图 8b. 人工智能通信单元的无代码定制。在这里,如果用户在“你最喜欢目前工作中的什么?”问题的回答类似于“客户交互”,则人工智能面试官会回答并提出后续问题
上述示例展示了可重用人工智能模板或组件的无代码定制如何让任何非 IT 人员快速创建定制的人工智能解决方案。
无代码、可重用人工智能的未来发展方向
无代码、可重复使用的人工智能使强大的人工智能解决方案的创建和采用民主化,无需雇佣人工智能专业人员或采用成本昂贵的 IT 资源。为了使无代码、可重用的人工智能成为开发和采用人工智能解决方案的主要模式,必须在多个领域取得进展。
第一个领域是使可重复使用的人工智能组件和系统变得可解释。为了帮助非 IT 人员重用预先训练或预先构建人工智能组件和解决方案,至关重要的是打开“黑盒”并解释每个组件或解决方案内部的内容,包括优缺点。可解释的可重用人工智能不仅可以帮助人类更好地理解和利用现有的人工智能组件和系统,还可以帮助避免潜在的人工智能陷阱。例如,人力资源招聘人员在使用这种人工智能能力来推断求职者的见解之前,了解如何推断个人见解会很有帮助。
第二个方面是支持自动人工智能调试。随着人工智能解决方案变得越来越复杂,在多样化和复杂的情况下很难人工检查潜在的人工智能行为。非 IT 用户尤其需要帮助来评估人工智能解决方案(例如人工智能助理)并在正式部署之前对其进行改进。尽管有一些关于分析人工智能助理的初步研究,但未来还需要做更多的研究。
第三个领域是确保负责任地使用人工智能,特别是考虑到人工智能的民主化。例如,如果有人可以简单地重用人工智能功能单元来从用户那里获取敏感信息,那么谁来保护用户及其敏感信息,如何进行保护?除了测量准确性和稳健性等典型的人工智能性能之外,还需要采用新的措施和使用指南,以确保创建和部署值得信赖和安全的人工智能解决方案。
原文How no-code, reusable AI will bridge the AI divide,作者:Michelle Zhou
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341