自然语言才是人类最擅长的沟通方式
更易用
自然语言界面直观易懂,特别适合那些不熟悉编程语言的非技术用户。
更高效
自然语言界面使用户能够快速、轻松地完成任务,无需在复杂的菜单或界面中进行导航,从而节省时间并提高生产力。
对残障人士更友好
自然语言交互对于患有残疾的用户很有帮助,例如只能使用语音命令与计算机交互的盲人用户。
更灵活适用
自然语言界面可以广泛应用于各种应用程序,从语音助手如 Siri 和小爱同学,到聊天机器人和客户服务系统。
更是心智模型的翻转
自然语言交互设计意味着,无论用户的心智模型如何,计算机系统都能快速适应用户,而不是基于GUI标准设计的通用心智模型,让用户去适应系统。这种交互设计颠覆了传统的心智模型依赖关系,因为大语言模型的训练集是一个庞大的心智模型,可以根据不同用户的需求进行调整,无论用户是年轻人还是老年人,是否精通计算机。
如何构建基于自然语言
的交互方式
大型语言模型的问世让构建基于自然语言的交互方式变得简单,只需要理解和应用相应的模型,就可以实现与用户的自然语言交互。
选用合适的大语言模型
像BERT或GPT这样的预训练语言模型是在大型语言数据集上进行训练的,它们通过完成语言建模任务(预测句子中缺失的词汇)以及其他任务来获得对世界的认知 。大语言模型具备了理解、生成、逻辑、记忆等人工智能的核心基础能力。
向量化知识库
大型语言模型是建立在对世界的普适性认知智基础上的,缺乏对特定领域的深入了解,因此需要向量化领域知识作为对该领域的认知补充。
内容检索
现在,领域知识已被存储为向量,我们将用户输入也采用相同的编码器进行向量化,使其与知识库处于同一向量空间中,从而使得欧几里德距离和余弦相似性等测量值具有实际意义。接下来,我们可以使用余弦相似性从索引矩阵中找到与用户输入最相关的内容。
实现短期记忆
大语言模型不同于人类,是没有短期记忆的,因此本身并不支持根据上下文理解用户的输入。我们需要采用记忆力组件等工具使其具备短期记忆能力。
函数调用
无论是哪种交互方式,我们都希望计算机能够按照我们的期望完成任务。除了知识问答,我们还需要计算机执行更加复杂的任务,这时就需要使用函数调用了。通过调用外部函数,大语言模型可以访问数据库中的数据,进行复杂的计算,还可以与其他系统进行交互。