每个人都应该了解的人工智能词汇表

file
人工智能（AI）是最新的技术革命。正如加密货币热潮让全世界接触到了大量新的术语一样，AI的热潮也带来了一系列频繁使用但并非总是得到解释的术语。如果你对聊天机器人（chatbot）和大型语言模型（LLM）之间的区别，或者深度学习和机器学习之间的区别感到困惑，你来对地方了：以下是20个与AI相关的术语表，以及针对新手的友好解释，说明这些术语的含义。

人工智能（AI）

简单来说，人工智能是计算机或机器中的智能，特别是模仿人类智能的那种。人工智能是一个广泛的术语，涵盖了多种不同类型的机器智能，但目前关于人工智能的讨论主要集中在创造艺术、内容以及总结和转录内容的工具上。将这些工具称为“智能”还有待商榷，但“人工智能”这个词已经深入人心。

算法（Algorithm）

算法是一组指令，程序遵循这些指令来得出结果。算法的常见示例包括搜索引擎，它根据用户的查询显示一系列结果，或者社交媒体应用程序，它根据用户的兴趣显示内容。算法使AI工具能够创建预测模型，或者基于用户的输入创建内容或艺术。

偏差（Bias）

在人工智能的背景下，偏差指的是由于算法做出错误假设或缺乏足够数据而产生的错误结果。例如，语音识别工具可能无法正确理解某些英语口音，因为这些工具只使用美国口音进行了训练。

对话式人工智能（Conversational AI）

你可以与之交谈的AI工具，如聊天机器人或语音助手，被称为对话式人工智能。如果你自己向助手提问，那么这就是对话式人工智能。

数据挖掘（Data mining）

数据挖掘是梳理大量数据集以发现模式或趋势的过程。一些AI工具使用数据挖掘来帮助你理解是什么让人们在商店或网站上购买更多商品，或者如何在高峰时段优化业务以满足增加的需求。

深度学习（Deep learning）

深度学习试图通过利用三个或更多的神经网络“层”来处理大量数据，并以示例学习的方式重现人类大脑的学习方式。这些层各自处理它们对给定数据的看法，并汇集起来以得出最终结论。

自动驾驶汽车的软件使用深度学习来识别停车标志、车道标记和交通信号灯，这是通过对象识别来实现的：向AI工具展示许多特定对象的示例（例如，一个停车标志），并通过反复训练，AI工具最终将能够以尽可能接近100%的准确度识别该对象。

大型语言模型（LLM）

大型语言模型（LLM）是一种深度学习算法，它在庞大的数据集上进行训练，以生成、翻译和处理文本。LLM（如OpenAI的GPT-4）使AI工具能够理解你的查询，并基于这些查询生成文本输入。LLM还为能够识别文本或视频重要部分并为你总结它们的AI工具提供支持。

生成式人工智能（Generative AI）

生成式人工智能可以根据你的输入生成艺术、图像、文本或其他结果，这些输入通常是由大型语言模型（LLM）驱动的。它已经成为当前许多公司正在将其添加到其产品中的AI技术的统称。例如，一个生成式AI模型可以通过几个文本提示生成图像，或者将竖屏照片转换为宽屏壁纸。

幻觉（Hallucination）

当AI将虚构内容呈现为事实时，我们称之为产生幻觉。当AI的数据集不准确或训练存在缺陷时，可能会产生幻觉，因此它会基于其可用知识输出一个它确信的答案。也就是说，由于AI基于复杂的网络结构，我们不一定能理解每个幻觉的例子。smartlabs网站的作者eric对于发现AI幻觉给出了很好的建议。

图像识别（Image recognition）

图像识别是指识别图像中特定对象的能力。计算机程序可以使用图像识别来识别图像中的花朵并命名它们，或者识别照片中不同种类的鸟类。

机器学习（Machine learning）

当算法能够通过学习经验或数据来改进自身时，这被称为机器学习。机器学习是我们所讨论的其他AI术语的基础：深度学习是机器学习的一种形式，大型语言模型则是通过机器学习进行训练的。

自然语言处理（Natural language processing）

当程序能够理解以人类语言编写的输入时，它就属于自然语言处理的范畴。这就是你的日历应用程序如何理解当你写下“我明天晚上8点在第五大道的咖啡店有个会议”时该做什么，或者当你问Siri“今天天气怎么样？”时它是如何理解的。

神经网络（Neural networks）

人类的大脑有着层层神经元，不断地处理信息并从中学习。AI神经网络模仿这种神经元结构来从数据集中学习。神经网络是使机器学习和深度学习得以实现的系统，并最终使机器能够执行复杂的任务，如图像识别和文本生成。

光学字符识别（OCR）

通过OCR可以从图像中提取文本。支持OCR的程序可以识别手写或键入的文本，并允许你复制和粘贴这些文本。

提示工程（Prompt engineering）

提示是任何一系列用于从程序（如生成式AI）获取响应的词语。在AI的语境中，提示工程是编写提示以让聊天机器人给出最有用响应的艺术。这也是一个人们被聘请来构思创意提示以测试AI工具并识别其限制和弱点的领域。

从人类反馈中强化学习（RLHF）

RLHF是通过人类的反馈来训练AI的过程。当AI给出错误的结果时，人类会向它展示正确的响应应该是什么。这允许AI比没有反馈时更快地提供准确和有用的结果。

语音识别（Speech recognition）

一个程序理解人类语言的能力。语音识别可用于对话式AI来理解你的查询并提供响应，或者用于语音转文本工具来理解口头语言并将其转换为文本。

标记（Token）

当你将文本查询输入到AI工具中时，它会将这个文本分解成标记（token），即文本中常见的字符序列，然后由AI程序进行处理。例如，如果你使用GPT模型，其定价是基于它处理的标记数量来确定的：你可以使用公司的标记化工具来计算这个数量，该工具还会显示单词是如何被分解成标记的。OpenAI表示，一个标记大致相当于四个字符的文本。

训练数据（Training data）

训练集或训练数据是算法或机器学习工具用来学习和执行其功能的信息。例如，大型语言模型可能会通过抓取一些世界上最受欢迎的网站来收集文本、查询和人类表达，从而使用训练数据。

图灵测试（Turing Test）

艾伦·图灵（Alan Turing）是一位英国数学家，被誉为“理论计算机科学和人工智能之父”。他的图灵测试（或“模仿游戏”）旨在判断计算机的智力是否与人类相同。当人类被误导，认为机器的回答是由人类编写时，这台计算机就被认为通过了图灵测试。