quanttide / quanttide-tutorial-of-digital-economics

量潮数字经济学教程

https://quanttide.github.io/quanttide-tutorial-of-digital-economics/

0 stars 0 forks source link

人工智能章简介教学大纲 #3

Open Guo-Zhang opened 9 months ago

Guo-Zhang commented 9 months ago

提纲

定义人工智能。人工智能不等于机器学习，实际上人工智能包括人工编写规则和机器学习两种路线，只不过由于后者的发展飞速，大家默认把后者作为等同。我们可以认为机器学习是人工智能的主要方法。
科普机器学习、深度学习等相关算法技术。
介绍生成式人工智能，本章重点。大语言模型、CV大模型等等。以及常用的应用场景等等。

Guo-Zhang commented 9 months ago

什么是人工智能？

人工智能（Artificial Intelligence，简称AI）是一门研究如何使计算机系统能够执行一些通常需要人类智能的任务的学科。这包括学习、推理、问题解决、感知和语言理解等方面的能力。人工智能旨在创建能够模拟和执行人类智能任务的智能体，这些任务包括但不限于视觉感知、语音识别、自然语言处理、决策制定等。

人工智能的方法主要分为两类：一种是基于规则的传统人工智能，通过事先编写的规则和知识库来执行任务；另一种是机器学习，它使计算机能够从数据中学习并改进执行任务的性能，而无需明确编写规则。

总体而言，人工智能的目标是使计算机系统表现出一定程度的智能，能够适应不同的环境、学习新的任务，并执行类似人类智能的复杂任务。

主要分支

自然语言处理（Natural Language Processing，NLP）： NLP 是致力于让计算机理解、解释、处理和生成人类语言的领域。该领域涵盖了文本分析、语音识别、语言生成等方面。
计算机视觉（Computer Vision）：计算机视觉研究如何使计算机系统能够理解和解释视觉信息。这包括图像识别、物体检测、人脸识别等任务。
语音识别（Speech Recognition）：语音识别致力于让计算机能够理解和解释语音输入，通常应用于语音助手和语音控制系统。

Guo-Zhang commented 9 months ago

什么是机器学习？

机器学习（Machine Learning，简称ML）是人工智能的一个分支，研究计算机系统如何通过从数据中学习改进性能，而无需进行明确的编程。机器学习使计算机系统能够自动识别模式、提取知识、进行预测和做出决策。

在机器学习中，系统通过对大量数据进行学习，发现数据中的规律和模式，并生成模型以应对新的、以前未见过的数据。机器学习的方法主要分为监督学习、无监督学习、半监督学习和强化学习等几类。

监督学习： 训练数据包括输入和对应的输出，系统通过学习输入与输出之间的映射关系来进行预测。常见的监督学习任务包括分类和回归。
无监督学习： 训练数据只包含输入，系统需要自行发现数据中的模式和结构。无监督学习的任务包括聚类、降维和关联规则挖掘等。
半监督学习： 训练数据包含一部分带有标签的数据和一部分无标签的数据，系统通过这两部分数据进行学习。
强化学习： 系统通过与环境的交互学习，通过尝试和错误来优化行为，以达到最大化预期的累积奖励。

机器学习在众多领域取得了显著的成就，包括语音识别、图像处理、自然语言处理、医学诊断等。

Guo-Zhang commented 9 months ago

什么是生成式人工智能？

生成式人工智能（Generative Artificial Intelligence）是人工智能领域的一个分支，其主要目标是通过模型学习数据的分布，进而生成新的、与训练数据相似的数据。生成式人工智能侧重于创造性地生成内容，例如图像、文本、音频等，而不仅仅是在给定输入条件下做出预测或分类。

生成式人工智能的方法通常涉及到使用概率模型来描述输入数据的分布，然后利用这个模型生成新的数据样本。生成式模型的代表性算法包括：

生成对抗网络（GAN）： GAN 是一种通过竞争性学习的框架，包含一个生成器和一个判别器。生成器试图生成逼真的数据，而判别器则尝试区分生成的数据和真实数据。这种竞争促使生成器不断改进生成的数据，使其更难以被判别。
变分自编码器（VAE）： VAE 是一种概率生成模型，尝试通过学习输入数据的潜在分布来生成新的数据。它基于潜在变量的思想，使得模型可以学习生成不同但相似于训练数据的样本。
大语言模型： 大语言模型，如GPT（生成式预训练），是使用神经网络训练的生成式模型，可以生成与输入文本风格和内容相似的新文本。

生成式人工智能在艺术创作、图像生成、文本生成、音乐创作等领域展现出巨大的创造潜力，同时也提出了一些伦理和隐私的问题，因为这些模型可以生成高度逼真的虚构内容。

Guo-Zhang commented 9 months ago

什么是自然语言处理？

自然语言处理（Natural Language Processing，简称NLP）是人工智能领域的一个分支，旨在使计算机能够理解、解释、处理和生成人类语言。这包括书面文本和口头语言。NLP 的目标是让计算机能够像人类一样理解语言的含义，并能够与人类进行自然而流畅的交流。

NLP 的主要任务和应用包括：

文本分析： 分析和理解书面文本，包括词汇分析、语法分析和语义分析。
情感分析： 识别和理解文本中的情感色彩，判断文本作者的情感倾向，通常用于社交媒体评论、产品评论等领域。
语音识别： 将口头语言转换为文本，使计算机能够理解和处理口头输入。
机器翻译： 将文本从一种语言翻译成另一种语言，实现跨语言交流。
问题回答系统： 基于自然语言理解，回答用户提出的问题，常见于虚拟助手和搜索引擎。
对话系统： 实现与计算机的自然对话，使计算机能够理解用户的语言并做出相应的回应。
信息提取： 从大量文本中提取有关特定主题或实体的关键信息。
文本生成： 利用模型生成自然、连贯的文本，如自动写作、文章摘要等。

NLP 使用各种技术和方法，包括机器学习、深度学习、统计学等，以实现对语言的深度理解和处理。随着技术的不断发展，NLP 在许多领域取得了显著的进展，为人机交互提供了更自然、智能的方式。

Guo-Zhang commented 9 months ago

什么是计算机视觉？

计算机视觉（Computer Vision，简称CV）是人工智能领域的一个分支，旨在使计算机能够获取、理解和解释图像或视频数据。计算机视觉的目标是让计算机能够模拟人类视觉系统的功能，实现对视觉信息的高级理解。

计算机视觉的主要任务和应用包括：

图像分类： 将图像分为不同的类别，常用于图像识别和分类任务。
目标检测： 在图像或视频中识别和定位特定目标，如人脸、车辆等。
图像分割： 将图像划分为若干个区域，每个区域属于特定的对象或类别。
人脸识别： 识别和验证图像或视频中的人脸信息。
物体识别： 辨别图像或视频中的各种物体，可以是一般的物体或特定的产品。
动作识别： 识别和理解图像或视频中的人体动作。
三维重建： 基于二维图像数据还原出三维场景的结构。
虚拟增强现实： 将虚拟对象叠加在真实世界中，实现虚拟增强的视觉体验。

计算机视觉使用了各种技术和方法，包括图像处理、模式识别、深度学习等，以实现对图像和视频数据的高效分析和理解。计算机视觉在自动驾驶、人机交互、医学影像分析等领域有着广泛的应用，为提高计算机对视觉信息的理解能力提供了强大的工具。

Guo-Zhang commented 9 months ago

什么是语音识别？

语音识别（Speech Recognition）是一种人工智能技术，旨在使计算机能够理解和解释口头语言，将语音转换为可识别的文本或命令。这项技术使得用户能够通过声音与计算机进行交互，而无需使用键盘或鼠标。

语音识别系统的工作原理包括以下关键步骤：

录音： 首先，系统通过麦克风等设备录制用户的语音输入。
特征提取： 语音信号被转换为数字形式，并提取其中的特征，如频率、声调等。
声学模型： 声学模型用于表示语音中各个声音单元（音素）的模式。这些模型通过训练数据学习，以便系统能够辨识不同的音频特征。
语言模型： 语言模型考虑了单词之间的语法和语境关系，有助于识别出最有可能的文本序列。
解码： 在解码阶段，系统使用声学模型和语言模型对提取的特征进行匹配，以确定最可能的文本结果。
输出： 最终，语音识别系统将识别的文本输出，供后续处理或响应用户。

语音识别技术在语音助手、语音搜索、语音命令、电话客服系统等方面得到广泛应用。其发展得益于深度学习和神经网络等技术的进步，使得语音识别系统在处理不同语音特征和语音环境时表现更为准确和可靠。