首页>>人工智能->人工智能识别方式有哪些(2023年最新整理)

人工智能识别方式有哪些(2023年最新整理)

时间:2023-12-04 本站 点击:0

导读:本篇文章首席CTO笔记来给大家介绍有关人工智能识别方式有哪些的相关内容,希望对大家有所帮助,一起来看看吧。

人工智能都有哪些技术?

1、计算机视觉

人们认识世界, 91%是通过视觉来实现。同样, 计算机视觉的最终目标就是让计算机能够像人一样通过视觉来认识和了解世界, 它主要是通过算法对图像进行识别分析, 目前计算机视觉最广泛的应用是人脸识别和图像识别。相关技术具体包括图像分类、目标跟踪、语义分割。

2、 机器学习

机器学习的基本思想是通过计算机对数据的学习来提升自身性能的算法。机器学习中需要解决的最重要的4类问题是预测、聚类、分类和降维。机器学习按照学习方法分类可分为:监督学习、无监督学习、半监督学习和强化学习。

3、自然语言处理

自然语言处理 (NLP) [30]是指计算机拥有识别理解人类文本语言的能力, 是计算机科学与人类语言学的交叉学科。自然语言是人与动物之间的最大区别, 人类的思维建立在语言之上, 所以自然语言处理也就代表了人工智能的最终目标。机器若想实现真正的智能自然语言处理是必不可少的一环。自然语言处理分为语法语义分析、信息抽取、文本挖掘、信息检索、机器翻译、问答系统和对话系统7个方向。自然语言处理主要有5类技术, 分别是分类、匹配、翻译、结构预测及序列决策过程。

4、语音识别

现在人类对机器的运用已经到了一个极高的状态, 所以人们对于机器运用的便捷化也有了依赖。采用语言支配机器的方式是一种十分便捷的形式。语音识别技术是将人类的语音输入转换为一种机器可以理解的语言, 或者转换为自然语言的一种过程。

一般来说人工智能技术包括什么?

人工智能包括五大核心技术:

1.计算机视觉:计算机视觉技术运用由图像处理操作及机器学习等技术所组成的序列来将图像分析任务分解为便于管理的小块任务。

2.机器学习:机器学习是从数据中自动发现模式,模式一旦被发现便可以做预测,处理的数据越多,预测也会越准确。

3.自然语言处理:对自然语言文本的处理是指计算机拥有的与人类类似的对文本进行处理的能力。例如自动识别文档中被提及的人物、地点等,或将合同中的条款提取出来制作成表。

4.机器人技术:近年来,随着算法等核心技术提升,机器人取得重要突破。例如无人机、家务机器人、医疗机器人等。

5.生物识别技术:生物识别可融合计算机、光学、声学、生物传感器、生物统计学,利用人体固有的生体特性如指纹、人脸、虹膜、静脉、声音、步态等进行个人身份鉴定,最初运用于司法鉴定。

人工智能—语音识别过程与识别方法

语音识别是完成语音到文字的转换。自然语言理解是完成文字 到语义的转换。语音合成是用语音方式输出用户想要的信息,用语音实现人与计算机之间的交互,主要包括语音识别、自然语言理解和语音合成。

相对于机器翻译,语音识别是更加困难的问题。机器翻译系统的输入通常是印刷文本,计算 机能清楚地区分单词和单词串。而语音识别系统的输入是语音,其复杂度要大得多,特别是口语 有很多的不确定性。人与人交流时,往往是根据上下文提供的信息猜测对方所说的是哪一个单 词,还可以根据对方使用的音调、面部表情和手势等来得到很多信息。特别是说话者会经常更正所说过的话,而且会使用不同的词来重复某些信息。显然,要使计算机像人一样识别语音是很困难的。 

语音识别过程包括从一段连续声波中采样,将每个采样值量化,得到声波的压缩数字化表 示。采样值位于重叠的帧中,对于每一帧,抽取出一个描述频谱内容的特征向量。然后,根据语音信号的特征识别语音所代表的单词,语音识别过程主要分为五步,如下:

01

语音信号采集

语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为 电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。

目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声 卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功 能。而且,现代操作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。

对于现场环境不好,或者空间受到限制,特别是对于许多专用设备,目前广泛采用基于单片机、DSP芯片的语音信号采集与处理系统。

02

语音信号预处理

语音信号号在采集后首先要进行滤波、A/D变换,预加重(Preemphasis)和端点检测等预处理, 然后才能进入识别、合成、增强等实际应用。

滤波的目的有两个:一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止 混叠干扰;二是抑制50 Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。

A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信 号值与原信号值之间的差值为量化误差,又称为量化噪声。

预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带 中,能用同样的信噪比求频谱,便于频谱分析。

端点检测是从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能减 少处理时间,而且能排除无声段的噪声干扰。目前主要有两类方法:时域特征方法和频域特征方 法。时域特征方法是利用语音音量和过零率进行端点检测,计算量小,但对气音会造成误判,不 同的音量计算也会造成检测结果不同。频域特征方法是用声音的频谱的变异和熵的检测进行语 音检测,计算量较大。

03

语音信号的特征参数提取

人说话的频率在10 kHz以下。根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。一般将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢失,应该使帧有重叠。例如,当使用20kH*的采样频率时,标准的一帧为10 ms,包含200个采样值。

话筒等语音输入设备可以采集到声波波形。虽然这些声音的波形包含了所 需单词的信息,但用肉眼观察这些波形却得不到多少信息因此,需要从采样数据中抽取那些能 够帮助辨别单词的特征信息。在语音识别中,常用线性预测编码 技术抽取语音特征。

线性预测编码的基本思想是:语音信号采样点之间存在相关性,可用过去的若干采样点的线 性组合预测当前和将来的采样点值。线性预测系数埽以通过使预测信号和实际信号之间的均方误差最小来唯一确定。

语音线性预测系数作为语音信号的一种特征参数,已经广泛应用于语音处理各个领域。

04

向置量化

向量量化(Vector Quantization,VQ)技术是20世纪W年代后期发展起来的一种数据压缩和 编码技术。经过向量量化的特征向量也可以作为后面隐马尔可夫模型中的输入观察符号。

在标量量化中整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入 的标量信号,量化时落入小区间的值就用这个代表值[戈替。因为这时的信号量是一维的标量,所 以称为标量量化。

向量量化的概念是用线性空间的观点[,把标量改为一维的向量,对向量进行量化。和标量量化一样,向量量化是把向量空间分成若干个小区域,每个小区域寻找一个代表向量,量化时落入 小区域的向量就用这个代表向量代替。

向量量化的基本原理是将若干个标量数据组成一个向量(或者是从一帧语音数据中提取的 特征向量)在多维空间给予整体量化,从而可以在信息量损失较小的情况下压缩数据量。

05

语音识别

当提取声音特征集合以后,就可以识别这些特征所代表的单词。本节重点关注单个单词的 识别。识别系统的输入是从语音信号中提取出的特征参数,如LPC预测编码参数,当然,单词对 应于字母序列。语音识别所采用的方法一般有模板匹配法、随机模型法和概率语法分析法三种。这三种方法都是建立在最大似然决策贝叶斯(Bayes)判决的基础上的。

( 1 ) 模板(template)匹配法

在训练阶段,用户将词汇表中的每一个词依次说一遍,并且将其特征向量作为模板存入模板 库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将 相似度最高者作为识别结果输出。

( 2 ) 随机模型法

随机模型法是目前语音识别研究的主流。其突出的代表是隐马尔可夫模型。语音信号在足 够短的时间段上的信号特征近似于稳定,而总的过程可看成是依次相对稳定的某一特性过渡到 另一特性。隐马尔可夫模型则用概率统计的方法来描述这样一种时变的过程。

( 3 ) 概率语法分析法

这种方法是用于大长度范围的连续语音识别。语音学家通过研究不同的语音语谱图及其变 化发现,虽然不同的人说同一些语音时,相应的语谱及其变化有种种差异,但是总有一些共同的 特点足以使他们区别于其他语音,也即语音学家提出的“区别性特征”。另一方面,人类的语言 要受词法、语法、语义等约束,人在识别语音的过程中充分应用了这些约束以及对话环境的有关 信息。于是,将语音识别专家提出的“区别性特征”与来自构词、句法、语义等语用约束相互结 合,就可以构成一个“自底向上”或“自顶向下”的交互作用的知识系统,不同层次的知识可以用 若干规则来描述。

除了上面的三种语音识别方法外,还有许多其他的语音识别方法。例如,基于人工神经网络 的语音识别方法,是目前的一个研究热点。目前用于语音识别研究的神经网络有BP神经网络、 Kohcmen特征映射神经网络等,特别是深度学习用于语音识别取得了长足的进步。

找我获取IT技术干货

人工智能识别技术你了解多少?

人工智能识别技术是指通过计算机、照相机、扫描仪等设备,自动获取并识别出目标指令、数据等信息的技术手段。最早起源于声控技术(语音识别技术),声控技术曾被广泛应用于智能手机的控制和互动中,其核心是将人的语音识别出来,与手机指令集进行对比,从而控制手机。

根据识别对象是否具有生命特征,人工智能识别技术主要可分为两类:有生命识别和无生命识别。

有生命人工智能识别技术实质是指与人体生命特征存在一定关联的技术,包括语音识别、指纹识别、人脸识别、虹膜识别等。语音识别技术工作原理是基于对识别者自身发出语音的科学有效识别,正确识别出语音的内容,或者通过语音判断出说话人的身份(说活人识别);人工智能指纹识别技术在实践应用中,其工作原理是通过对人体指纹展开智能识别,最终正确判断识别出指纹所属的对应的人,从而满足实际需求;人工智能人脸识别技术是基于对人的脸部展开智能识别,对人的脸部不同结构特征进行科学合理检验,最终明确判断识别出检验者的实际身份;虹膜识别是通过虹膜的特征判断其实际身份。

无生命识别技术实质是指与人体生命特征不存在任何关联的技术,该项技术主要包括射频识别技术、智能卡技术、条形码识别技术。射频识别技术的工作核心是无线电磁波,其具体的工作原理是:无线电信号在电磁场下进行传送,完成数据和标签的识别;条形码识别技术包括一维码技术和二维码技术,二维码技术是在一维码技术基础之上发展出来的,给数据储存留下的空间更大,同时还可以纠错,在信息标示和信息采集中具有十分有效的运用;智能卡识别技术的识别对象主要是智能卡,智能卡主要是由集成电路板组成的,其工作主要是针对数据展开的运算和储存,通过将计算技术良好的融入到智能卡当中,针对数据进行的各种工作都做到了高效完成。

人工智能识别技术的应用非常广泛,而且不同种类的人工智能识别技术已经应用到了 社会 各领域,例如在语言翻译、面部识别等多个 社会 活动中都能够看到计算机人工智能的参与。除此之外,二维码识别和使用是人工智能识别技术运用的最典型的方式,它的利用主要是以二维码的形式生成程序和指令,在用户的移动终端屏幕上生成黑白格子拼接的平面图形,这些平面图形的分布通常来说具有一定的规律性,通过各种图形的排列组合,二维码图案具有唯一性,因此用户可以对二维码图案进行保存和记录。

我们相信,随着研究人员不断地对人工智能的有关技术进行优化和创新,人工智能识别技术将会更大程度地满足人们工作和生活需求。

本文由北京信息 科技 大学通信学院副教授李红莲进行科学性把关。

科普中国中央厨房

新华网科普事业部

科普中国-科学原理一点通

联合出品

更多精彩内容,请下载科普中国客户端。

结语:以上就是首席CTO笔记为大家整理的关于人工智能识别方式有哪些的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于人工智能识别方式有哪些的相关内容别忘了在本站进行查找喔。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/AI/11834.html