当前位置: 首页 > 工程管理前沿 > 2020年01期 > 潮汕地区口音声纹特征研究

工程管理前沿【2020年第01期】

  • ID:271612
  • 浏览:158
  • 学科:工程地质学
  • 更新时间:2020-03-28 22:51:50
  • 期刊: 工程管理前沿
内容简介
《工程管理前沿》杂志是由中国工程院主管,中国工程院、清华大学、高等教育出版社主办的建筑期刊。国际标准刊号:2095-7513,国内统一刊号:CN10-1205/N。《工程管理前沿》的办刊宗旨:依托建设领域高层权威信息背景,旨在做好政府领导决策的重要参谋;成为政策理论探讨的前沿阵地,积极探索和引导建设事业发展方向和改革实践;提供重大事件权威报道,深度阐释焦点话题,纵深调查热点事件,努力追求权威性、建设性、实用性和可读性风格;努力做大媒介传播平台,真诚为建设企事业单位服务,为中国建设事业和城市化发展服务,为广大读者开启一个探求知识的窗口。

潮汕地区口音声纹特征研究

2019/8/9 15:17:00 工程地质学 庄丹杰,陈昱文,蔡耀
资料简介

摘要:声纹鉴定是一种针对声音和语言进行个体同一识别的鉴定技术,通过对声纹细节特征的量化后进行语音特征的识别能给案件侦查提供一定的帮助。随着电信诈骗、网络诈骗、变声技术的出现,声纹鉴定在公安工作中越来越重要。本文在技术强警的大背景下,以地方方言口音对普通话的影响为切入点,针对潮汕地区特有的普通话发音对其语音共振峰进行研究,发现了潮汕地区发音的几个特点,研究结束后能通过语音对是否潮汕地区发音进行地区识别判断。

潮汕地区口音声纹特征研究

庄丹杰 陈昱文 蔡耀东 余立鑫 林哲涵

广东警官学院 刑事科学技术系 广东省广州市 510440

摘要:声纹鉴定是一种针对声音和语言进行个体同一识别的鉴定技术,通过对声纹细节特征的量化后进行语音特征的识别能给案件侦查提供一定的帮助。随着电信诈骗、网络诈骗、变声技术的出现,声纹鉴定在公安工作中越来越重要。本文在技术强警的大背景下,以地方方言口音对普通话的影响为切入点,针对潮汕地区特有的普通话发音对其语音共振峰进行研究,发现了潮汕地区发音的几个特点,研究结束后能通过语音对是否潮汕地区发音进行地区识别判断。

关键词:声纹鉴定 声纹特征 潮汕地区 方言发音

1 前言

声纹鉴定设计生理学、物理学、语音学、计算机学等学科,是一项综合性很强的技术鉴定工作。它是随着刑事侦破,司法审判而发展起来的,在我国司断案具有十分深远的影响。由于声纹是根据人类的声波进行判断的物理量,所以具有客观性与科学性。声纹鉴定是将人类的声波绘制成声纹图谱,检验时只需将可以的声纹图谱与嫌疑人的进行对比就可判断此人是否是嫌疑人。

当前一些诈骗、恐吓、勒索等犯罪活动都会进行言语的沟通,这就会留下犯罪分子的视听数据。这些录音可以通过声谱仪等工具将其量化,制作出声音变化的图像,即声纹图谱。潮汕地区具有自身的方言,随着文化的融合和反哺,潮汕地区人们的普通话多多少少也存在一些方言母语的发音特点。探讨和研究潮汕地区普通话发音的特点能够进一步为警察提供犯罪嫌疑人的家乡信息,进一步明确案件侦查方向,缩小排查范围,节约侦查时间。

2 实验

本文通过采集大量的潮汕地区人们的普通话音频以及持有二甲以上普通话证书的相同文本的音频。通过分析其声音图谱的共振峰,从而发现其中的本质性差异点。

本实验共对比观察了三组词语的声纹图谱,每组词语均在一整句话的中间,再通过音频软件截取出该词语对应时段的音频,将音频制作成声纹共振峰的图谱进行必对。最后对所有的实验结果进行整理个分析,研判出其声纹的本质性差异点。

2.1实验步骤

在安静的环境下,为了使每一个字的共振峰数据客观,要求发音人每个词读3 遍。使用ASUS FX80G笔记本电脑,声卡为Realtek High Definition Audio,麦克风为Audio Technica XM5S;使用Adobe Audition CC 2018录音软件进行录音,采样率是22 050Hz,采样精度是16 bit,单声道,并用Praat 软件进行分析。

选取录音效果较好的6个声源作为采集数据的样本,对每个样本的元音逐一进行标注,并用Praat 软件逐一提取第一共振峰(F1)、第二共振峰(F2)、第三共振峰(F3)的数据。

2.2实验结果

通过大量的实验,在剔除了特殊样本等不合格样本后,选取了“拿来”一词发音的共振峰图谱,大部分的共振峰图谱如图1所示。其中,“拿”字的K1、K2线波动尤为明显,“来”字的K1线呈轻微起伏状。

5e79d614e5e7c_html_86eb82826364ac0d.png

图1

而“拿来”一次标准发音的共振峰图谱如图2所示,除“拿”字发音K2线中间有个小峰外,其余的均较为平整。

5e79d614e5e7c_html_9ec32e0add045485.png

图2

2.3实验分析

通过图1图2的共振峰谱图,我们可以得知,潮汕本地人关于“拿来”一词的发音较标准发音之间的差别主要存在于K1及K2线上,对于该词K1共振峰波动较大的可初步认定为非标准普通话发音。

3 总结

通过本实验基本可以分辨出潮汕地区普通话重点词语的发音与标准普通话发音之间存在的本质性差异,为公安工作中的信息研判等工作提供强有力的技术支持。但受经费、实验样本等现实条件的限制,本实验无法通过庞大的数据支持来针对常用的词汇及语句进行细致的研究。

参考文献:

[1]熊洁.声纹鉴定理论与实验[J].电声技术,2018,42(04):73-75.

[2]杨璐铭,蓝常山,张学海.声纹鉴定中语音样本采集的问题分析[J].广东公安科技,2018,26(01):49-50.

[3]贾丽文.音量增大时语音的长时共振峰分布特征变化及其对声纹鉴定的影响[J].山西大同大学学报(自然科学版),2017,33(01):24-28+46.

[4]李高翔.数字声纹识别技术在刑侦工作中的实践运用探讨[J].科技展望,2016,26(36):133.

[5]李红普.言语识别中声纹鉴定的进展与反思[J].科技展望,2016,26(21):280.

[6]夏碧婷,邱添.声纹鉴定及其在诉讼中的运用[J].法制与社会,2014(34):127-128+130.

[7]曹洪林,孔江平.长时共振峰分布特征在声纹鉴定中的应用[J].中国司法鉴定,2013(01):62-67.