专利名称:一种基于深度神经网络的声源定位方法及系统专利类型:发明专利发明人:张巧灵,唐柔冰,马晗申请号:CN202010050760.9申请日:20200117公开号:CN111239687A公开日:20200605
摘要:本发明公开了定位方法,包括:S1.获取麦克风接收的语音信号,并生成语音数据集;S2.对语音数据集内的语音信号进行预处理;S3.计算语音信号对应的声源信号的相位加权广义互相关函数;S4.获取相位加权广义互相关函数波峰对应的时延信息,将时延信息作为声源信号到达麦克风的TDOA观测值;获取时延信息对应的幅值;S5.将TDOA观测值与幅值结合作为输入向量,将声源信号对应的三维空间位置坐标作为输出向量,结合输入向量和输出向量生成特征向量;S6.对特征向量进行预处理;S7.设置深度神经网络相关的参数,并用训练集的特征向量训练深度神经网络,得到训练好的深度神经网络;S8.将测试集的输入向量传入训练好的深度神经网络进行预测,得到声源信号的三维空间坐标。
申请人:浙江理工大学
地址:310018 浙江省杭州市江干区下沙2号大街928号
国籍:CN
代理机构:浙江千克知识产权代理有限公司
代理人:周希良
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容