虽说现在的监控大多也能收录音频,不过这是哪儿?酒吧啊!
整个儿一噪音集中营!
台上还唱着呢,隔了一两米基本就根本听不清了,更何况距离那么远?
然而刚刚耳麦里传来的声音却是无比清晰,连个杂音都没有……
这就很神奇了。
【我的算法核心包括“图像识别”和“语音识别”。
这里的背景噪音干扰很强,但是我可以过滤杂音,单独提取目标音频信号。
虽然受限于音频接收硬件的灵敏度只能使用模糊算法,不能做到百分百还原。
但是人类说话时面部肌肉和唇形是有规律的,我可以识别并建立相应模型,从而判断他们说了什么。
最后只要将两者结果进行相互验证,还原准确率可以达到95%以上。
内容未完,下一页继续阅读