下载地址: http://download.csdn.net/detail/fzxy002763/4082023
算法不是原创的,由于网上流传版本很多,不过都是独立给出一些m文件,不完整,故笔者整理了一下,调试通过,方便大家学习下dtw算法。
其中dtw_test是测试文件,其他皆为function文件
disp('正在计算参考模板的参数...') for i=1:5 fname = sprintf('%da.wav',i); x=fname; [x,fs]=wavread(x); [x1 x2] = vad(x); m = mfcc(x); m = m(x1-2:x2-2,:); ref(i).mfcc = m; % soundview(x); end disp('正在计算测试模板的参数...') for i=1:1 %[x,fs]=wavread('E:\\3.wav') fname = sprintf('%db.wav',i); x=fname; [x,fs]=wavread(x); [x1 x2] = vad(x); m = mfcc(x); m = m(x1-2:x2-2,:); test(i).mfcc = m; end disp('正在进行模板匹配...') dist = zeros(1,5); for i=1:1 for j=1:5 dist(i,j) = dtw(test(i).mfcc, ref(j).mfcc); end end disp('正在计算匹配结果...') for i=1:1 [d,j] = min(dist(i,:)); fprintf('测试模板 %d 的识别结果为:%d\n', i, j); end略微改动了下原版,这里两次循环,第一次1~5,主要检索模板,计算梅尔倒普系数等一些声纹特征,然后在第二次循环中进行模板匹配的计算。这里文件命名原则是%da,如1a,1b,测试结果显示为“测试模板%d的识别结果为x”,即意义是哪一个wav文件匹配哪一个文件,如程序测试结果为:
1.vad
2.识别
故是4a.wav匹配1b.wav,可以自行设定理解,PS:
录音最好时间差不多,且大于1S,要不然可能会报index exceeds matrix dimensions这种错误。