群里总是有人问从红血球https://space.bilibili.com/6589795那下载的数据集该怎么用?lab文件是干啥的?其实这个lab就是标注,所以就写了这个脚本(写的很雪,不知道有没有bug)
exe文件下载:https://wwrs.lanzouo.com/iOO0E2dtceub 密码:hd3j
输入一个文件夹,如果文件夹中有wav和lab那么直接生成liat文件。如果没有,那么读取所有子文件夹作为输入,文件夹名作为list文件名,输出多个单独的list文件。输出文件夹默认与输入文件夹相同。如果不写语种那么会自动识别语种,识别正确率不一定是100%而且会增加时间。写的话,中文ZH,英文EN,日语JP,韩语KO
下面是py原脚本的
使用方法:
-p是必需项,如果不写-l的话会自动识别语种,自动识别可能会出错而且会增加时间,如果写了-l那么会跳过自动识别,如果不写-o那么默认与输入文件夹一样
下面是脚本