본문 바로가기
Linux

[kaldi] ark 파일 변환

by 공대우냉이 2017. 8. 2.

kaldi에서 ark 파일을 읽기 위해서 여러가지 명령어(c 프로그램)를 제공함.

copy-(xxxxx) 명령어를 이용하여 사용 가능

일단 목적에 맞게 내가 읽으려는 파일의 형태를 파악해야됨.

feature 파일이면 copy-feats

vector 형식이면 copy-vector

matrix 형식이면 copy-matrix

등등 여러가지 프로그램을 형식에 맞게 이용하면 됨.

일단 .bashrc에 위의 프로그램이 저장된 path를 추가해줘야 어디서든 이용가능함.

1. $ gedit ~/.bashrc

2. gedit에 PATH=":/usr/lib: ... :{kaldi-path}/src/bin:{kaldi-path}/src/featbin/:${PATH}:"

경로 추가 (예를 든것이므로, 이용할 프로그램의 path를 찾아서 기입해야됩니다.)

3. $ source ~/.bashrc   (현재 터미널에서 바로 .bashrc 적용)

4. $ copy-vector ark:raw_mfcc_bn.1.ark ark,t:raw_mfcc_bn.1.txt

raw_mfcc_bn.1.ark 파일을 raw_mfcc_bn.1.txt로 저장


아래는 이해를 돕기 위해 제가 직접 실행한 것을 캡쳐한 것입니다.

<현재 폴더> 

vad_gmm_whTest.1.ark와 vad_merged_whTest.1.ark를 txt로 저장하려고 합니다.

위와 같은 명령어를 줘서 아래와 같이 txt 파일로 변환하였습니다.

변환된 두 파일이 생겼습니다.

파일을 열어보니 ark 파일 형태입니다.

ark파일 형태는 

filename [ 데이터 ]