Spoken-CALL SharedTask Development Log

Task 1: Running Baseline Algorithm for SharedTask2nd

MetaData

SharedTask1st

[xfu7@c74 sharedTask1st]$ ls -l audio/ | wc -l
6219

SharedTask2nd

# Test data: 1001
[xfu7@c74 sharedTask2nd]$ ls -l test/test_data/ | wc -l
1001

# Train data: 6699
[xfu7@c74 sharedTask2nd]$ ls -l train/TrainingDataWavfiles/ | wc -l
6699

# Total: 7700

# Total for SharedTask1st and SharedTask2nd: 13919
# New dataset:
# Train: 6699 + 6219 = 12918
# Test: 1001

Data preparation

# Preparing data for training use data from sharedTask2nd 
# Trainning file location:
/home/xfu7/kaldi/egs/st/s1/data/sharedTask2nd/all/
# Trainning data location:
/home/xfu7/data/sharedTask1st/

# Test file location:
/home/xfu7/kaldi/egs/st/s1/data/sharedTask2nd_test/
# Test data location:
/home/xfu7/data/sharedTask2nd/

Result

# Train Set
[xfu7@c44 sharedTask2nd]$ ls all
spk2utt  text  utt2spk  wav.scp

# wav file
[xfu7@c74 sharedTask2nd]$ wc -l all/wav.scp
12914 all/wav.scp

# tail
[xfu7@c44 sharedTask2nd_test]$ tail wav.scp
sc2-41322 /home/xfu7/data/sharedTask2nd/test/audio/41322.wav
sc2-41323 /home/xfu7/data/sharedTask2nd/test/audio/41323.wav
sc2-41327 /home/xfu7/data/sharedTask2nd/test/audio/41327.wav
sc2-41328 /home/xfu7/data/sharedTask2nd/test/audio/41328.wav
sc2-41329 /home/xfu7/data/sharedTask2nd/test/audio/41329.wav
sc2-41330 /home/xfu7/data/sharedTask2nd/test/audio/41330.wav
sc2-41331 /home/xfu7/data/sharedTask2nd/test/audio/41331.wav
sc2-41334 /home/xfu7/data/sharedTask2nd/test/audio/41334.wav
sc2-41337 /home/xfu7/data/sharedTask2nd/test/audio/41337.wav
sc2-41338 /home/xfu7/data/sharedTask2nd/test/audio/41338.wav

# Test set
[xfu7@c44 sharedTask2nd_test]$ wc -l wav.scp
1001 wav.scp

# data_dir_sub
[xfu7@c44 sharedTask]$ wc -l all/wav.scp
5222 all/wav.scp

# data_dir
[xfu7@c44 sharedTask]$ wc -l st_ihm20_psgAll/train10/wav.scp
5531 st_ihm20_psgAll/train10/wav.scp

One More Step in Data preparation

Better understanding of the transcription is required to process the text. As Mengjie said:

In the SharedTask transcriptions, different symbols have specific meanings, see below:
*v: foreign word, 
*z: mispronunced word,
*a: incomplete word,
*x: indistinct word,
xxx/-xxx means unknown word/words/part of a word,
ggg: non-speech noise.

Name		Name	Last commit message	Last commit date
Latest commit History 81 Commits
results		results
s1		s1
.gitignore		.gitignore
DNN_Kaldi.md		DNN_Kaldi.md
Feature_Extraction.md		Feature_Extraction.md
Help_Commands.md		Help_Commands.md
Notes_exp_Nov11.md		Notes_exp_Nov11.md
Prepare_Data.md		Prepare_Data.md
README.md		README.md
README_AMI		README_AMI
README_AMI_s5b		README_AMI_s5b
RUN_CUDA.md		RUN_CUDA.md
install_cuda.sh		install_cuda.sh
prepare_subset.sh		prepare_subset.sh
tsne-CUDA.md		tsne-CUDA.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Spoken-CALL SharedTask Development Log

Task 1: Running Baseline Algorithm for SharedTask2nd

MetaData

Data preparation

One More Step in Data preparation

About

Releases

Packages

Languages

xiaotingFu/SpokenCall_Adaptation

Folders and files

Latest commit

History

Repository files navigation

Spoken-CALL SharedTask Development Log

Task 1: Running Baseline Algorithm for SharedTask2nd

MetaData

Data preparation

One More Step in Data preparation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages