k2-fsa · KarelVesely84 · Jan 20, 2026 · Jan 20, 2026 · Jan 20, 2026 · Jan 20, 2026
diff --git a/.github/scripts/docker/Dockerfile b/.github/scripts/docker/Dockerfile
@@ -44,6 +44,7 @@ RUN pip install --no-cache-dir \
       espnet_tts_frontend \
       graphviz \
       kaldi-decoder \
+      kaldi_native_fbank \
       kaldi_native_io \
       kaldialign \
       kaldifst \

diff --git a/.github/workflows/test.yml b/.github/workflows/test.yml
@@ -102,6 +102,7 @@ jobs:
               cd ../transducer_lstm
               pytest -v -s
 
+              pip install kaldi_native_fbank
               cd ../zipformer
               pytest -v -s
 

diff --git a/egs/iwslt22_ta/ASR/local/prepare_transcripts.py b/egs/iwslt22_ta/ASR/local/prepare_transcripts.py
@@ -1 +1 @@
-/exp/ahussein/tmp/icefall/egs/iwslt22_ta/ST/local/prepare_transcripts.py
+../../ST/local/prepare_transcripts.py
diff --git a/egs/iwslt22_ta/ST/local/prepare_transcripts.py b/egs/iwslt22_ta/ST/local/prepare_transcripts.py
@@ -1,66 +1,66 @@
-# Copyright 2023 Johns Hopkins University  (Amir Hussein)
-
-#!/usr/bin/python
-"""
-This script prepares transcript_words.txt from cutset
-"""
-
-from lhotse import CutSet
-import argparse
-import logging
-import pdb
-from pathlib import Path
-import os
-
-
-def get_parser():
-    parser = argparse.ArgumentParser(
-        formatter_class=argparse.ArgumentDefaultsHelpFormatter
-    )
-    parser.add_argument(
-        "--cut",
-        type=str,
-        default="",
-        help="Cutset file",
-    )
-    parser.add_argument(
-        "--src-langdir",
-        type=str,
-        default="",
-        help="name of the source lang-dir",
-    )
-    parser.add_argument(
-        "--tgt-langdir",
-        type=str,
-        default=None,
-        help="name of the target lang-dir",
-    )
-    return parser
-     
-
-def main():
-
-    parser = get_parser()
-    args = parser.parse_args()
-
-    logging.info("Reading the cuts")
-    cuts = CutSet.from_file(args.cut)
-    if args.tgt_langdir != None:
-        logging.info("Target dir is not None")
-        langdirs = [Path(args.src_langdir), Path(args.tgt_langdir)]
-    else:
-        langdirs = [Path(args.src_langdir)]
-    
-    for langdir in langdirs:
-        if not os.path.exists(langdir):
-            os.makedirs(langdir)
-
-    with open(langdirs[0] / "transcript_words.txt", 'w') as src, open(langdirs[1] / "transcript_words.txt", 'w') as tgt:
-        for c in cuts:
-            src_txt = c.supervisions[0].text
-            tgt_txt = c.supervisions[0].custom['translated_text']['eng']
-            src.write(src_txt + '\n')
-            tgt.write(tgt_txt + '\n')
-
-if __name__ == "__main__":
-    main()
+# Copyright 2023 Johns Hopkins University  (Amir Hussein)
+
+#!/usr/bin/python
-# Copyright 2023 Johns Hopkins University  (Amir Hussein)
-
-#!/usr/bin/python
+#!/usr/bin/python
+# Copyright 2023 Johns Hopkins University  (Amir Hussein)
-# Copyright 2023 Johns Hopkins University  (Amir Hussein)
-
-#!/usr/bin/python
+#!/usr/bin/python
+# Copyright 2023 Johns Hopkins University  (Amir Hussein)
+"""
+This script prepares transcript_words.txt from cutset
+"""
+
+from lhotse import CutSet
+import argparse
+import logging
+import pdb
+from pathlib import Path
+import os
+
+
+def get_parser():
+    parser = argparse.ArgumentParser(
+        formatter_class=argparse.ArgumentDefaultsHelpFormatter
+    )
+    parser.add_argument(
+        "--cut",
+        type=str,
+        default="",
+        help="Cutset file",
+    )
+    parser.add_argument(
+        "--src-langdir",
+        type=str,
+        default="",
+        help="name of the source lang-dir",
+    )
+    parser.add_argument(
+        "--tgt-langdir",
+        type=str,
+        default=None,
+        help="name of the target lang-dir",
+    )
+    return parser
+
+
+def main():
+
+    parser = get_parser()
+    args = parser.parse_args()
+
+    logging.info("Reading the cuts")
+    cuts = CutSet.from_file(args.cut)
+    if args.tgt_langdir != None:
+        logging.info("Target dir is not None")
+        langdirs = [Path(args.src_langdir), Path(args.tgt_langdir)]
+    else:
+        langdirs = [Path(args.src_langdir)]
+
+    for langdir in langdirs:
+        if not os.path.exists(langdir):
+            os.makedirs(langdir)
+
+    with open(langdirs[0] / "transcript_words.txt", 'w') as src, open(langdirs[1] / "transcript_words.txt", 'w') as tgt:
+        for c in cuts:
+            src_txt = c.supervisions[0].text
+            tgt_txt = c.supervisions[0].custom['translated_text']['eng']
+            src.write(src_txt + '\n')
+            tgt.write(tgt_txt + '\n')
+
+if __name__ == "__main__":
+    main()
Original file line number	Diff line number	Diff line change
		@@ -1 +1 @@
		/exp/ahussein/tmp/icefall/egs/iwslt22_ta/ST/local/prepare_transcripts.py
		../../ST/local/prepare_transcripts.py