macrocosm-os
diff --git a/‎competitions/data.py
+2 b/‎competitions/data.py
+2
diff --git a/‎constants/__init__.py
+230-6 b/‎constants/__init__.py
+230-6
diff --git a/‎neurons/validator.py
+3-2 b/‎neurons/validator.py
+3-2
@@ -16,6 +16,8 @@ class CompetitionId(IntEnum):
 
     B14_MODEL_MULTI_DATASET = 5
 
+    TTS_V0 = 6
+
     # Overwrite the default __repr__, which doesn't work with
     # bt.logging for some unknown reason.
     def __repr__(self) -> str:
 
@@ -8,6 +8,8 @@
 from taoverse.model.competition.epsilon import LinearDecay
 from taoverse.model.eval.normalization import NormalizationId
 from taoverse.model.eval.task import EvalTask
+from taoverse.model.tts.e2tts import E2TTS
+
 from transformers import (
     BartForCausalLM,
     FalconForCausalLM,
@@ -32,7 +34,7 @@
 # ---------------------------------
 
 # Release
-__version__ = "5.1.1"
+__version__ = "6.0.0"
 
 # Validator schema version
 __validator_version__ = "4.6.0"
@@ -52,6 +54,9 @@
 # The root directory of this project.
 ROOT_DIR = Path(__file__).parent.parent
 
+# block to start the tts competition
+BLOCK_TTS = 5_177_981
+
 # Minimum stake to consider a validator when checking for miners with weights.
 # This corresponded to top-10 validator on july 31st, 2024
 WEIGHT_SYNC_VALI_MIN_STAKE = 200_000
@@ -62,6 +67,7 @@
 
 # Validator eval batch size.
 BATCH_SIZE = 1
+BATCH_SIZE_TTS = 1
 # Validators number of pages to eval over miners on each step.
 
 # This will be used before activation block BLOCK_MULTI_DATASETS
@@ -75,6 +81,7 @@
 PAGES_PER_EVAL_PES2OX = 2
 PAGES_PER_EVAL_FINEMATH3P = 6
 PAGES_PER_EVAL_WEBMATH3P = 6
+PAGES_PER_EVAL_PPLSPEECH = 1
 
 # Maximum number of batches to use for evaluation per dataset.
 MAX_BATCHES_PER_DATASET = 50
@@ -101,14 +108,17 @@
     Gemma2ForCausalLM,
     Qwen2ForCausalLM,
 }
+ALLOWED_MODEL_TYPES_TTS = {
+    E2TTS
+}
 
 
 # Synchronize on blocks roughly every 30 minutes.
 SYNC_BLOCK_CADENCE = 150
 # Delay at least as long as the sync block cadence with an additional buffer.
 EVAL_BLOCK_DELAY = SYNC_BLOCK_CADENCE + 100
 
-MODEL_CONSTRAINTS_BY_COMPETITION_ID: Dict[CompetitionId, ModelConstraints] = {
+MODEL_CONSTRAINTS_BY_COMPETITION_ID_TMP: Dict[CompetitionId, ModelConstraints] = {
     CompetitionId.B3_MODEL: ModelConstraints(
         max_model_parameter_size=3_400_000_000,
         min_model_parameter_size=3_200_000_000,
@@ -120,7 +130,7 @@
             "attn_implementation": "flash_attention_2",
         },
         eval_block_delay=EVAL_BLOCK_DELAY,
-        epsilon_func=LinearDecay(0.005, 0.0005, 50400),
+        epsilon_func=LinearDecay(0.005, 0.0005, 7200 * 7),
         max_bytes=15 * 1024 * 1024 * 1024,
     ),
     CompetitionId.B14_MODEL: ModelConstraints(
@@ -134,19 +144,60 @@
             "attn_implementation": "flash_attention_2",
         },
         eval_block_delay=EVAL_BLOCK_DELAY,
-        epsilon_func=LinearDecay(0.005, 0.0005, 72000),
+        epsilon_func=LinearDecay(0.005, 0.0005, 7200 * 10),
         max_bytes=29 * 1024 * 1024 * 1024,
     ),
 }
 
+MODEL_CONSTRAINTS_BY_COMPETITION_ID: Dict[CompetitionId, ModelConstraints] = {
+    CompetitionId.B3_MODEL: ModelConstraints(
+        max_model_parameter_size=3_400_000_000,
+        min_model_parameter_size=3_200_000_000,
+        sequence_length=4096,
+        allowed_architectures=ALLOWED_MODEL_TYPES_2,
+        tokenizer="Xenova/gpt-4",
+        kwargs={
+            "torch_dtype": torch.bfloat16,
+            "attn_implementation": "flash_attention_2",
+        },
+        eval_block_delay=EVAL_BLOCK_DELAY,
+        epsilon_func=LinearDecay(0.005, 0.0001, 7200 * 2),
+        max_bytes=15 * 1024 * 1024 * 1024,
+    ),
+    CompetitionId.B14_MODEL: ModelConstraints(
+        max_model_parameter_size=13_900_000_000,
+        min_model_parameter_size=13_700_000_000,
+        sequence_length=4096,
+        allowed_architectures=ALLOWED_MODEL_TYPES_2,
+        tokenizer="Xenova/gpt-4",
+        kwargs={
+            "torch_dtype": torch.bfloat16,
+            "attn_implementation": "flash_attention_2",
+        },
+        eval_block_delay=EVAL_BLOCK_DELAY,
+        epsilon_func=LinearDecay(0.005, 0.0001, 7200 * 2),
+        max_bytes=29 * 1024 * 1024 * 1024,
+    ),
+    CompetitionId.TTS_V0: ModelConstraints(
+        max_model_parameter_size=400_000_000,
+        min_model_parameter_size=350_000_000,
+        sequence_length=None,
+        allowed_architectures=ALLOWED_MODEL_TYPES_TTS,
+        tokenizer="e2tts",
+        eval_block_delay=EVAL_BLOCK_DELAY,
+        epsilon_func=LinearDecay(0.005, 0.0005, 7200 * 7),
+        max_bytes=2 * 1024 * 1024 * 1024,
+    ),
+
+}
 # Schedule of competitions by block.
 COMPETITION_SCHEDULE_BY_BLOCK: List[Tuple[int, List[Competition]]] = [
     (
         0,
         [
             Competition(
                 CompetitionId.B3_MODEL,
-                MODEL_CONSTRAINTS_BY_COMPETITION_ID[CompetitionId.B3_MODEL],
+                MODEL_CONSTRAINTS_BY_COMPETITION_ID_TMP[CompetitionId.B3_MODEL],
                 0.3,
                 eval_tasks=[
                     EvalTask(
@@ -219,7 +270,7 @@
             ),
             Competition(
                 CompetitionId.B14_MODEL,
-                MODEL_CONSTRAINTS_BY_COMPETITION_ID[CompetitionId.B14_MODEL],
+                MODEL_CONSTRAINTS_BY_COMPETITION_ID_TMP[CompetitionId.B14_MODEL],
                 0.7,
                 eval_tasks=[
                     EvalTask(
@@ -292,6 +343,179 @@
             ),
         ],
     ),
+    (
+        BLOCK_TTS,
+        [
+            Competition(
+                CompetitionId.TTS_V0,
+                MODEL_CONSTRAINTS_BY_COMPETITION_ID[CompetitionId.TTS_V0],
+                0.55,
+                eval_tasks=[
+                    EvalTask(
+                        name="PPL_SPEECH",
+                        method_id=EvalMethodId.WER,
+                        dataset_id=DatasetId.PPLSPEECH,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE_TTS,
+                            "num_pages": PAGES_PER_EVAL_PPLSPEECH,
+                            "target_sr": 24000,
+                            "target_rms": 0.1,
+                            "ref_audio_max_duration": 15,
+                            "hop_length": 256
+                        },
+                        weight=1.0,
+                    ),
+                ],
+            ),
+            Competition(
+                CompetitionId.B3_MODEL,
+                MODEL_CONSTRAINTS_BY_COMPETITION_ID[CompetitionId.B3_MODEL],
+                0.15,
+                eval_tasks=[
+                    EvalTask(
+                        name="FINEWEB",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEWEB,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEWEB,
+                        },
+                        weight=0.3,
+                    ),
+                    EvalTask(
+                        name="FINEWEB_EDU2",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEWEB2,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEWEB2,
+                        },
+                        weight=0.25,
+                    ),
+                    EvalTask(
+                        name="STACKV2_DEDUP",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.STACK2,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_STACK2,
+                        },
+                        weight=0.35,
+                    ),
+                    EvalTask(
+                        name="PES2OX",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.PES2OX,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_PES2OX,
+                        },
+                        weight=0.05,
+                    ),
+                    EvalTask(
+                        name="FINEMATH_3P",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEMATH3P,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEMATH3P,
+                        },
+                        weight=0.03,
+                    ),
+                    EvalTask(
+                        name="INFIWEBMATH_3P",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.WEBMATH3P,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_WEBMATH3P,
+                        },
+                        weight=0.02,
+                    ),
+                ],
+            ),
+            Competition(
+                CompetitionId.B14_MODEL,
+                MODEL_CONSTRAINTS_BY_COMPETITION_ID[CompetitionId.B14_MODEL],
+                0.3,
+                eval_tasks=[
+                    EvalTask(
+                        name="FINEWEB",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEWEB,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEWEB,
+                        },
+                        weight=0.3,
+                    ),
+                    EvalTask(
+                        name="FINEWEB_EDU2",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEWEB2,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEWEB2,
+                        },
+                        weight=0.25,
+                    ),
+                    EvalTask(
+                        name="STACKV2_DEDUP",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.STACK2,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_STACK2,
+                        },
+                        weight=0.35,
+                    ),
+                    EvalTask(
+                        name="PES2OX",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.PES2OX,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_PES2OX,
+                        },
+                        weight=0.05,
+                    ),
+                    EvalTask(
+                        name="FINEMATH_3P",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.FINEMATH3P,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_FINEMATH3P,
+                        },
+                        weight=0.03,
+                    ),
+                    EvalTask(
+                        name="INFIWEBMATH_3P",
+                        method_id=EvalMethodId.TEXT_LOSS,
+                        dataset_id=DatasetId.WEBMATH3P,
+                        normalization_id=NormalizationId.NONE,
+                        dataset_kwargs={
+                            "batch_size": BATCH_SIZE,
+                            "num_pages": PAGES_PER_EVAL_WEBMATH3P,
+                        },
+                        weight=0.02,
+                    ),
+                ],
+            ),
+        ],
+    ),
 ]
 
 for block_and_competitions in COMPETITION_SCHEDULE_BY_BLOCK:
 
@@ -73,8 +73,8 @@
 import constants
 import pretrain as pt
 from competitions.data import CompetitionId
-from model.retry import should_retry_model
 from neurons import config
+from pretrain.models.retry import should_retry_model
 from pretrain.dataset import SubsetLoader
 from pretrain.datasets.factory import DatasetLoaderFactory
 from pretrain.eval.sample import EvalSample
@@ -1006,7 +1006,7 @@ async def run_step(self):
                                 samples,
                                 self.config.device,
                             ),
-                            ttl=430,
+                            ttl=480, # 8 minutes
                             mode="spawn",
                         )
                     del model_i
@@ -1315,6 +1315,7 @@ def log_step(
                     "PES2OX": "laion/Pes2oX-fulltext",
                     "FINEMATH_3P": "HuggingFaceTB/finemath:finemath-3p",
                     "INFIWEBMATH_3P": "HuggingFaceTB/finemath:infiwebmath-3p",
+                    "PPL_SPEECH": "MLCommons/peoples_speech"
                 }
                 dataset_name = (
                     task_to_dataset_name[task_name]