sgl-project · zyksir · Oct 21, 2025 · Oct 21, 2025 · Oct 21, 2025 · gemini-code-assist
@@ -84,6 +84,9 @@ def parse(
                 messages, tokenize=False, add_generation_prompt=False, **kwargs
             )
 
+            if self.chat_template.ignored_token:
-            if self.chat_template.ignored_token:
+            if self.chat_template.ignored_token and self.chat_template.ignored_token != "":
+                conversation = conversation.replace(self.chat_template.ignored_token, "")
-            if self.chat_template.ignored_token:
+            if self.chat_template.ignored_token and self.chat_template.ignored_token != "":
+                conversation = conversation.replace(self.chat_template.ignored_token, "")
+                conversation = conversation.replace(self.chat_template.ignored_token, "")
+
         if not self.tokenizer.pad_token_id:
             self.tokenizer.pad_token_id = self.tokenizer.unk_token_id
 
@@ -122,6 +125,29 @@ def parse(
         return input_ids, loss_mask
 
 
+class Qwen3ThinkingParser(GeneralParser):
+    def __init__(self, tokenizer: PreTrainedTokenizer, chat_template: ChatTemplate):
+        super().__init__(tokenizer, chat_template)
+
+    def parse(
+        self,
+        conversation: "Conversation",
+        max_length: int,
+        preformatted: bool = False,
+        **kwargs,
+    ) -> Dict[str, List[torch.Tensor]]:
+        if kwargs.get("enable_thinking", False):
+            self.assistant_message_separator = (
+                f"{self.chat_template.end_of_turn_token}<|im_start|>assistant\n<think>\n"
+            )
+            self.chat_template.ignored_token = None
+        else:
+            self.assistant_message_separator = (
+                f"{self.chat_template.end_of_turn_token}<|im_start|>assistant\n"
+            )
+            self.chat_template.ignored_token = "<think>\n\n</think>\n\n"
+        return super().parse(conversation, max_length, preformatted, **kwargs)
-        return super().parse(conversation, max_length, preformatted, **kwargs)
+        return {"input_ids": input_ids, "loss_mask": loss_mask}
-        return super().parse(conversation, max_length, preformatted, **kwargs)
+        return {"input_ids": input_ids, "loss_mask": loss_mask}
+
 class HarmonyParser(Parser):
 
     def build_single_turn_prompt(

@@ -41,7 +41,7 @@
 
 from specforge.utils import padding
 
-from .parse import GeneralParser, HarmonyParser
+from .parse import GeneralParser, HarmonyParser, Qwen3ThinkingParser
 from .template import TEMPLATE_REGISTRY, ChatTemplate
 
 # define a type called conversation
@@ -141,6 +141,8 @@ def preprocess_conversations(
 
     if chat_template.parser_type == "general":
         parser = GeneralParser(tokenizer, chat_template)
+    elif chat_template.parser_type == "qwen3-thinking":
+        parser = Qwen3ThinkingParser(tokenizer, chat_template)
     elif chat_template.parser_type == "openai-harmony":
         parser = HarmonyParser(tokenizer, chat_template)
     else:

@@ -20,6 +20,7 @@ class ChatTemplate(BaseModel):
     system_prompt: str | None
     end_of_turn_token: str | None
     parser_type: str = "general"
+    ignored_token: str | None = None
 
 
 class TemplateRegistry:
@@ -115,6 +116,18 @@ def get_all_template_names(self) -> List[str]:
     ),
 )
 
+TEMPLATE_REGISTRY.register(
+    name="qwen3-thinking",
+    template=ChatTemplate(
+        assistant_header="<|im_start|>assistant\n",
+        user_header="<|im_start|>user\n",
+        system_prompt="You are a helpful assistant.",
+        end_of_turn_token="<|im_end|>\n",
+        parser_type="qwen3-thinking",
+        ignored_token="<think>\n\n</think>\n\n",
+    ),
+)
+
 TEMPLATE_REGISTRY.register(
     name="qwen2-vl",
     template=ChatTemplate(