SDK and CLI for model upload (#366)

rishabh-bhargava · web-flow · commit 76fc9498604c · 2025-09-23T00:29:00.000-07:00
* API and CLI for model upload

* Cleaning up the response
diff --git a/src/together/cli/api/models.py b/src/together/cli/api/models.py
@@ -4,7 +4,7 @@
 from tabulate import tabulate
 
 from together import Together
-from together.types.models import ModelObject
+from together.types.models import ModelObject, ModelUploadResponse
 
 
 @click.group()
@@ -53,3 +53,81 @@ def list(ctx: click.Context, type: str | None, json: bool) -> None:
         click.echo(json_lib.dumps(display_list, indent=2))
     else:
         click.echo(tabulate(display_list, headers="keys", tablefmt="plain"))
+
+
+@models.command()
+@click.option(
+    "--model-name",
+    required=True,
+    help="The name to give to your uploaded model",
+)
+@click.option(
+    "--model-source",
+    required=True,
+    help="The source location of the model (Hugging Face repo or S3 path)",
+)
+@click.option(
+    "--model-type",
+    type=click.Choice(["model", "adapter"]),
+    default="model",
+    help="Whether the model is a full model or an adapter",
+)
+@click.option(
+    "--hf-token",
+    help="Hugging Face token (if uploading from Hugging Face)",
+)
+@click.option(
+    "--description",
+    help="A description of your model",
+)
+@click.option(
+    "--base-model",
+    help="The base model to use for an adapter if setting it to run against a serverless pool. Only used for model_type 'adapter'.",
+)
+@click.option(
+    "--lora-model",
+    help="The lora pool to use for an adapter if setting it to run against, say, a dedicated pool. Only used for model_type 'adapter'.",
+)
+@click.option(
+    "--json",
+    is_flag=True,
+    help="Output in JSON format",
+)
+@click.pass_context
+def upload(
+    ctx: click.Context,
+    model_name: str,
+    model_source: str,
+    model_type: str,
+    hf_token: str | None,
+    description: str | None,
+    base_model: str | None,
+    lora_model: str | None,
+    json: bool,
+) -> None:
+    """Upload a custom model or adapter from Hugging Face or S3"""
+    client: Together = ctx.obj
+
+    response: ModelUploadResponse = client.models.upload(
+        model_name=model_name,
+        model_source=model_source,
+        model_type=model_type,
+        hf_token=hf_token,
+        description=description,
+        base_model=base_model,
+        lora_model=lora_model,
+    )
+
+    if json:
+        click.echo(json_lib.dumps(response.model_dump(), indent=2))
+    else:
+        click.echo(f"Model upload job created successfully!")
+        if response.job_id:
+            click.echo(f"Job ID: {response.job_id}")
+        if response.model_name:
+            click.echo(f"Model Name: {response.model_name}")
+        if response.model_id:
+            click.echo(f"Model ID: {response.model_id}")
+        if response.model_source:
+            click.echo(f"Model Source: {response.model_source}")
+        click.echo(f"Message: {response.message}")
diff --git a/src/together/resources/models.py b/src/together/resources/models.py
@@ -6,6 +6,8 @@
 from together.together_response import TogetherResponse
 from together.types import (
     ModelObject,
+    ModelUploadRequest,
+    ModelUploadResponse,
     TogetherClient,
     TogetherRequest,
 )
@@ -85,6 +87,64 @@ def list(
 
         return models
 
+    def upload(
+        self,
+        *,
+        model_name: str,
+        model_source: str,
+        model_type: str = "model",
+        hf_token: str | None = None,
+        description: str | None = None,
+        base_model: str | None = None,
+        lora_model: str | None = None,
+    ) -> ModelUploadResponse:
+        """
+        Upload a custom model or adapter from Hugging Face or S3.
+
+        Args:
+            model_name (str): The name to give to your uploaded model
+            model_source (str): The source location of the model (Hugging Face repo or S3 path)
+            model_type (str, optional): Whether the model is a full model or an adapter. Defaults to "model".
+            hf_token (str, optional): Hugging Face token (if uploading from Hugging Face)
+            description (str, optional): A description of your model
+            base_model (str, optional): The base model to use for an adapter if setting it to run against a serverless pool. Only used for model_type "adapter".
+            lora_model (str, optional): The lora pool to use for an adapter if setting it to run against, say, a dedicated pool. Only used for model_type "adapter".
+
+        Returns:
+            ModelUploadResponse: Object containing upload job information
+        """
+        requestor = api_requestor.APIRequestor(
+            client=self._client,
+        )
+
+        data = {
+            "model_name": model_name,
+            "model_source": model_source,
+            "model_type": model_type,
+        }
+
+        if hf_token is not None:
+            data["hf_token"] = hf_token
+        if description is not None:
+            data["description"] = description
+        if base_model is not None:
+            data["base_model"] = base_model
+        if lora_model is not None:
+            data["lora_model"] = lora_model
+
+        response, _, _ = requestor.request(
+            options=TogetherRequest(
+                method="POST",
+                url="models",
+                params=data,
+            ),
+            stream=False,
+        )
+
+        assert isinstance(response, TogetherResponse)
+
+        return ModelUploadResponse.from_api_response(response.data)
+
 
 class AsyncModels(ModelsBase):
     async def list(
@@ -132,3 +192,61 @@ async def list(
         models.sort(key=lambda x: x.id.lower())
 
         return models
+
+    async def upload(
+        self,
+        *,
+        model_name: str,
+        model_source: str,
+        model_type: str = "model",
+        hf_token: str | None = None,
+        description: str | None = None,
+        base_model: str | None = None,
+        lora_model: str | None = None,
+    ) -> ModelUploadResponse:
+        """
+        Upload a custom model or adapter from Hugging Face or S3.
+
+        Args:
+            model_name (str): The name to give to your uploaded model
+            model_source (str): The source location of the model (Hugging Face repo or S3 path)
+            model_type (str, optional): Whether the model is a full model or an adapter. Defaults to "model".
+            hf_token (str, optional): Hugging Face token (if uploading from Hugging Face)
+            description (str, optional): A description of your model
+            base_model (str, optional): The base model to use for an adapter if setting it to run against a serverless pool. Only used for model_type "adapter".
+            lora_model (str, optional): The lora pool to use for an adapter if setting it to run against, say, a dedicated pool. Only used for model_type "adapter".
+
+        Returns:
+            ModelUploadResponse: Object containing upload job information
+        """
+        requestor = api_requestor.APIRequestor(
+            client=self._client,
+        )
+
+        data = {
+            "model_name": model_name,
+            "model_source": model_source,
+            "model_type": model_type,
+        }
+
+        if hf_token is not None:
+            data["hf_token"] = hf_token
+        if description is not None:
+            data["description"] = description
+        if base_model is not None:
+            data["base_model"] = base_model
+        if lora_model is not None:
+            data["lora_model"] = lora_model
+
+        response, _, _ = await requestor.arequest(
+            options=TogetherRequest(
+                method="POST",
+                url="models",
+                params=data,
+            ),
+            stream=False,
+        )
+
+        assert isinstance(response, TogetherResponse)
+
+        return ModelUploadResponse.from_api_response(response.data)
diff --git a/src/together/types/__init__.py b/src/together/types/__init__.py
@@ -59,7 +59,7 @@
     TrainingType,
 )
 from together.types.images import ImageRequest, ImageResponse
-from together.types.models import ModelObject
+from together.types.models import ModelObject, ModelUploadRequest, ModelUploadResponse
 from together.types.rerank import RerankRequest, RerankResponse
 from together.types.batch import BatchJob, BatchJobStatus, BatchEndpoint
 from together.types.evaluation import (
@@ -110,6 +110,8 @@
     "ImageRequest",
     "ImageResponse",
     "ModelObject",
+    "ModelUploadRequest",
+    "ModelUploadResponse",
     "TrainingType",
     "FullTrainingType",
     "LoRATrainingType",
diff --git a/src/together/types/models.py b/src/together/types/models.py
@@ -1,7 +1,7 @@
 from __future__ import annotations
 
 from enum import Enum
-from typing import Literal
+from typing import Any, Dict, Literal, Optional
 
 from together.types.abstract import BaseModel
 from together.types.common import ObjectType
@@ -44,3 +44,52 @@ class ModelObject(BaseModel):
     license: str | None = None
     context_length: int | None = None
     pricing: PricingObject
+
+
+class ModelUploadRequest(BaseModel):
+    model_name: str
+    model_source: str
+    model_type: Literal["model", "adapter"] = "model"
+    hf_token: Optional[str] = None
+    description: Optional[str] = None
+    base_model: Optional[str] = None
+    lora_model: Optional[str] = None
+
+
+class ModelUploadResponse(BaseModel):
+    job_id: Optional[str] = None
+    model_name: Optional[str] = None
+    model_id: Optional[str] = None
+    model_source: Optional[str] = None
+    message: str
+
+    @classmethod
+    def from_api_response(cls, response_data: Dict[str, Any]) -> "ModelUploadResponse":
+        """Create ModelUploadResponse from API response, handling both flat and nested structures"""
+        # Start with the base response
+        result: Dict[str, Any] = {"message": response_data.get("message", "")}
+
+        # Check if we have nested data
+        if "data" in response_data and response_data["data"] is not None:
+            # Use nested data values
+            nested_data = response_data["data"]
+            result.update(
+                {
+                    "job_id": nested_data.get("job_id"),
+                    "model_name": nested_data.get("model_name"),
+                    "model_id": nested_data.get("model_id"),
+                    "model_source": nested_data.get("model_source"),
+                }
+            )
+        else:
+            # Use top-level values
+            result.update(
+                {
+                    "job_id": response_data.get("job_id"),
+                    "model_name": response_data.get("model_name"),
+                    "model_id": response_data.get("model_id"),
+                    "model_source": response_data.get("model_source"),
+                }
+            )
+
+        return cls(**result)