Skip to content

This repository contains an implementation of the BoLID: Body Lightning ID Diffusion method, for creating avatars by text description only.

Notifications You must be signed in to change notification settings

intsystems/2025-project-DiffModels

 
 

Repository files navigation

Full-length human image generation using diffusion models.

Author: Kazachkov Daniil
Supervisor: Filatov Andrew

Problem Statement

Наша главная цель - расширить область применения диффузионных моделей в генерации высококачественных изображений. Мы проверяем гипотезу о том, что подходы в работах PuLID, InstantID, IP-Adapter распространяются не только на аватары лиц, но и на ростовые. Мы достигаем этого изменением датасета и энкодера, принимающего на вход референсную картинку пользователя. Отдельной частью эксперимента является попытка подобрать лучший метод для выделения тела человека (BodyID) с картинки.

Train baseline model

Для этого установите все зависимости из IP-Adapter, замените tutorial_train_plus.py на соответствующий ему файл ./model_train/tutorial_train_plus.py. Запуск скрипта осуществляется выполнением скрипта train.sh, который предварительно надо перенести в директорию IP-Adapter.

Результаты тренировки модели можно найти в ноутбуке

Citation

TODO

About

This repository contains an implementation of the BoLID: Body Lightning ID Diffusion method, for creating avatars by text description only.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 71.9%
  • Jupyter Notebook 27.9%
  • Shell 0.2%