Author: Kazachkov Daniil
Supervisor: Filatov Andrew
Наша главная цель - расширить область применения диффузионных моделей в генерации высококачественных изображений. Мы проверяем гипотезу о том, что подходы в работах PuLID, InstantID, IP-Adapter распространяются не только на аватары лиц, но и на ростовые. Мы достигаем этого изменением датасета и энкодера, принимающего на вход референсную картинку пользователя. Отдельной частью эксперимента является попытка подобрать лучший метод для выделения тела человека (BodyID) с картинки.
Для этого установите все зависимости из IP-Adapter, замените tutorial_train_plus.py
на соответствующий ему файл ./model_train/tutorial_train_plus.py
. Запуск скрипта осуществляется выполнением скрипта train.sh
, который предварительно надо перенести в директорию IP-Adapter
.
Результаты тренировки модели можно найти в ноутбуке
TODO