Remove unused arguments and organize io_utils.py

sungnyun · Aug 7, 2022 · eeb0111 · eeb0111
1 parent 1abfde4
commit eeb0111
Showing 1 changed file with 58 additions and 144 deletions.
diff --git a/io_utils.py b/io_utils.py
@@ -1,128 +1,95 @@
-import numpy as np
-import os
-import glob
 import argparse
-import backbone
 
-def parse_args(mode):
-    parser = argparse.ArgumentParser(description='CD-FSL ({} mode)'.format(mode))
-    parser.add_argument('--dataset'     , default='miniImageNet',        help='training base model')
-    parser.add_argument('--model'       , default='ResNet10',      help='backbone architecture')  # refers to (ssl) method in new modules
-    parser.add_argument('--method'      , default='baseline',   help='baseline/protonet/maml')
-    parser.add_argument('--train_n_way' , default=5, type=int,  help='class num to classify for training')
-    parser.add_argument('--test_n_way'  , default=5, type=int,  help='class num to classify for testing (validation) ')
-    parser.add_argument('--n_shot'      , default=5, type=int,  help='number of labeled data in each class, same as n_support')
-    parser.add_argument('--train_aug'   , action='store_true',  help='perform data augmentation or not during training ')
-    parser.add_argument('--freeze_backbone'   , action='store_true', help='Freeze the backbone network for finetuning')
-    parser.add_argument('--models_to_use', '--names-list', nargs='+', default=['miniImageNet', 'caltech256', 'DTD', 'cifar100', 'CUB'], help='pretained model to use')
-    parser.add_argument('--fine_tune_all_models'   , action='store_true',  help='fine-tune each model before selection') #still required for save_features.py and test.py to find the model path correctly
 
-    # New parameters
-    parser.add_argument('--source_dataset', default='miniImageNet')  # replaces dataset
-    parser.add_argument('--target_dataset', type=str, nargs='+')  # replaces dataset_names / HOTFIX: changed to list to allow for multiple targets with one CLI command
-    parser.add_argument('--backbone', default='resnet10', help='Refer to backbone._backbone_class_map')  # replaces model
+def parse_args():
+    parser = argparse.ArgumentParser(description='CD-FSL')
+    parser.add_argument('--dataset', default='miniImageNet', help='training base model')
+    parser.add_argument('--backbone', default='resnet10', help='Refer to backbone._backbone_class_map')
+    parser.add_argument('--model', default='base', help='backbone architecture')
+
+    parser.add_argument('--num_classes', default=200, type=int,
+                        help='deprecated. Value is overwritten based on `target_dataset`')
+
+    parser.add_argument('--source_dataset', default='miniImageNet')
+    parser.add_argument('--target_dataset', type=str,
+                        nargs='+')  # replaces dataset_names / HOTFIX: changed to list to allow for multiple targets with one CLI command
     parser.add_argument('--imagenet_pretrained', action="store_true", help='Use ImageNet pretrained weights')
-    # parser.add_argument('--model', default='base', help='Refer to model.model_class_map')  # similar to method
 
-    # Model parameters (make sure to prepend with `model_`)
-    parser.add_argument('--model_simclr_projection_dim', default=128, type=int)
-    parser.add_argument('--model_simclr_temperature', default=1.0, type=float)
+    # Split related params
+    parser.add_argument('--unlabeled_ratio', default=20, type=int,
+                        help='Percentage of dataset used for unlabeled split')
+    parser.add_argument('--split_seed', default=1, type=int,
+                        help='Random seed used for split. If set to 1 and unlabeled_ratio==20, will use split defined by STARTUP')
 
     # Pre-train params (determines pre-trained model output directory)
     # These must be specified during evaluation and fine-tuning to select pre-trained model
-    parser.add_argument('--pls', action='store_true', help='Second-step pre-training on top of model trained with source labeled data')
-    parser.add_argument('--put', action='store_true', help='Second-step pre-training on top of model trained with target unlabeled data')
-    parser.add_argument('--pmsl', action='store_true', help='Second-step pre-training on top of model trained with MSL (instead of pls_put)')
+    parser.add_argument('--pls', action='store_true',
+                        help='Second-step pre-training on top of model trained with source labeled data')
+    parser.add_argument('--put', action='store_true',
+                        help='Second-step pre-training on top of model trained with target unlabeled data')
+    parser.add_argument('--pmsl', action='store_true',
+                        help='Second-step pre-training on top of model trained with MSL (instead of pls_put)')
     parser.add_argument('--ls', action='store_true', help='Use labeled source data for pre-training')
     parser.add_argument('--us', action='store_true', help='Use unlabeled source data for pre-training')
     parser.add_argument('--ut', action='store_true', help='Use unlabeled target data for pre-training')
-    parser.add_argument('--tag', default='default', type=str, help='Tag used to differentiate output directories for pre-trained models')  # similar to aug_mode
+    parser.add_argument('--tag', default='default', type=str,
+                        help='Tag used to differentiate output directories for pre-trained models')  # similar to aug_mode
     parser.add_argument('--pls_tag', default=None, type=str, help='Deprecated. Please use `previous_tag`.')
-    parser.add_argument('--previous_tag', default=None, type=str, help='Tag of pre-trained previous model for pls, put, pmsl. Uses --tag by default.')
+    parser.add_argument('--previous_tag', default=None, type=str,
+                        help='Tag of pre-trained previous model for pls, put, pmsl. Uses --tag by default.')
 
     # Pre-train params (non-identifying, i.e., does not affect output directory)
     # You must specify --tag to differentiate models with different non-identifying parameters)
-    parser.add_argument('--augmentation', default='strong', type=str, help="Augmentation used for pre-training {'base', 'strong'}")  # similar to aug_mode
-    parser.add_argument('--batch_size', default=64, type=int, help='Batch size for pre-training.')  # similar to aug_mode
-    parser.add_argument('--ls_batch_size', default=None, type=int, help='Batch size for LS source pre-training.')  # if None, reverts to batch_size
+    parser.add_argument('--augmentation', default='strong', type=str,
+                        help="Augmentation used for pre-training {'base', 'strong'}")  # similar to aug_mode
+    parser.add_argument('--batch_size', default=64, type=int,
+                        help='Batch size for pre-training.')  # similar to aug_mode
+    parser.add_argument('--ls_batch_size', default=None, type=int,
+                        help='Batch size for LS source pre-training.')  # if None, reverts to batch_size
     parser.add_argument('--lr', default=None, type=float, help='LR for pre-training.')
     parser.add_argument('--gamma', default=0.5, type=float, help='Gamma value for {LS,US} + UT.')  # similar to aug_mode
     parser.add_argument('--gamma_schedule', default=None, type=str, help='None | "linear"')
     parser.add_argument('--epochs', default=1000, type=int, help='Pre-training epochs.')  # similar to aug_mode
-    parser.add_argument('--model_save_interval', default=50, type=int, help='Save model state every N epochs during pre-training.')  # similar to aug_mode
-    parser.add_argument('--optimizer', default=None, type=str, help="Optimizer used during pre-training {'sgd', 'adam'}. Default if None")  # similar to aug_mode
-    parser.add_argument('--scheduler', default="MultiStepLR", type=str, help="Scheduler to use (refer to `pretrain_new.py`)")
-    parser.add_argument('--scheduler_milestones', default=[400, 600, 800], type=int, nargs="+", help="Milestones for (Repeated)MultiStepLR scheduler")
+    parser.add_argument('--model_save_interval', default=50, type=int,
+                        help='Save model state every N epochs during pre-training.')  # similar to aug_mode
+    parser.add_argument('--optimizer', default=None, type=str,
+                        help="Optimizer used during pre-training {'sgd', 'adam'}. Default if None")  # similar to aug_mode
+    parser.add_argument('--scheduler', default="MultiStepLR", type=str,
+                        help="Scheduler to use (refer to `pretrain.py`)")
+    parser.add_argument('--scheduler_milestones', default=[400, 600, 800], type=int, nargs="+",
+                        help="Milestones for (Repeated)MultiStepLR scheduler")
     parser.add_argument('--num_workers', default=None, type=int)
 
-    # New ft params
+    # Fine-tune params
+    parser.add_argument('--n_shot', default=5, type=int, help='number of labeled data in each class, same as n_support')
     parser.add_argument('--n_way', default=5, type=int)
     parser.add_argument('--n_query_shot', default=15, type=int)
 
+    parser.add_argument('--ft_tag', default='default', type=str,
+                        help='Tag used to differentiate output directories for fine-tuned models')
     parser.add_argument('--ft_head', default='linear', help='See `model.classifier_head.CLASSIFIER_HEAD_CLASS_MAP`')
-    parser.add_argument('--ft_tag', default='default', type=str, help='Tag used to differentiate output directories for fine-tuned models')
     parser.add_argument('--ft_epochs', default=100, type=int)
     parser.add_argument('--ft_pretrain_epoch', default=None, type=int)
     parser.add_argument('--ft_batch_size', default=4, type=int)
     parser.add_argument('--ft_lr', default=1e-2, type=float, help='Learning rate for fine-tuning')
-    parser.add_argument('--ft_augmentation', default=None, type=str, help="Augmentation used for fine-tuning {None, 'base', 'strong'}")
+    parser.add_argument('--ft_augmentation', default=None, type=str,
+                        help="Augmentation used for fine-tuning {None, 'base', 'strong'}")
     parser.add_argument('--ft_parts', default='head', type=str, help="Where to fine-tune: {'full', 'body', 'head'}")
-    parser.add_argument('--ft_features', default=None, type=str, help='Specify which features to use from the base model (see model/base.py)')
+    parser.add_argument('--ft_features', default=None, type=str,
+                        help='Specify which features to use from the base model (see model/base.py)')
     parser.add_argument('--ft_intermediate_test', action='store_true', help='Evaluate on query set during fine-tuning')
     parser.add_argument('--ft_episode_seed', default=0, type=int)
 
-    if mode == 'train' or mode == 'pretrain':
-        parser.add_argument('--num_classes' , default=200, type=int, help='total number of classes in softmax, only used in baseline') #make it larger than the maximum label value in base class
-        parser.add_argument('--save_freq'   , default=50, type=int, help='Save frequency')
-        parser.add_argument('--pretrain_type', default=None, type=int, help='How to pre-train')
-        parser.add_argument('--start_epoch' , default=0, type=int,help ='Starting epoch')
-        parser.add_argument('--stop_epoch'  , default=400, type=int, help ='Stopping epoch') # for meta-learning methods, each epoch contains 100 episodes
-
-        # For pre-trained model (related to BN)
-        parser.add_argument('--track_bn'   , action='store_true',  help='tracking BN stats')
-        parser.add_argument('--freeze_bn', action='store_true',  help='freeze bn stats, i.e., use accumulated stats of pretrained model during inference. Note, track_bn must be on to do this.')
-        parser.add_argument('--reinit_bn_stats'   , action='store_true',  help='Re-initialize BN running statistics every iteration')
-
-        # For SimCLR
-        parser.add_argument('--aug_mode', default=None, help='augmentation for pre-training [base, strong]')
-        parser.add_argument('--use_base_classes'   , action='store_true',  help='supervised training using base classes with self-training')
-        parser.add_argument('--use_base_classes_as_unlabeled'   , action='store_true',  help='unsupervised training using base classes with self-training')
-        parser.add_argument('--no_rerand'   , action='store_true',  help='No re-randomization before SimCLR traininig')
-        parser.add_argument('--no_base_pretraining'   , action='store_true',  help='No use pre-trained model based on base classes')
-
-        # For fine-tuning
-        parser.add_argument('--mv_init', action='store_true', help ='Re-initialize all weights with existing mean-var stats')
-        parser.add_argument('--simclr_finetune', action='store_true', help ='Fine-tuning using the model trained by SimCLR')
-        parser.add_argument('--simclr_finetune_source', action='store_true', help ='Fine-tuning using the model trained by source+SimCLR')
-        parser.add_argument('--simclr_epochs', nargs='+', type=int, default=[1000, 800, 600, 400, 200, 0], help ='Which epochs to fine-tune for SimCLR (near finetune.py:486)')
-        parser.add_argument('--reinit_stem', action='store_true', help ='Re-initialize Stem')
-        parser.add_argument('--reinit_blocks', nargs='+', type=int, help ='Re-initialize ResNet blocks (select within range [1, 4])')
-
-        parser.add_argument('--reset_layers', default=None, nargs='+', type=str, help='Re-randomize (or re-init) layers. Refer to `reset_layer.py` for layer names. E.g., 4.c2, 4.b2, 4.cs, 4.bs')
-        parser.add_argument('--reset_layer_method', default='rerandomize', help='rerandomize, reinit')
-        parser.add_argument('--unlabeled_stats', action='store_true', help ='Use statistics of unlabeled target dataset for BN running stats')
-
-        parser.add_argument('--finetune_parts', default=None, type=str, help='head, body, full')
-        parser.add_argument('--fusion_method', default=None, type=str, help='concat, etc, ...')
-
-        parser.add_argument('--no_tracking', action='store_true', help='No tracking the test accuracy for every epoch')
-        parser.add_argument('--dataset_names', nargs='+', type=str, default=["miniImageNet_test", "CropDisease", "EuroSAT", "ISIC", "ChestX"], help='CD-FSL datasets to fine-tune')
-        parser.add_argument('--use_simclr_clf', action='store_true', help ='Use pre-trained SimCLR projection head')
+    # Model parameters (make sure to prepend with `model_`)
+    parser.add_argument('--model_simclr_projection_dim', default=128, type=int)
+    parser.add_argument('--model_simclr_temperature', default=1.0, type=float)
 
-        # For STARTUP-like split (deprecated. Update with finetune.py)
-        parser.add_argument('--startup_split', action='store_true', help ='Use 80% of dataset, similar to STARTUP. Enabled automatically for simclr_finetune.')
-        # For split (split may be used depending on pretrain_type
-        parser.add_argument('--unlabeled_ratio', default=20, type=int, help ='Percentage of dataset used for unlabeled split')
-        parser.add_argument('--split_seed', default=1, type=int, help ='Random seed used for split. If set to 1 and unlabeled_ratio==20, will use split defined by STARTUP')
-    elif mode == 'save_features':
-        parser.add_argument('--split'       , default='novel', help='base/val/novel') #default novel, but you can also test base/val class accuracy if you want
-        parser.add_argument('--save_iter', default=-1, type=int,help ='save feature from the model trained in x epoch, use the best model if x is -1')
-    elif mode == 'test':
-        parser.add_argument('--split'       , default='novel', help='base/val/novel') #default novel, but you can also test base/val class accuracy if you want
-        parser.add_argument('--save_iter', default=-1, type=int,help ='saved feature from the model trained in x epoch, use the best model if x is -1')
-        parser.add_argument('--adaptation'  , action='store_true', help='further adaptation in test time or not')
-    else:
-        raise ValueError('Unknown script')
+    # Batch normalization (likely deprecated)
+    parser.add_argument('--track_bn', action='store_true', help='tracking BN stats')
+    parser.add_argument('--freeze_bn', action='store_true',
+                        help='freeze bn stats, i.e., use accumulated stats of pretrained model during inference. Note, track_bn must be on to do this.')
+    parser.add_argument('--reinit_bn_stats', action='store_true',
+                        help='Re-initialize BN running statistics every iteration')
 
     params = parser.parse_args()
 
@@ -140,18 +107,6 @@ def parse_args(mode):
     if sum((params.pls, params.put, params.pmsl)) > 1:
         raise AssertionError('You may only specify one of params.{pls,put,pmsl}')
 
-    # Assign num_classes
-    if params.dataset == 'miniImageNet':
-        params.num_classes = 64
-    elif params.dataset == 'tieredImageNet':
-        params.num_classes = 351
-    elif params.dataset == 'ImageNet':
-        params.num_classes = 1000
-    elif params.dataset == 'none':
-        params.num_classes = 5
-    else:
-        raise ValueError('Invalid `dataset` argument: {}'.format(params.dataset))
-
     # Assign num_classes (*_new)
     if params.source_dataset == 'miniImageNet':
         params.num_classes = 64
@@ -224,44 +179,3 @@ def parse_args(mode):
             params.previous_tag = params.tag
 
     return params
-
-
-def get_init_file(checkpoint_dir):
-    init_file = os.path.join(checkpoint_dir, 'initial.tar')
-    return init_file
-
-
-def get_assigned_file(checkpoint_dir, num, dataset_name=None):
-    if dataset_name is None:
-        assign_file = os.path.join(checkpoint_dir, '{:d}.tar'.format(num))
-    else:
-        assign_file = os.path.join(checkpoint_dir, '{}_{:d}.tar'.format(dataset_name, num))
-    return assign_file
-
-
-def get_resume_file(checkpoint_dir, dataset_name=None):
-    filelist = glob.glob(os.path.join(checkpoint_dir, '*.tar'))
-    if len(filelist) == 0:
-        print('Warning: unable to locate *.tar checkpoint file in {}'.format(checkpoint_dir))
-        return None
-
-    if dataset_name is None:
-        filelist = [ x for x in filelist if os.path.basename(x) != 'best_model.tar' and os.path.basename(x) != 'initial.tar']
-        epochs = np.array([int(os.path.splitext(os.path.basename(x))[0]) for x in filelist])
-        max_epoch = np.max(epochs)
-        resume_file = os.path.join(checkpoint_dir, '{:d}.tar'.format(max_epoch))
-    else:
-        filelist = [ x for x in filelist if os.path.basename(x) != 'best_model.tar' and os.path.basename(x) != '{}_initial.tar'.format(dataset_name)]
-        epochs = np.array([int(os.path.splitext(os.path.basename(x))[0].split('_')[1]) for x in filelist])
-        max_epoch = np.max(epochs)
-        resume_file = os.path.join(checkpoint_dir, '{}_{:d}.tar'.format(dataset_name, max_epoch))
-
-    return resume_file
-
-
-def get_best_file(checkpoint_dir):
-    best_file = os.path.join(checkpoint_dir, 'best_model.tar')
-    if os.path.isfile(best_file):
-        return best_file
-    else:
-        return get_resume_file(checkpoint_dir)