Added group_size tests

mkphuthi · mkphuthi · commit dbc626ec0bc5 · 2024-11-25T17:18:46.000-05:00
diff --git a/asimtools/asimmodules/active_learning/ase_md.py b/asimtools/asimmodules/active_learning/ase_md.py
@@ -221,6 +221,7 @@ def ase_md(
             friction=friction,
         )
     elif dynamics == 'npt':
+        assert pfactor is not None, 'Pressure factor must be provided'
         atoms, _ = npt(
             atoms,
             temp,
diff --git a/asimtools/asimmodules/active_learning/compute_deviation.py b/asimtools/asimmodules/active_learning/compute_deviation.py
@@ -36,7 +36,7 @@ def compute_deviation(
     :type calc_ids: Optional[Sequence]
 
     """
-    properties = ['energy', 'forces', 'stress']
+    properties = ['energy', 'forces', 'stress', 'energy_per_atom']
     if calc_ids is None:
         model_weights_files = natsorted(glob(model_weights_pattern))
 
@@ -81,19 +81,25 @@ def compute_deviation(
 
             atoms.set_calculator(calc)
             energy = atoms.get_potential_energy(atoms)
+            energy_per_atom = energy / len(atoms)
             forces = np.linalg.norm(atoms.get_forces(), axis=1)
             stress = -np.sum(
                 atoms.get_stress(voigt=True, include_ideal_gas=False)[:3]
             ) / 3
 
+            prop_dict['energy_per_atom'][calc_id].append(energy_per_atom)
             prop_dict['energy'][calc_id].append(energy)
             prop_dict['forces'][calc_id].append(forces)
             prop_dict['stress'][calc_id].append(stress)
+            atom_results['energy_per_atom'].append(energy_per_atom)
             atom_results['energy'].append(energy)
             atom_results['forces'].append(forces)
             atom_results['stress'].append(stress)
 
         prop_dict['energy']['std'].append(np.std(atom_results['energy']))
+        prop_dict['energy_per_atom']['std'].append(
+            np.std(atom_results['energy_per_atom'])
+        )
         prop_dict['forces']['mean_std'].append(
             np.mean(np.std(atom_results['forces'], axis=1))
         )
@@ -104,24 +110,39 @@ def compute_deviation(
 
     df = pd.DataFrame({
         'energy_std': prop_dict['energy']['std'],
+        'energy_per_atom_std': prop_dict['energy_per_atom']['std'],
         'force_mean_std': prop_dict['forces']['mean_std'],
         'force_max_std': prop_dict['forces']['max_std'],
         'stress_std': prop_dict['stress']['std']
 
     })
     df.to_csv('deviations.csv')
 
+    unit_dict = {
+        'energy': 'eV',
+        'energy_per_atom': 'eV/atom',
+        'forces': 'eV/$\AA$',
+        'stress': 'eV/$\AA^3$',
+    }
     for prop in properties:
         if prop not in ['forces']:
             # df = pd.DataFrame(prop_dict[prop])
             fig, ax = plt.subplots()
             for calc_id in calc_dict:
                 ax.plot(prop_dict[prop][calc_id], label=calc_id)
-            ax.set_xlabel('Image index')
-            ax.set_ylabel(f'{prop} [ASE units]')
-            ax.legend()
-            plt.savefig(f'{prop}.png')
-            plt.close()
+            ax.set_ylabel(f'{prop} {unit_dict[prop]}')
+        else:
+            fig, ax = plt.subplots()
+            for calc_id in calc_dict:
+                ax.plot(
+                    np.max(prop_dict[prop][calc_id],axis=1),
+                    label=calc_id,
+                )
+            ax.set_ylabel(f'{prop} max {unit_dict[prop]}')
+        ax.set_xlabel('Image index')    
+        ax.legend()
+        plt.savefig(f'{prop}.png')
+        plt.close()
 
         fig, ax = plt.subplots()
         if prop == 'forces':
@@ -131,7 +152,7 @@ def compute_deviation(
         else:
             ax.plot(prop_dict[prop]['std'])
         ax.set_xlabel('Image index')
-        ax.set_ylabel(f'{prop} std [ASE units]')
+        ax.set_ylabel(f'{prop} std {unit_dict[prop]}')
         plt.savefig(f'{prop}_std.png')
         plt.close()
     
diff --git a/asimtools/job.py b/asimtools/job.py
@@ -632,28 +632,27 @@ def _gen_array_script(
         txt += '\necho "Job started on `hostname` at `date`"\n'
         txt += 'CUR_DIR=`pwd`\n'
         txt += 'echo "LAUNCHDIR: ${CUR_DIR}"\n'
-        txt += f'GROUP_SIZE={group_size}\n'
-        seqtxt = '$(seq $((${SLURM_ARRAY_TASK_ID}*${GROUP_SIZE})) '
-        seqtxt += '$(((${SLURM_ARRAY_TASK_ID}+1)*${GROUP_SIZE})))'
+        txt += f'G={group_size} #Group size\n'
+        txt += 'N=${SLURM_ARRAY_TASK_ID}\n'
         txt += f'WORKDIRS=($(ls -dv ./id-*))\n'
+        seqtxt = '$(seq $(($G*$N)) $(($G*$N+$G-1)) )'
         txt += f'for i in {seqtxt}; do\n'
-        txt += 'cd ${WORKDIRS[$i]};\n'
+        txt += '    WORKDIR=${WORKDIRS[$i]}\n'
+        txt += '    cd ${WORKDIR};\n'
         # else:
         #     txt += '\nif [[ ! -z ${SLURM_ARRAY_TASK_ID} ]]; then\n'
         #     txt += '    fls=( id-* )\n'
         #     txt += '    WORKDIR=${fls[${SLURM_ARRAY_TASK_ID}]}\n'
         #     txt += 'fi\n\n'
         # txt += 'cd ${WORKDIR}\n'
-        txt += '\n'
-        txt += '\n'.join(slurm_params.get('precommands', []))
-        txt += '\n'
-        txt += '\n'.join(self.unitjobs[0].calc_params.get('precommands', []))
-        txt += '\n'
-        txt += 'echo "WORKDIR: ${WORKDIRS[$i]}"\n'
-        txt += self.unitjobs[0].gen_run_command() + '\n'
-        txt += '\n'.join(slurm_params.get('postcommands', []))
-        txt += '\n'
-        txt += 'cd ${CUR_DIR}\n'
+        txt += '    ' + '\n'.join(slurm_params.get('precommands', []))
+        txt += '    ' + '\n'.join(
+            self.unitjobs[0].calc_params.get('precommands', [])
+        )
+        txt += '    echo "WORKDIR: ${WORKDIR}"\n'
+        txt += '    ' + self.unitjobs[0].gen_run_command() + '\n'
+        txt += '    ' + '\n'.join(slurm_params.get('postcommands', [])) + '\n'
+        txt += '    cd ${CUR_DIR}\n'
         txt += 'done\n'
         txt += 'echo "Job ended at `date`"'
 
@@ -771,6 +770,7 @@ def submit_slurm_array(
         array_max=None,
         dependency: Union[List[str],None] = None,
         group_size: int = 1,
+        debug: bool = False,
         **kwargs,
     ) -> Union[None,List[int]]:
         '''
@@ -802,8 +802,6 @@ def submit_slurm_array(
             nslurm_jobs = int(np.ceil(njobs / group_size))
         else:
             nslurm_jobs = njobs
-        
-        # self._gen_array_script(group_size=group_size)
 
         if dependency is not None:
             dependstr = None
@@ -826,6 +824,12 @@ def submit_slurm_array(
                 'job_array.sh'
             ]
 
+        if debug:
+            # Only for testing purposes
+            print('SLURM command:', command)
+            os.environ['SLURM_ARRAY_TASK_ID'] = '0'
+            command = ['sh', 'job_array.sh']
+
         completed_process = subprocess.run(
             command, check=False, capture_output=True, text=True,
         )
@@ -842,7 +846,12 @@ def submit_slurm_array(
             logger.error(err_msg)
             completed_process.check_returncode()
 
-        job_ids = [int(completed_process.stdout.split(' ')[-1])]
+        if debug:
+            # logging.error('STDOUT:'+f'{completed_process.stdout}')
+            logging.error('STDERR:'+f'{completed_process.stderr}')
+            job_ids = None
+        else:
+            job_ids = [int(completed_process.stdout.split(' ')[-1])]
         return job_ids
 
     def submit(self, **kwargs) -> None:
@@ -898,7 +907,7 @@ def get_last_output(self) -> Dict:
         ''' Returns the output of the last job in the chain '''
         return self.unitjobs[-1].get_output()
 
-    def submit(self, dependency: Union[List,None] = None) -> List:
+    def submit(self, dependency: Union[List,None] = None, debug: bool = False) -> List:
         ''' 
         Submit a job using slurm, interactively or in the terminal
         '''
@@ -997,7 +1006,7 @@ def submit(self, dependency: Union[List,None] = None) -> List:
                         if i == 0:
                             write_image = True
 
-                        if only_write:
+                        if only_write or debug:
                             curjob.gen_input_files(write_image=write_image)
                         else:
                             dependency = curjob.submit(
@@ -1031,29 +1040,26 @@ def submit(self, dependency: Union[List,None] = None) -> List:
         return job_ids
 
 
-def load_job_from_directory(workdir: str):
+def load_job_from_directory(workdir: os.PathLike) -> Job:
     ''' Loads a job from a given directory '''
     workdir = Path(workdir)
-    assert workdir.exists(), f'Work director {workdir} does not exist'
+    assert workdir.exists(), f'Work directory "{workdir}" does not exist'
     logger = get_logger()
-    sim_inputs = glob(str(workdir / 'sim_input.yaml'))
-    if len(sim_inputs) != 1:
-        logger.error('Multiple or no sim_input.yaml files in %s', {workdir})
     try:
-        sim_input = read_yaml(glob(str(workdir / 'sim_input.yaml'))[0])
+        sim_input = read_yaml(workdir / 'sim_input.yaml')
     except IndexError as exc:
         logger.error('sim_input.yaml not found in %s', {str(workdir)})
         raise exc
 
-    env_inputs = glob(str(workdir / 'env_input.yaml'))
-    if len(env_inputs) == 1:
-        env_input = read_yaml(env_inputs[0])
+    env_input_file = workdir / 'env_input.yaml'
+    if env_input_file.exists():
+        env_input = read_yaml(env_input_file)
     else:
         env_input = None
 
-    calc_inputs = glob(str(workdir / 'calc_input.yaml'))
-    if len(calc_inputs) == 1:
-        calc_input = read_yaml(calc_inputs[0])
+    calc_input_file = workdir / 'calc_input.yaml'
+    if calc_input_file.exists():
+        calc_input = read_yaml(calc_input_file)
     else:
         calc_input = None
 
diff --git a/tests/asimmodules/workflows/test_distributed.py b/tests/asimmodules/workflows/test_distributed.py
@@ -2,9 +2,28 @@
 Tests for running asimmodules using asim_run.py
 """
 from glob import glob
+import os
 import pytest
-from asimtools.job import create_unitjob
-from asimtools.job import load_job_from_directory
+from asimtools.job import (
+    create_unitjob,
+    DistributedJob,
+    load_job_from_directory,
+)
+
+def create_distjob(sim_input, env_input, workdir, calc_input=None):
+    """Helper for making a generic DistributedJob object, mostly for testing"""
+    env_id = list(env_input.keys())[0]
+    sim_input['env_id'] = env_id
+    if calc_input is not None:
+        calc_id = list(calc_input.keys())[0]
+        sim_input['calc_id'] = calc_id
+    sim_input['workdir'] = workdir
+    distjob = DistributedJob(
+        sim_input['args']['subsim_inputs'],
+        env_input,
+        calc_input,
+    )
+    return distjob
 
 @pytest.mark.parametrize("calc_input",["lj_argon_calc_input"])
 @pytest.mark.parametrize("env_input",["inline_env_input"])
@@ -31,30 +50,38 @@ def test_distributed(env_input, calc_input, sim_input, tmp_path, request):
 
     assert unitjob.get_status(descend=True) == (True, 'complete')
 
-# @pytest.mark.parametrize("calc_input",["lj_argon_calc_input"])
-# @pytest.mark.parametrize("env_input",["batch_env_input"])
-# @pytest.mark.parametrize("sim_input",[
-#     "lj_distributed_batch_sim_input",
-#     "lj_distributed_group_batch_sim_input",
-# ])
-# def test_batch_distributed(env_input, calc_input, sim_input, tmp_path, request):
-#     env_input = request.getfixturevalue(env_input)
-#     calc_input = request.getfixturevalue(calc_input)
-#     sim_input = request.getfixturevalue(sim_input)
-#     wdir = tmp_path / 'wdir'
-#     unitjob = create_unitjob(sim_input, env_input, wdir, calc_input=calc_input)
-#     unitjob.submit()
-
-#     assert load_job_from_directory(wdir).get_status()[1] == 'complete'
-#     dirs = glob(str(wdir / 'id*'))
-#     assert len(dirs) == len(sim_input['args']['subsim_inputs'])
-
-#     for d in dirs:
-#         assert str(d).rsplit('/', maxsplit=1)[-1].startswith('id-')
-
-#         uj = load_job_from_directory(d)
-#         assert uj.get_status()[1] == 'complete'
-
-#         assert uj.get_sim_input()['workdir'] == './'
-
-#     assert unitjob.get_status(descend=True) == (True, 'complete')
+@pytest.mark.parametrize("calc_input",["lj_argon_calc_input"])
+@pytest.mark.parametrize("env_input",["batch_env_input"])
+@pytest.mark.parametrize("sim_input",[
+    "lj_distributed_batch_sim_input",
+    "lj_distributed_group_batch_sim_input",
+])
+def test_batch_distributed(env_input, calc_input, sim_input, tmp_path, request):
+    env_input = request.getfixturevalue(env_input)
+    calc_input = request.getfixturevalue(calc_input)
+    sim_input = request.getfixturevalue(sim_input)
+    group_size = sim_input['args'].get('group_size', 1)
+    wdir = tmp_path
+    os.chdir(wdir)
+    distjob = create_distjob(sim_input, env_input, wdir, calc_input=calc_input)
+    group_size=sim_input['args'].get('group_size', 1)
+    array_max=sim_input['args'].get('array_max', None)
+    skip_failed=sim_input['args'].get('skip_failed', False)
+    distjob.submit(
+        debug=True,
+        group_size=group_size,
+        array_max=array_max,
+        skip_failed=skip_failed,
+    )
+    dirs = glob(str(wdir / 'id*'))
+    assert len(dirs) == len(sim_input['args']['subsim_inputs'])
+
+    statuses = ['complete'] * group_size + ['clean'] * (len(dirs) - 1)
+    for d_ind, d in enumerate(dirs):
+        assert str(d).rsplit('/', maxsplit=1)[-1].startswith('id-')
+
+        uj = load_job_from_directory(d)
+        print(uj.workdir, uj.get_status())
+        assert uj.get_status()[1] == statuses[d_ind]
+
+    # assert distjob.get_status(descend=False) == (True, 'complete')
diff --git a/tests/conftest.py b/tests/conftest.py
@@ -290,7 +290,7 @@ def lj_distributed_batch_sim_input():
     '''
     subsim_input = {
         'asimmodule': 'singlepoint',
-        'env_id': 'inline',
+        'env_id': 'batch',
         'args': {
             'calc_id': 'lj',
             'image': {
@@ -321,7 +321,7 @@ def lj_distributed_group_batch_sim_input():
     '''
     subsim_input = {
         'asimmodule': 'singlepoint',
-        'env_id': 'inline', # This should be overwrriten by the group env
+        'env_id': 'batch', # This should be overwrriten by the group env
         'args': {
             'calc_id': 'lj',
             'image': {
@@ -346,3 +346,4 @@ def lj_distributed_group_batch_sim_input():
     }
 
     return sim_input
+

Original file line number	Diff line number	Diff line change
`@@ -221,6 +221,7 @@ def ase_md(`
`221`	`221`	`friction=friction,`
`222`	`222`	`)`
`223`	`223`	`elif dynamics == 'npt':`
	`224`	`+ assert pfactor is not None, 'Pressure factor must be provided'`
`224`	`225`	`atoms, _ = npt(`
`225`	`226`	`atoms,`
`226`	`227`	`temp,`