PecanProject · DongchenZ · Oct 3, 2025 · Oct 3, 2025 · Oct 3, 2025 · Oct 5, 2025
diff --git a/modules/assim.sequential/R/sda.enkf_MultiSite.R b/modules/assim.sequential/R/sda.enkf_MultiSite.R
diff --git a/modules/assim.sequential/R/sda.enkf_parallel.R b/modules/assim.sequential/R/sda.enkf_parallel.R
@@ -9,7 +9,7 @@
 #' @param obs.cov   Lists of date times named by time points, which contains lists of sites named by site ids, which contains observation covariances for all state variables of each site for each time point. 
 #' @param Q         Process covariance matrix given if there is no data to estimate it.
 #' @param pre_enkf_params Used for passing pre-existing time-series of process error into the current SDA runs to ignore the impact by the differences between process errors.
-#' @param ensemble.samples Pass ensemble.samples from outside to avoid GitHub check issues.
+#' @param ensemble.samples list of ensemble parameters across PFTs. Default is NULL.
 #' @param outdir physical path to the folder that stores the SDA outputs. Default is NULL.
 #' @param control   List of flags controlling the behavior of the SDA. 
 #' `TimeseriesPlot` for post analysis examination; 
@@ -218,6 +218,10 @@ sda.enkf_local <- function(settings,
                                                                                 parent_ids=NULL)
     }
   }
+  # get the joint input design.
+  input_design <- generate_joint_ensemble_design(settings = settings[[1]], 
+                                                 ensemble_samples = ensemble.samples, 
+                                                 ensemble_size = nens)[[1]]
   ###------------------------------------------------------------------------------------------------###
   ### loop over time                                                                                 ###
   ###------------------------------------------------------------------------------------------------###
@@ -226,7 +230,7 @@ sda.enkf_local <- function(settings,
     sda.outputs <- FORECAST <- enkf.params <- ANALYSIS <- ens_weights <- list()
     obs.t <- as.character(lubridate::date(obs.times[t]))
     obs.year <- lubridate::year(obs.t)
-    PEcAn.logger::logger.info(paste("Processing Year:", obs.year))
+    PEcAn.logger::logger.info(paste("Processing date:", obs.t))
     ###-------------------------------------------------------------------------###
     ###  Taking care of Forecast. Splitting /  Writting / running / reading back###
     ###-------------------------------------------------------------------------###-----  
@@ -286,22 +290,39 @@ sda.enkf_local <- function(settings,
     # release memory.
     gc()
     # submit jobs for writing configs.
+    # writing configs for each settings
     PEcAn.logger::logger.info("Writting configs!")
-    out.configs <- furrr::future_pmap(list(conf.settings %>% `class<-`(c("list")), restart.list, inputs), function(settings, restart.arg, inputs) {
-      # Loading the model package - this is required bc of the furrr
-      library(paste0("PEcAn.",settings$model$type), character.only = TRUE)
-      # wrtting configs for each settings - this does not make a difference with the old code
-      PEcAn.uncertainty::write.ensemble.configs(
-        defaults = settings$pfts,
-        ensemble.samples = ensemble.samples,
-        settings = settings,
-        model = settings$model$type,
-        write.to.db = settings$database$bety$write,
-        restart = restart.arg,
-        samples=inputs,
-        rename = F
-      )
-    }) %>% stats::setNames(site.ids)
+    # here we use the foreach instead of furrr
+    # because for some reason, the furrr has problem returning the sample paths.
+    cl <- parallel::makeCluster(parallel::detectCores())
+    doSNOW::registerDoSNOW(cl)
+    out.configs <- foreach::foreach(temp.settings = as.list(conf.settings), 
+                                    restart.arg = restart.list,
+                                    .packages = c("Kendall", 
+                                                  "purrr", 
+                                                  "PEcAn.uncertainty", 
+                                                  paste0("PEcAn.", model), 
+                                                  "PEcAnAssimSequential")) %dopar% {
+                                                    temp <- PEcAn.uncertainty::write.ensemble.configs(
+                                                      input_design = input_design,
+                                                      ensemble.size = nens,
+                                                      defaults = temp.settings$pfts,
+                                                      ensemble.samples = ensemble.samples,
+                                                      settings = temp.settings,
+                                                      model = temp.settings$model$type,
+                                                      write.to.db = temp.settings$database$bety$write,
+                                                      restart = restart.arg,
+                                                      # samples=inputs,
+                                                      rename = TRUE
+                                                    )
+                                                    return(temp)
+                                                  } %>% stats::setNames(site.ids)
+    parallel::stopCluster(cl)
+    foreach::registerDoSEQ()
+    # update the file paths of different inputs when t = 1.
+    if (t == 1) {
+      inputs <- out.configs %>% purrr::map(~.x$samples)
+    }
     # collect run info.
     # get ensemble ids for each site.
     ensemble.ids <- site.ids %>% furrr::future_map(function(i){

diff --git a/modules/assim.sequential/man/sda.enkf.multisite.Rd b/modules/assim.sequential/man/sda.enkf.multisite.Rd
diff --git a/modules/assim.sequential/man/sda.enkf_local.Rd b/modules/assim.sequential/man/sda.enkf_local.Rd
diff --git a/modules/uncertainty/R/ensemble.R b/modules/uncertainty/R/ensemble.R
@@ -211,7 +211,6 @@ get.ensemble.samples <- function( ensemble.size, pft.samples, env.samples,
 ##' @param clean remove old output first?
 ##' @param write.to.db logical: Record this run in BETY?
 ##' @param restart In case this is a continuation of an old simulation. restart needs to be a list with name tags of runid, inputs, new.params (parameters), new.state (initial condition), ensemble.id (ensemble id), start.time and stop.time.See Details.
-##' @param samples Sampled inputs such as met and parameter files
 ##' @param rename Decide if we want to rename previous output files, for example convert from sipnet.out to sipnet.2020-07-16.out.
 ##'
 ##' @return list, containing $runs = data frame of runids, $ensemble.id = the ensemble ID for these runs and $samples with ids and samples used for each tag.  Also writes sensitivity analysis configuration files as a side effect
@@ -226,7 +225,7 @@ get.ensemble.samples <- function( ensemble.size, pft.samples, env.samples,
 ##' @export
 ##' @author David LeBauer, Carl Davidson, Hamze Dokoohaki
 write.ensemble.configs <- function(input_design , ensemble.size, defaults, ensemble.samples, settings, model, 
-                                   clean = FALSE, write.to.db = TRUE, restart = NULL, samples = NULL, rename = FALSE) {
+                                   clean = FALSE, write.to.db = TRUE, restart = NULL, rename = FALSE) {
 
 
   # Check if there are NO inputs
@@ -320,22 +319,18 @@ for (input_tag in names(settings$run$inputs)) {
     }
     #now looking into the xml
     samp <- settings$ensemble$samplingspace
-    if(is.null(samples)){
-       #performing the sampling
-      samples <- list()
-      input_tags <- names(settings$run$inputs)
-
-      for (input_tag in input_tags) {
-           if (input_tag %in% colnames(input_design)) {
-                  input_paths <- settings$run$inputs[[input_tag]]$path
-                  input_indices <- input_design[[input_tag]]
-
-                 samples[[input_tag]] <- list(
-                   samples = lapply(input_indices, function(idx) input_paths[[idx]])
-                 )
-    }
-
-     }
+    #performing the sampling
+    samples <- list()
+    input_tags <- names(settings$run$inputs)
+    for (input_tag in input_tags) {
+      if (input_tag %in% colnames(input_design)) {
+        input_paths <- settings$run$inputs[[input_tag]]$path
+        input_indices <- input_design[[input_tag]]
+
+        samples[[input_tag]] <- list(
+          samples = lapply(input_indices, function(idx) input_paths[[idx]])
+        )
+      }
     }
     # if there is a tag required by the model but it is not specified in the xml then I replicate n times the first element 
     required_tags%>%
@@ -515,6 +510,8 @@ for (input_tag in names(settings$run$inputs)) {
     for (i in seq_len(ensemble.size)) {
       input_list <- list()
       for (input_tag in names(inputs)) {
+        # if it's the parameter list, skip.
+        if (input_tag == "parameters") next
         if (!is.null(inputs[[input_tag]]$samples[[i]])) 
           input_list[[input_tag]] <- list(path = inputs[[input_tag]]$samples[[i]])
       }

diff --git a/modules/uncertainty/R/generate_joint_ensemble_design.R b/modules/uncertainty/R/generate_joint_ensemble_design.R
@@ -4,19 +4,20 @@
 #' are shared across sites to ensure consistent parameter sampling.
 #'
 #' @param settings A PEcAn settings object containing ensemble configuration
-#' @param sobol for activating sobol
 #' @param ensemble_size Integer specifying the number of ensemble members
+#' @param ensemble_samples list of ensemble parameters across PFTs. The default is NULL.
+#' @param sobol for activating sobol
 #' @return  A list containing ensemble samples and indices
 #'
 #' @export
 
 generate_joint_ensemble_design <- function(settings,
                                            ensemble_size,
+                                           ensemble_samples = NULL,
                                            sobol = FALSE) {
   if (sobol) {
     ensemble_size <- as.numeric(ensemble_size) * 2
   }
-
   ens.sample.method <- settings$ensemble$samplingspace$parameters$method
   design_list <- list()
   sampled_inputs <- list()
@@ -51,29 +52,34 @@ generate_joint_ensemble_design <- function(settings,
     sampled_inputs[[input_tag]] <- input_result$ids
     design_list[[input_tag]] <- input_result$ids
   }
-
-  # Sample parameters
-  PEcAn.uncertainty::get.parameter.samples(
-    settings,
-    ensemble.size = ensemble_size,
-    posterior.files,
-    ens.sample.method
-  )
-
+
+  # Sample parameters if we don't have it.
+  if (is.null(ensemble_samples)) {
+    PEcAn.uncertainty::get.parameter.samples(
+      settings,
+      ensemble.size = ensemble_size,
+      posterior.files,
+      ens.sample.method
+    )
+    samples.file <- file.path(settings$outdir, "samples.Rdata")
+  }
+
   # Load samples from file
-  samples.file <- file.path(settings$outdir, "samples.Rdata")
   samples <- new.env()
-  if (file.exists(samples.file)) {
-    load(samples.file, envir = samples)
-    if (!is.null(samples$ensemble.samples)) {
-      # Just a placeholder: extract representative trait index per ensemble member
-      # You may want to flatten or select indices per trait
-      design_list[["param"]] <- seq_len(ensemble_size)
+  # if we don't have the parameters from the outside. 
+  if (is.null(ensemble_samples)) {
+    if (ile.exists(samples.file)) {
+      load(samples.file, envir = samples)
     } else {
-      PEcAn.logger::logger.warn("ensemble.samples not found in samples.Rdata")
+      PEcAn.logger::logger.error(samples.file, "not found, this file is required")
     }
+  }
+  if (!is.null(samples$ensemble.samples) | !is.null(ensemble_samples)) {
+    # Just a placeholder: extract representative trait index per ensemble member
+    # You may want to flatten or select indices per trait
+    design_list[["param"]] <- seq_len(ensemble_size)
   } else {
-    PEcAn.logger::logger.error(samples.file, "not found, this file is required")
+    PEcAn.logger::logger.warn("ensemble.samples not found in samples.Rdata")
   }
   design_matrix <- data.frame(design_list)
 
@@ -85,7 +91,5 @@ generate_joint_ensemble_design <- function(settings,
     return(sobol_obj)
   }
 
-
-
   return(list(X = design_matrix))
-}
+}
diff --git a/modules/uncertainty/man/generate_joint_ensemble_design.Rd b/modules/uncertainty/man/generate_joint_ensemble_design.Rd
diff --git a/modules/uncertainty/man/write.ensemble.configs.Rd b/modules/uncertainty/man/write.ensemble.configs.Rd