diff --git a/R/add_MACor.R b/R/add_MACor.R
index 10ff6a23..9431812d 100644
--- a/R/add_MACor.R
+++ b/R/add_MACor.R
@@ -19,11 +19,11 @@ add_MaCor = function(model_file,
         if(any(grepl('transformed data {', model_file, fixed = TRUE))){
           model_file[grep('transformed data {', model_file, fixed = TRUE)] <-
             paste0('transformed data {\n',
-                   'vector[n_series] trend_zeros = rep_vector(0.0, n_lv);')
+                   'vector[n_lv] trend_zeros = rep_vector(0.0, n_lv);')
         } else {
           model_file[grep('parameters {', model_file, fixed = TRUE)[1]] <-
             paste0('transformed data {\n',
-                   'vector[n_series] trend_zeros = rep_vector(0.0, n_lv);\n',
+                   'vector[n_lv] trend_zeros = rep_vector(0.0, n_lv);\n',
                    '}\nparameters {')
         }
 
diff --git a/R/ppc.mvgam.R b/R/ppc.mvgam.R
index 47ddf108..e32d20d6 100644
--- a/R/ppc.mvgam.R
+++ b/R/ppc.mvgam.R
@@ -71,7 +71,7 @@ ppc.mvgam = function(object, newdata, data_test, series = 1, type = 'hist',
                                             "prop_zero"))
 
   if(type == 'rootogram'){
-    if(!object$family %in% c('poisson', 'negative binomial', 'tweedie')){
+    if(!object$family %in% c('poisson', 'negative binomial', 'tweedie', 'nmix')){
       stop('Rootograms not supported for checking non-count data',
            call. = FALSE)
     }
@@ -235,7 +235,7 @@ ppc.mvgam = function(object, newdata, data_test, series = 1, type = 'hist',
       preds <- mcmc_chains(object$model_output, 'ypred')[,starts[series]:ends[series]]
     }
 
-    preds <- preds[,1:length(truths)]
+    preds <- preds[,1:length(truths), drop = FALSE]
 
     if(NROW(preds) > 4000){
       preds <- preds[sample(1:NROW(preds), 4000, F), ]
diff --git a/docs/articles/nmixtures.html b/docs/articles/nmixtures.html
new file mode 100644
index 00000000..b94b6883
--- /dev/null
+++ b/docs/articles/nmixtures.html
@@ -0,0 +1,1060 @@
+<!DOCTYPE html>
+<!-- Generated by pkgdown: do not edit by hand --><html lang="en">
+<head>
+<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
+<meta charset="utf-8">
+<meta http-equiv="X-UA-Compatible" content="IE=edge">
+<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
+<meta name="description" content="mvgam">
+<title>N-mixtures in mvgam • mvgam</title>
+<script src="../deps/jquery-3.6.0/jquery-3.6.0.min.js"></script><meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
+<link href="../deps/bootstrap-5.2.2/bootstrap.min.css" rel="stylesheet">
+<script src="../deps/bootstrap-5.2.2/bootstrap.bundle.min.js"></script><!-- Font Awesome icons --><link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/all.min.css" integrity="sha256-mmgLkCYLUQbXn0B1SRqzHar6dCnv9oZFPEC1g1cwlkk=" crossorigin="anonymous">
+<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/5.12.1/css/v4-shims.min.css" integrity="sha256-wZjR52fzng1pJHwx4aV2AO3yyTOXrcDW7jBpJtTwVxw=" crossorigin="anonymous">
+<!-- bootstrap-toc --><script src="https://cdn.jsdelivr.net/gh/afeld/bootstrap-toc@v1.0.1/dist/bootstrap-toc.min.js" integrity="sha256-4veVQbu7//Lk5TSmc7YV48MxtMy98e26cf5MrgZYnwo=" crossorigin="anonymous"></script><!-- headroom.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/headroom.min.js" integrity="sha256-AsUX4SJE1+yuDu5+mAVzJbuYNPHj/WroHuZ8Ir/CkE0=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/headroom/0.11.0/jQuery.headroom.min.js" integrity="sha256-ZX/yNShbjqsohH1k95liqY9Gd8uOiE1S4vZc+9KQ1K4=" crossorigin="anonymous"></script><!-- clipboard.js --><script src="https://cdnjs.cloudflare.com/ajax/libs/clipboard.js/2.0.6/clipboard.min.js" integrity="sha256-inc5kl9MA1hkeYUt+EC3BhlIgyp/2jDIyBLS6k3UxPI=" crossorigin="anonymous"></script><!-- search --><script src="https://cdnjs.cloudflare.com/ajax/libs/fuse.js/6.4.6/fuse.js" integrity="sha512-zv6Ywkjyktsohkbp9bb45V6tEMoWhzFzXis+LrMehmJZZSys19Yxf1dopHx7WzIKxr5tK2dVcYmaCk2uqdjF4A==" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/autocomplete.js/0.38.0/autocomplete.jquery.min.js" integrity="sha512-GU9ayf+66Xx2TmpxqJpliWbT5PiGYxpaG8rfnBEk1LL8l1KGkRShhngwdXK1UgqhAzWpZHSiYPc09/NwDQIGyg==" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mark.js/8.11.1/mark.min.js" integrity="sha512-5CYOlHXGh6QpOFA/TeTylKLWfB3ftPsde7AnmhuitiTX4K5SqCLBeKro6sPS8ilsz1Q4NRx3v8Ko2IBiszzdww==" crossorigin="anonymous"></script><!-- pkgdown --><script src="../pkgdown.js"></script><meta property="og:title" content="N-mixtures in mvgam">
+<meta property="og:description" content="mvgam">
+<!-- mathjax --><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js" integrity="sha256-nvJJv9wWKEm88qvoQl9ekL2J+k/RWIsaSScxxlsrv8k=" crossorigin="anonymous"></script><script src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/config/TeX-AMS-MML_HTMLorMML.js" integrity="sha256-84DKXVJXs0/F8OTMzX4UR909+jtl4G7SPypPavF+GfA=" crossorigin="anonymous"></script><!--[if lt IE 9]>
+<script src="https://oss.maxcdn.com/html5shiv/3.7.3/html5shiv.min.js"></script>
+<script src="https://oss.maxcdn.com/respond/1.4.2/respond.min.js"></script>
+<![endif]-->
+</head>
+<body>
+    <a href="#main" class="visually-hidden-focusable">Skip to contents</a>
+    
+
+    <nav class="navbar fixed-top navbar-dark navbar-expand-lg bg-primary"><div class="container">
+    
+    <a class="navbar-brand me-2" href="../index.html">mvgam</a>
+
+    <small class="nav-text text-muted me-auto" data-bs-toggle="tooltip" data-bs-placement="bottom" title="">1.0.91</small>
+
+    
+    <button class="navbar-toggler" type="button" data-bs-toggle="collapse" data-bs-target="#navbar" aria-controls="navbar" aria-expanded="false" aria-label="Toggle navigation">
+      <span class="navbar-toggler-icon"></span>
+    </button>
+
+    <div id="navbar" class="collapse navbar-collapse ms-3">
+      <ul class="navbar-nav me-auto">
+<li class="nav-item">
+  <a class="nav-link" href="../reference/index.html">Reference</a>
+</li>
+<li class="active nav-item dropdown">
+  <a href="#" class="nav-link dropdown-toggle" data-bs-toggle="dropdown" role="button" aria-expanded="false" aria-haspopup="true" id="dropdown-articles">Articles</a>
+  <div class="dropdown-menu" aria-labelledby="dropdown-articles">
+    <a class="dropdown-item" href="../articles/data_in_mvgam.html">Formatting data for use in mvgam</a>
+    <a class="dropdown-item" href="../articles/forecast_evaluation.html">Forecasting and forecast evaluation in mvgam</a>
+    <a class="dropdown-item" href="../articles/mvgam_overview.html">Overview of the mvgam package</a>
+    <a class="dropdown-item" href="../articles/nmixtures.html">N-mixtures in mvgam</a>
+    <a class="dropdown-item" href="../articles/shared_states.html">Shared latent states in mvgam</a>
+    <a class="dropdown-item" href="../articles/time_varying_effects.html">Time-varying effects in mvgam</a>
+    <a class="dropdown-item" href="../articles/trend_formulas.html">State-Space models in mvgam</a>
+  </div>
+</li>
+      </ul>
+<form class="form-inline my-2 my-lg-0" role="search">
+        <input type="search" class="form-control me-sm-2" aria-label="Toggle navigation" name="search-input" data-search-index="../search.json" id="search-input" placeholder="Search for" autocomplete="off">
+</form>
+
+      <ul class="navbar-nav">
+<li class="nav-item">
+  <a class="external-link nav-link" href="https://github.com/nicholasjclark/mvgam/" aria-label="github">
+    <span class="fab fa fab fa-github fa-lg"></span>
+     
+  </a>
+</li>
+      </ul>
+</div>
+
+    
+  </div>
+</nav><div class="container template-article">
+
+
+
+
+<div class="row">
+  <main id="main" class="col-md-9"><div class="page-header">
+      <img src="" class="logo" alt=""><h1>N-mixtures in mvgam</h1>
+                        <h4 data-toc-skip class="author">Nicholas J
+Clark</h4>
+            
+            <h4 data-toc-skip class="date">2024-01-29</h4>
+      
+      <small class="dont-index">Source: <a href="https://github.com/nicholasjclark/mvgam/blob/HEAD/vignettes/nmixtures.Rmd" class="external-link"><code>vignettes/nmixtures.Rmd</code></a></small>
+      <div class="d-none name"><code>nmixtures.Rmd</code></div>
+    </div>
+
+    
+    
+<p>The purpose of this vignette is to show how the <code>mvgam</code>
+package can be used to fit and interrogate N-mixture models for
+population abundance counts made with imperfect detection.</p>
+<div class="section level2">
+<h2 id="n-mixture-models">N-mixture models<a class="anchor" aria-label="anchor" href="#n-mixture-models"></a>
+</h2>
+<p>An N-mixture model is a fairly recent addition to the ecological
+modeller’s toolkit that is designed to make inferences about variation
+in the abundance of species when observations are imperfect (<a href="https://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.2004.00142.x" target="_blank" class="external-link">Royle 2004</a>). Briefly, assume <span class="math inline">\(\boldsymbol{Y_{i,r}}\)</span> is the number of
+individuals recorded at site <span class="math inline">\(i\)</span>
+during replicate sampling observation <span class="math inline">\(r\)</span> (recorded as a non-negative integer).
+If multiple replicate surveys are done within a short enough period to
+satisfy the assumption that the population remained closed (i.e. there
+was no substantial change in true population size between replicate
+surveys), we can account for the fact that observations aren’t perfect.
+This is done by assuming that these replicate observations are Binomial
+random variables that are parameterized by the true “latent” abundance
+<span class="math inline">\(N\)</span> and a detection probability <span class="math inline">\(p\)</span>:</p>
+<p><span class="math display">\[\begin{align*}
+\boldsymbol{Y_{i,r}} &amp; \sim \text{Binomial}(N_i, p_r) \\
+N_{i} &amp; \sim \text{Poisson}(\lambda_i)  \end{align*}\]</span></p>
+<p>Using a set of linear predictors, we can estimate effects of
+covariates <span class="math inline">\(\boldsymbol{X}\)</span> on the
+expected latent abundance (with a log link for <span class="math inline">\(\lambda\)</span>) and, jointly, effects of
+possibly different covariates (call them <span class="math inline">\(\boldsymbol{Q}\)</span>) on detection probability
+(with a logit link for <span class="math inline">\(p\)</span>):</p>
+<p><span class="math display">\[\begin{align*}
+log(\lambda) &amp; = \beta \boldsymbol{X} \\
+logit(p) &amp; = \gamma \boldsymbol{Q}\end{align*}\]</span></p>
+<p><code>mvgam</code> can handle this type of model because it is
+designed to propagate unobserved temporal processes that evolve
+independently of the observation process in a State-space format. This
+setup adapts well to N-mixture models because they can be thought of as
+State-space models in which the latent state is a discrete variable
+representing the “true” but unknown population size. This is very
+convenient because we can incorporate any of the package’s diverse
+effect types (i.e. multidimensional splines, time-varying effects,
+monotonic effects, random effects etc…) into the linear predictors. All
+that is required for this to work is a marginalization trick that allows
+<code>Stan</code>’s sampling algorithms to handle discrete parameters
+(see more about how this method of “integrating out” discrete parameters
+works in <a href="https://mbjoseph.github.io/posts/2020-04-28-a-step-by-step-guide-to-marginalizing-over-discrete-parameters-for-ecologists-using-stan/" target="_blank" class="external-link">this nice blog post by Maxwell Joseph</a>).</p>
+<p>The family <code><a href="../reference/mvgam_families.html">nmix()</a></code> is used to set up N-mixture models in
+<code>mvgam</code>, but we still need to do a little bit of data
+wrangling to ensure the data are set up in the correct format (this is
+especially true when we have more than one replicate survey per time
+period). The most important aspects are: (1) how we set up the
+observation <code>series</code> and <code>trend_map</code> arguments to
+ensure replicate surveys are mapped to the correct latent abundance
+model and (2) the inclusion of a <code>cap</code> variable that defines
+the maximum possible integer value to use for each observation when
+estimating latent abundance. The two examples below give a reasonable
+overview of how this can be done.</p>
+</div>
+<div class="section level2">
+<h2 id="example-1-a-two-species-system-with-nonlinear-trends">Example 1: a two-species system with nonlinear trends<a class="anchor" aria-label="anchor" href="#example-1-a-two-species-system-with-nonlinear-trends"></a>
+</h2>
+<p>First we will use a simple simulation in which multiple replicate
+observations are taken at each timepoint for two different species. The
+simulation produces observations at a single site over six years, with
+five replicate surveys per year. Each species is simulated to have
+different nonlinear temporal trends and different detection
+probabilities. For now, detection probability is fixed (i.e. it does not
+change over time or in association with any covariates). Notice that we
+add the <code>cap</code> variable, which does not need to be static, to
+define the maximum possible value that we think the latent abundance
+could be for each timepoint. This simply needs to be large enough that
+we get a reasonable idea of which latent N values are most likely,
+without adding too much computational cost:</p>
+<div class="sourceCode" id="cb1"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/Random.html" class="external-link">set.seed</a></span><span class="op">(</span><span class="fl">999</span><span class="op">)</span></span>
+<span><span class="co"># Simulate observations for species 1, which shows a declining trend and 0.7 detection probability</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>site <span class="op">=</span> <span class="fl">1</span>,</span>
+<span>           <span class="co"># five replicates per year; six years</span></span>
+<span>           replicate <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">6</span><span class="op">)</span>,</span>
+<span>           time <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sort.html" class="external-link">sort</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">1</span><span class="op">:</span><span class="fl">6</span>, <span class="fl">5</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>           species <span class="op">=</span> <span class="st">'sp_1'</span>,</span>
+<span>           <span class="co"># true abundance declines nonlinearly</span></span>
+<span>           truth <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">28</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                     <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">26</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                     <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">23</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                     <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">16</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                     <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">14</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                     <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">14</span>, <span class="fl">5</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>           <span class="co"># observations are taken with detection prob = 0.7</span></span>
+<span>           obs <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">28</span>, <span class="fl">0.7</span><span class="op">)</span>,</span>
+<span>                   <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">26</span>, <span class="fl">0.7</span><span class="op">)</span>,</span>
+<span>                   <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">23</span>, <span class="fl">0.7</span><span class="op">)</span>,</span>
+<span>                   <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">15</span>, <span class="fl">0.7</span><span class="op">)</span>,</span>
+<span>                   <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">14</span>, <span class="fl">0.7</span><span class="op">)</span>,</span>
+<span>                   <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">14</span>, <span class="fl">0.7</span><span class="op">)</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="co"># add 'series' information, which is an identifier of site, replicate and species</span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>series <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="st">'site_'</span>, <span class="va">site</span>,</span>
+<span>                                <span class="st">'_'</span>, <span class="va">species</span>,</span>
+<span>                                <span class="st">'_rep_'</span>, <span class="va">replicate</span><span class="op">)</span>,</span>
+<span>                time <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/numeric.html" class="external-link">as.numeric</a></span><span class="op">(</span><span class="va">time</span><span class="op">)</span>,</span>
+<span>                <span class="co"># add a 'cap' variable that defines the maximum latent N to </span></span>
+<span>                <span class="co"># marginalize over when estimating latent abundance; in other words</span></span>
+<span>                <span class="co"># how large do we realistically think the true abundance could be?</span></span>
+<span>                cap <span class="op">=</span> <span class="fl">100</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/select.html" class="external-link">select</a></span><span class="op">(</span><span class="op">-</span> <span class="va">replicate</span><span class="op">)</span> <span class="op">-&gt;</span> <span class="va">testdat</span></span>
+<span></span>
+<span><span class="co"># Now add another species that has a different temporal trend and a smaller </span></span>
+<span><span class="co"># detection probability (0.45 for this species)</span></span>
+<span><span class="va">testdat</span> <span class="op">=</span> <span class="va">testdat</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/bind_rows.html" class="external-link">bind_rows</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>site <span class="op">=</span> <span class="fl">1</span>,</span>
+<span>                              replicate <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">1</span><span class="op">:</span><span class="fl">5</span>, <span class="fl">6</span><span class="op">)</span>,</span>
+<span>                              time <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/sort.html" class="external-link">sort</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">1</span><span class="op">:</span><span class="fl">6</span>, <span class="fl">5</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                              species <span class="op">=</span> <span class="st">'sp_2'</span>,</span>
+<span>                              truth <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">4</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                                        <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">7</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                                        <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">15</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                                        <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">16</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                                        <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">19</span>, <span class="fl">5</span><span class="op">)</span>,</span>
+<span>                                        <span class="fu"><a href="https://rdrr.io/r/base/rep.html" class="external-link">rep</a></span><span class="op">(</span><span class="fl">18</span>, <span class="fl">5</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                              obs <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">4</span>, <span class="fl">0.45</span><span class="op">)</span>,</span>
+<span>                                      <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">7</span>, <span class="fl">0.45</span><span class="op">)</span>,</span>
+<span>                                      <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">15</span>, <span class="fl">0.45</span><span class="op">)</span>,</span>
+<span>                                      <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">16</span>, <span class="fl">0.45</span><span class="op">)</span>,</span>
+<span>                                      <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">19</span>, <span class="fl">0.45</span><span class="op">)</span>,</span>
+<span>                                      <span class="fu"><a href="https://rdrr.io/r/stats/Binomial.html" class="external-link">rbinom</a></span><span class="op">(</span><span class="fl">5</span>, <span class="fl">18</span>, <span class="fl">0.45</span><span class="op">)</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>                     <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>series <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="st">'site_'</span>, <span class="va">site</span>,</span>
+<span>                                                   <span class="st">'_'</span>, <span class="va">species</span>,</span>
+<span>                                                   <span class="st">'_rep_'</span>, <span class="va">replicate</span><span class="op">)</span>,</span>
+<span>                                   time <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/numeric.html" class="external-link">as.numeric</a></span><span class="op">(</span><span class="va">time</span><span class="op">)</span>,</span>
+<span>                                   cap <span class="op">=</span> <span class="fl">50</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>                     <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/select.html" class="external-link">select</a></span><span class="op">(</span><span class="op">-</span><span class="va">replicate</span><span class="op">)</span><span class="op">)</span></span></code></pre></div>
+<p>This data format isn’t too difficult to set up, but it does differ
+from the traditional multidimensional array setup that is commonly used
+for fitting N-mixture models in other software packages. Next we ensure
+that species and series IDs are included as factor variables, in case
+we’d like to allow certain effects to vary by species</p>
+<div class="sourceCode" id="cb2"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">testdat</span><span class="op">$</span><span class="va">species</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="va">testdat</span><span class="op">$</span><span class="va">species</span>,</span>
+<span>                          levels <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="va">testdat</span><span class="op">$</span><span class="va">species</span><span class="op">)</span><span class="op">)</span></span>
+<span><span class="va">testdat</span><span class="op">$</span><span class="va">series</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="va">testdat</span><span class="op">$</span><span class="va">series</span>,</span>
+<span>                         levels <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="va">testdat</span><span class="op">$</span><span class="va">series</span><span class="op">)</span><span class="op">)</span></span></code></pre></div>
+<p>Preview the dataset to get an idea of how it is structured:</p>
+<div class="sourceCode" id="cb3"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://pillar.r-lib.org/reference/glimpse.html" class="external-link">glimpse</a></span><span class="op">(</span><span class="va">testdat</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## Rows: 60</span></span>
+<span><span class="co">## Columns: 7</span></span>
+<span><span class="co">## $ site    <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…</span></span>
+<span><span class="co">## $ time    <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5,…</span></span>
+<span><span class="co">## $ species <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp…</span></span>
+<span><span class="co">## $ truth   <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 28, 28, 28, 28, 28, 26, 26, 26, 26, 26, 23, 23, 23, 23, 23, 16…</span></span>
+<span><span class="co">## $ obs     <span style="color: #949494; font-style: italic;">&lt;int&gt;</span> 20, 19, 23, 17, 18, 21, 18, 21, 19, 18, 17, 16, 20, 11, 19, 9,…</span></span>
+<span><span class="co">## $ series  <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> site_1_sp_1_rep_1, site_1_sp_1_rep_2, site_1_sp_1_rep_3, site_…</span></span>
+<span><span class="co">## $ cap     <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 10…</span></span></code></pre>
+<div class="sourceCode" id="cb5"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">testdat</span>, <span class="fl">12</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">##    site time species truth obs            series cap</span></span>
+<span><span class="co">## 1     1    1    sp_1    28  20 site_1_sp_1_rep_1 100</span></span>
+<span><span class="co">## 2     1    1    sp_1    28  19 site_1_sp_1_rep_2 100</span></span>
+<span><span class="co">## 3     1    1    sp_1    28  23 site_1_sp_1_rep_3 100</span></span>
+<span><span class="co">## 4     1    1    sp_1    28  17 site_1_sp_1_rep_4 100</span></span>
+<span><span class="co">## 5     1    1    sp_1    28  18 site_1_sp_1_rep_5 100</span></span>
+<span><span class="co">## 6     1    2    sp_1    26  21 site_1_sp_1_rep_1 100</span></span>
+<span><span class="co">## 7     1    2    sp_1    26  18 site_1_sp_1_rep_2 100</span></span>
+<span><span class="co">## 8     1    2    sp_1    26  21 site_1_sp_1_rep_3 100</span></span>
+<span><span class="co">## 9     1    2    sp_1    26  19 site_1_sp_1_rep_4 100</span></span>
+<span><span class="co">## 10    1    2    sp_1    26  18 site_1_sp_1_rep_5 100</span></span>
+<span><span class="co">## 11    1    3    sp_1    23  17 site_1_sp_1_rep_1 100</span></span>
+<span><span class="co">## 12    1    3    sp_1    23  16 site_1_sp_1_rep_2 100</span></span></code></pre>
+<div class="section level3">
+<h3 id="setting-up-the-trend_map">Setting up the <code>trend_map</code><a class="anchor" aria-label="anchor" href="#setting-up-the-trend_map"></a>
+</h3>
+<p>Finally, we need to set up the <code>trend_map</code> object. This is
+crucial for allowing multiple observations to be linked to the same
+latent process model (see more information about this argument in the <a href="https://nicholasjclark.github.io/mvgam/articles/shared_states.html" target="_blank">Shared latent states vignette</a>. In this case, the
+mapping operates by species and site to state that each set of replicate
+observations from the same time point should all share the exact same
+latent abundance model:</p>
+<div class="sourceCode" id="cb7"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">testdat</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="co"># each unique combination of site*species is a separate process</span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>trend <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/numeric.html" class="external-link">as.numeric</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="va">site</span>, <span class="va">species</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/select.html" class="external-link">select</a></span><span class="op">(</span><span class="va">trend</span>, <span class="va">series</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/distinct.html" class="external-link">distinct</a></span><span class="op">(</span><span class="op">)</span> <span class="op">-&gt;</span> <span class="va">trend_map</span></span>
+<span><span class="va">trend_map</span></span></code></pre></div>
+<pre><code><span><span class="co">##    trend            series</span></span>
+<span><span class="co">## 1      1 site_1_sp_1_rep_1</span></span>
+<span><span class="co">## 2      1 site_1_sp_1_rep_2</span></span>
+<span><span class="co">## 3      1 site_1_sp_1_rep_3</span></span>
+<span><span class="co">## 4      1 site_1_sp_1_rep_4</span></span>
+<span><span class="co">## 5      1 site_1_sp_1_rep_5</span></span>
+<span><span class="co">## 6      2 site_1_sp_2_rep_1</span></span>
+<span><span class="co">## 7      2 site_1_sp_2_rep_2</span></span>
+<span><span class="co">## 8      2 site_1_sp_2_rep_3</span></span>
+<span><span class="co">## 9      2 site_1_sp_2_rep_4</span></span>
+<span><span class="co">## 10     2 site_1_sp_2_rep_5</span></span></code></pre>
+<p>Notice how all of the replicates for species 1 in site 1 share the
+same process (i.e. the same <code>trend</code>). This will ensure that
+all replicates are Binomial draws of the same latent N.</p>
+</div>
+<div class="section level3">
+<h3 id="modelling-with-the-nmix-family">Modelling with the <code>nmix()</code> family<a class="anchor" aria-label="anchor" href="#modelling-with-the-nmix-family"></a>
+</h3>
+<p>Now we are ready to fit a model using <code><a href="../reference/mvgam.html">mvgam()</a></code>. This
+model will allow each species to have different detection probabilities
+and different temporal trends. We will use <code>Cmdstan</code> as the
+backend, which by default will use Hamiltonian Monte Carlo for full
+Bayesian inference</p>
+<div class="sourceCode" id="cb9"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">mod</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/mvgam.html">mvgam</a></span><span class="op">(</span></span>
+<span>  <span class="co"># the observation formula sets up linear predictors for</span></span>
+<span>  <span class="co"># detection probability on the logit scale</span></span>
+<span>  formula <span class="op">=</span> <span class="va">obs</span> <span class="op">~</span> <span class="va">species</span> <span class="op">-</span> <span class="fl">1</span>,</span>
+<span>  </span>
+<span>  <span class="co"># the trend_formula sets up the linear predictors for </span></span>
+<span>  <span class="co"># the latent abundance processes on the log scale</span></span>
+<span>  trend_formula <span class="op">=</span> <span class="op">~</span> <span class="fu">s</span><span class="op">(</span><span class="va">time</span>, by <span class="op">=</span> <span class="va">trend</span>, k <span class="op">=</span> <span class="fl">4</span><span class="op">)</span> <span class="op">+</span> <span class="va">species</span>,</span>
+<span>  </span>
+<span>  <span class="co"># the trend_map takes care of the mapping</span></span>
+<span>  trend_map <span class="op">=</span> <span class="va">trend_map</span>,</span>
+<span>  </span>
+<span>  <span class="co"># nmix() family and data</span></span>
+<span>  family <span class="op">=</span> <span class="fu"><a href="../reference/mvgam_families.html">nmix</a></span><span class="op">(</span><span class="op">)</span>,</span>
+<span>  data <span class="op">=</span> <span class="va">testdat</span>,</span>
+<span>  </span>
+<span>  <span class="co"># priors can be set in the usual way</span></span>
+<span>  priors <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu">prior</span><span class="op">(</span><span class="fu">std_normal</span><span class="op">(</span><span class="op">)</span>, class <span class="op">=</span> <span class="va">b</span><span class="op">)</span>,</span>
+<span>             <span class="fu">prior</span><span class="op">(</span><span class="fu">normal</span><span class="op">(</span><span class="fl">1</span>, <span class="fl">1.5</span><span class="op">)</span>, class <span class="op">=</span> <span class="va">Intercept_trend</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></span></code></pre></div>
+<p>View the automatically-generated <code>Stan</code> code to get a
+sense of how the marginalization over latent N works</p>
+<div class="sourceCode" id="cb10"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="../reference/code.html">code</a></span><span class="op">(</span><span class="va">mod</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## // Stan model code generated by package mvgam</span></span>
+<span><span class="co">## functions {</span></span>
+<span><span class="co">##   /* Functions to return the log probability of a Poisson Binomial Mixture */</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   /* see Bollen et al 2023 for details (https://doi.org/10.1002/ece3.10595)*/</span></span>
+<span><span class="co">##   real poisbin_lpmf(array[] int count, int k, array[] real lambda,</span></span>
+<span><span class="co">##                     array[] real p) {</span></span>
+<span><span class="co">##     if (max(count) &gt; k) {</span></span>
+<span><span class="co">##       return negative_infinity();</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     return poisson_log_lpmf(k | lambda) + binomial_logit_lpmf(count | k, p);</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">##   vector pb_logp(array[] int count, int max_k, array[] real lambda,</span></span>
+<span><span class="co">##                  array[] real p) {</span></span>
+<span><span class="co">##     int c_max = max(count);</span></span>
+<span><span class="co">##     if (max_k &lt; c_max) {</span></span>
+<span><span class="co">##       reject("cap variable max_k must be &gt;= observed counts");</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     vector[max_k + 1] lp;</span></span>
+<span><span class="co">##     for (k in 0 : (c_max - 1)) {</span></span>
+<span><span class="co">##       lp[k + 1] = negative_infinity();</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     for (k in c_max : max_k) {</span></span>
+<span><span class="co">##       lp[k + 1] = poisbin_lpmf(count | k, lambda, p);</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     return lp;</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">##   real pb_lpmf(array[] int count, array[] int max_k, array[] real lambda,</span></span>
+<span><span class="co">##                array[] real p) {</span></span>
+<span><span class="co">##     // Take maximum of all supplied caps, in case they vary for some reason</span></span>
+<span><span class="co">##     int max_k_max = max(max_k);</span></span>
+<span><span class="co">##     vector[max_k_max + 1] lp;</span></span>
+<span><span class="co">##     lp = pb_logp(count, max_k_max, lambda, p);</span></span>
+<span><span class="co">##     return log_sum_exp(lp);</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">##   /* Functions to generate truncated Poisson variates */</span></span>
+<span><span class="co">##   array[] int nmix_rng(array[] int count, array[] int max_k,</span></span>
+<span><span class="co">##                        array[] real lambda, array[] real p) {</span></span>
+<span><span class="co">##     // Take maximum of all supplied caps, in case they vary for some reason</span></span>
+<span><span class="co">##     int max_k_max = max(max_k);</span></span>
+<span><span class="co">##     vector[max_k_max + 1] lp;</span></span>
+<span><span class="co">##     lp = pb_logp(count, max_k_max, lambda, p);</span></span>
+<span><span class="co">##     return rep_array(categorical_rng(softmax(lp)) - 1, size(count));</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">##   int trunc_pois_rng(int max_k, real lambda) {</span></span>
+<span><span class="co">##     real p_ub = poisson_cdf(max_k | lambda);</span></span>
+<span><span class="co">##     if (p_ub &lt; 1e-9) {</span></span>
+<span><span class="co">##       return max_k;</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     real u = uniform_rng(0, p_ub);</span></span>
+<span><span class="co">##     int i = 0;</span></span>
+<span><span class="co">##     int X = 0;</span></span>
+<span><span class="co">##     real p = exp(-lambda);</span></span>
+<span><span class="co">##     real F = p;</span></span>
+<span><span class="co">##     while (1) {</span></span>
+<span><span class="co">##       if (u &lt; F) {</span></span>
+<span><span class="co">##         X = i;</span></span>
+<span><span class="co">##         break;</span></span>
+<span><span class="co">##       }</span></span>
+<span><span class="co">##       i = i + 1;</span></span>
+<span><span class="co">##       p = lambda * p / i;</span></span>
+<span><span class="co">##       F = F + p;</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     return X;</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## data {</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; total_obs; // total number of observations</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; n; // number of timepoints per series</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; n_sp_trend; // number of trend smoothing parameters</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; n_lv; // number of dynamic factors</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; n_series; // number of series</span></span>
+<span><span class="co">##   matrix[n_series, n_lv] Z; // matrix mapping series to latent states</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; num_basis; // total number of basis coefficients</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; num_basis_trend; // number of trend basis coefficients</span></span>
+<span><span class="co">##   vector[num_basis_trend] zero_trend; // prior locations for trend basis coefficients</span></span>
+<span><span class="co">##   matrix[total_obs, num_basis] X; // mgcv GAM design matrix</span></span>
+<span><span class="co">##   matrix[n * n_lv, num_basis_trend] X_trend; // trend model design matrix</span></span>
+<span><span class="co">##   array[n, n_series] int&lt;lower=0&gt; ytimes; // time-ordered matrix (which col in X belongs to each [time, series] observation?)</span></span>
+<span><span class="co">##   array[n, n_lv] int ytimes_trend;</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; n_nonmissing; // number of nonmissing observations</span></span>
+<span><span class="co">##   array[total_obs] int&lt;lower=0&gt; cap; // upper limits of latent abundances</span></span>
+<span><span class="co">##   array[total_obs] int ytimes_array; // sorted ytimes</span></span>
+<span><span class="co">##   array[n, n_series] int&lt;lower=0&gt; ytimes_pred; // time-ordered matrix for prediction</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; K_groups; // number of unique replicated observations</span></span>
+<span><span class="co">##   int&lt;lower=0&gt; K_reps; // maximum number of replicate observations</span></span>
+<span><span class="co">##   array[K_groups] int&lt;lower=0&gt; K_starts; // col of K_inds where each group starts</span></span>
+<span><span class="co">##   array[K_groups] int&lt;lower=0&gt; K_stops; // col of K_inds where each group ends</span></span>
+<span><span class="co">##   array[K_groups, K_reps] int&lt;lower=0&gt; K_inds; // indices of replicated observations</span></span>
+<span><span class="co">##   matrix[3, 6] S_trend1; // mgcv smooth penalty matrix S_trend1</span></span>
+<span><span class="co">##   matrix[3, 6] S_trend2; // mgcv smooth penalty matrix S_trend2</span></span>
+<span><span class="co">##   array[total_obs] int&lt;lower=0&gt; flat_ys; // flattened observations</span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## transformed data {</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## parameters {</span></span>
+<span><span class="co">##   // raw basis coefficients</span></span>
+<span><span class="co">##   vector[num_basis] b_raw;</span></span>
+<span><span class="co">##   vector[num_basis_trend] b_raw_trend;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // smoothing parameters</span></span>
+<span><span class="co">##   vector&lt;lower=0&gt;[n_sp_trend] lambda_trend;</span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## transformed parameters {</span></span>
+<span><span class="co">##   // detection probability</span></span>
+<span><span class="co">##   vector[total_obs] p;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // latent states</span></span>
+<span><span class="co">##   matrix[n, n_lv] LV;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // latent states and loading matrix</span></span>
+<span><span class="co">##   vector[n * n_lv] trend_mus;</span></span>
+<span><span class="co">##   matrix[n, n_series] trend;</span></span>
+<span><span class="co">##   matrix[n_series, n_lv] lv_coefs;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // basis coefficients</span></span>
+<span><span class="co">##   vector[num_basis] b;</span></span>
+<span><span class="co">##   vector[num_basis_trend] b_trend;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // observation model basis coefficients</span></span>
+<span><span class="co">##   b[1 : num_basis] = b_raw[1 : num_basis];</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // process model basis coefficients</span></span>
+<span><span class="co">##   b_trend[1 : num_basis_trend] = b_raw_trend[1 : num_basis_trend];</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // detection probability</span></span>
+<span><span class="co">##   p = X[ytimes_array,  : ] * b;</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // latent process linear predictors</span></span>
+<span><span class="co">##   trend_mus = X_trend * b_trend;</span></span>
+<span><span class="co">##   for (j in 1 : n_lv) {</span></span>
+<span><span class="co">##     LV[1 : n, j] = trend_mus[ytimes_trend[1 : n, j]];</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // derived latent states</span></span>
+<span><span class="co">##   lv_coefs = Z;</span></span>
+<span><span class="co">##   for (i in 1 : n) {</span></span>
+<span><span class="co">##     for (s in 1 : n_series) {</span></span>
+<span><span class="co">##       trend[i, s] = dot_product(lv_coefs[s,  : ], LV[i,  : ]);</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## model {</span></span>
+<span><span class="co">##   // prior for speciessp_1...</span></span>
+<span><span class="co">##   b_raw[1] ~ std_normal();</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // prior for speciessp_2...</span></span>
+<span><span class="co">##   b_raw[2] ~ std_normal();</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // dynamic process models</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // prior for (Intercept)_trend...</span></span>
+<span><span class="co">##   b_raw_trend[1] ~ normal(1, 1.5);</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // prior for speciessp_2_trend...</span></span>
+<span><span class="co">##   b_raw_trend[2] ~ std_normal();</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // prior for s(time):trendtrend1_trend...</span></span>
+<span><span class="co">##   b_raw_trend[3 : 5] ~ multi_normal_prec(zero_trend[3 : 5],</span></span>
+<span><span class="co">##                                          S_trend1[1 : 3, 1 : 3]</span></span>
+<span><span class="co">##                                          * lambda_trend[1]</span></span>
+<span><span class="co">##                                          + S_trend1[1 : 3, 4 : 6]</span></span>
+<span><span class="co">##                                            * lambda_trend[2]);</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // prior for s(time):trendtrend2_trend...</span></span>
+<span><span class="co">##   b_raw_trend[6 : 8] ~ multi_normal_prec(zero_trend[6 : 8],</span></span>
+<span><span class="co">##                                          S_trend2[1 : 3, 1 : 3]</span></span>
+<span><span class="co">##                                          * lambda_trend[3]</span></span>
+<span><span class="co">##                                          + S_trend2[1 : 3, 4 : 6]</span></span>
+<span><span class="co">##                                            * lambda_trend[4]);</span></span>
+<span><span class="co">##   lambda_trend ~ normal(5, 30);</span></span>
+<span><span class="co">##   {</span></span>
+<span><span class="co">##     // likelihood functions</span></span>
+<span><span class="co">##     vector[total_obs] flat_trends;</span></span>
+<span><span class="co">##     flat_trends = to_vector(trend);</span></span>
+<span><span class="co">##     for (k in 1 : K_groups) {</span></span>
+<span><span class="co">##       target += pb_lpmf(flat_ys[K_inds[k, K_starts[k] : K_stops[k]]] | cap[K_inds[k, K_starts[k] : K_stops[k]]], to_array_1d(flat_trends[K_inds[k, K_starts[k] : K_stops[k]]]), to_array_1d(p[K_inds[k, K_starts[k] : K_stops[k]]]));</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">## }</span></span>
+<span><span class="co">## generated quantities {</span></span>
+<span><span class="co">##   vector[total_obs] eta;</span></span>
+<span><span class="co">##   matrix[n, n_series] mus;</span></span>
+<span><span class="co">##   vector[n_sp_trend] rho_trend;</span></span>
+<span><span class="co">##   vector[n_lv] penalty;</span></span>
+<span><span class="co">##   array[n, n_series] int ypred;</span></span>
+<span><span class="co">##   array[n, n_series] int latent_ypred;</span></span>
+<span><span class="co">##   array[total_obs] int latent_truncpred;</span></span>
+<span><span class="co">##   vector[total_obs] flat_trends;</span></span>
+<span><span class="co">##   vector[total_obs] detprob;</span></span>
+<span><span class="co">##   detprob = inv_logit(p);</span></span>
+<span><span class="co">##   penalty = rep_vector(1e12, n_lv);</span></span>
+<span><span class="co">##   rho_trend = log(lambda_trend);</span></span>
+<span><span class="co">##   </span></span>
+<span><span class="co">##   // posterior predictions</span></span>
+<span><span class="co">##   eta = X * b;</span></span>
+<span><span class="co">##   {</span></span>
+<span><span class="co">##     flat_trends = to_vector(trend);</span></span>
+<span><span class="co">##     </span></span>
+<span><span class="co">##     // prediction for all timepoints that ignore detection prob</span></span>
+<span><span class="co">##     for (i in 1 : total_obs) {</span></span>
+<span><span class="co">##       latent_truncpred[i] = trunc_pois_rng(cap[i], exp(flat_trends[i]));</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     </span></span>
+<span><span class="co">##     // prediction for the nonmissing timepoints using actual obs</span></span>
+<span><span class="co">##     for (k in 1 : K_groups) {</span></span>
+<span><span class="co">##       latent_truncpred[K_inds[k, K_starts[k] : K_stops[k]]] = nmix_rng(flat_ys[K_inds[k, K_starts[k] : K_stops[k]]],</span></span>
+<span><span class="co">##                                                                     cap[K_inds[k, K_starts[k] : K_stops[k]]],</span></span>
+<span><span class="co">##                                                                     to_array_1d(</span></span>
+<span><span class="co">##                                                                     flat_trends[K_inds[k, K_starts[k] : K_stops[k]]]),</span></span>
+<span><span class="co">##                                                                     to_array_1d(</span></span>
+<span><span class="co">##                                                                     p[K_inds[k, K_starts[k] : K_stops[k]]]));</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##     for (s in 1 : n_series) {</span></span>
+<span><span class="co">##       for (i in 1 : n) {</span></span>
+<span><span class="co">##         // true latent abundance</span></span>
+<span><span class="co">##         latent_ypred[i, s] = latent_truncpred[ytimes_pred[i, s]];</span></span>
+<span><span class="co">##         </span></span>
+<span><span class="co">##         // observed abundance</span></span>
+<span><span class="co">##         ypred[i, s] = binomial_rng(latent_ypred[i, s],</span></span>
+<span><span class="co">##                                    detprob[ytimes_pred[i, s]]);</span></span>
+<span><span class="co">##         </span></span>
+<span><span class="co">##         // expected values</span></span>
+<span><span class="co">##         mus[i, s] = detprob[ytimes[i, s]] * latent_ypred[i, s];</span></span>
+<span><span class="co">##       }</span></span>
+<span><span class="co">##     }</span></span>
+<span><span class="co">##   }</span></span>
+<span><span class="co">## }</span></span></code></pre>
+<p>The summary of this model shows that it has converged nicely</p>
+<div class="sourceCode" id="cb12"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/summary.html" class="external-link">summary</a></span><span class="op">(</span><span class="va">mod</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## GAM observation formula:</span></span>
+<span><span class="co">## obs ~ species - 1</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM process formula:</span></span>
+<span><span class="co">## ~s(time, by = trend, k = 4) + species</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Family:</span></span>
+<span><span class="co">## nmix</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Link function:</span></span>
+<span><span class="co">## log</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Trend model:</span></span>
+<span><span class="co">## None</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N process models:</span></span>
+<span><span class="co">## 2 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N series:</span></span>
+<span><span class="co">## 10 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N timepoints:</span></span>
+<span><span class="co">## 6 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Status:</span></span>
+<span><span class="co">## Fitted using Stan </span></span>
+<span><span class="co">## 4 chains, each with iter = 1000; warmup = 500; thin = 1 </span></span>
+<span><span class="co">## Total post-warmup draws = 2000</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM observation model coefficient (beta) estimates:</span></span>
+<span><span class="co">##              2.5%  50% 97.5% Rhat n_eff</span></span>
+<span><span class="co">## speciessp_1 0.520 1.10   1.6    1   982</span></span>
+<span><span class="co">## speciessp_2 0.031 0.71   1.2    1  1302</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM process model coefficient (beta) estimates:</span></span>
+<span><span class="co">##                               2.5%    50%  97.5% Rhat n_eff</span></span>
+<span><span class="co">## (Intercept)_trend            2.700  2.900  3.100    1   972</span></span>
+<span><span class="co">## speciessp_2_trend           -1.100 -0.820 -0.530    1   881</span></span>
+<span><span class="co">## s(time):trendtrend1.1_trend -0.061  0.027  0.220    1   821</span></span>
+<span><span class="co">## s(time):trendtrend1.2_trend -0.150  0.028  0.250    1  1523</span></span>
+<span><span class="co">## s(time):trendtrend1.3_trend -0.410 -0.280 -0.094    1  1102</span></span>
+<span><span class="co">## s(time):trendtrend2.1_trend -0.310 -0.021  0.092    1   481</span></span>
+<span><span class="co">## s(time):trendtrend2.2_trend -0.110  0.110  0.750    1   481</span></span>
+<span><span class="co">## s(time):trendtrend2.3_trend  0.170  0.410  0.630    1   917</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Approximate significance of GAM process smooths:</span></span>
+<span><span class="co">##                        edf    F p-value   </span></span>
+<span><span class="co">## s(time):seriestrend1 0.596 0.26  0.0013 **</span></span>
+<span><span class="co">## s(time):seriestrend2 0.881 0.41  0.0269 * </span></span>
+<span><span class="co">## ---</span></span>
+<span><span class="co">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Stan MCMC diagnostics:</span></span>
+<span><span class="co">## n_eff / iter looks reasonable for all parameters</span></span>
+<span><span class="co">## Rhat looks reasonable for all parameters</span></span>
+<span><span class="co">## 0 of 2000 iterations ended with a divergence (0%)</span></span>
+<span><span class="co">## 0 of 2000 iterations saturated the maximum tree depth of 12 (0%)</span></span>
+<span><span class="co">## E-FMI indicated no pathological behavior</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Samples were drawn using NUTS(diag_e) at Mon Jan 29 1:08:01 PM 2024.</span></span>
+<span><span class="co">## For each parameter, n_eff is a crude measure of effective sample size,</span></span>
+<span><span class="co">## and Rhat is the potential scale reduction factor on split MCMC chains</span></span>
+<span><span class="co">## (at convergence, Rhat = 1)</span></span></code></pre>
+<p><code>loo()</code> functionality works just as it does for all
+<code>mvgam</code> models to aid in model comparison / selection</p>
+<div class="sourceCode" id="cb14"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">loo</span><span class="op">(</span><span class="va">mod</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## Warning: Some Pareto k diagnostic values are slightly high. See help('pareto-k-diagnostic') for details.</span></span></code></pre>
+<pre><code><span><span class="co">## </span></span>
+<span><span class="co">## Computed from 2000 by 60 log-likelihood matrix</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">##          Estimate  SE</span></span>
+<span><span class="co">## elpd_loo   -140.0 3.2</span></span>
+<span><span class="co">## p_loo         4.2 0.7</span></span>
+<span><span class="co">## looic       280.0 6.3</span></span>
+<span><span class="co">## ------</span></span>
+<span><span class="co">## Monte Carlo SE of elpd_loo is 0.1.</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Pareto k diagnostic values:</span></span>
+<span><span class="co">##                          Count Pct.    Min. n_eff</span></span>
+<span><span class="co">## (-Inf, 0.5]   (good)     57    95.0%   386       </span></span>
+<span><span class="co">##  (0.5, 0.7]   (ok)        3     5.0%   567       </span></span>
+<span><span class="co">##    (0.7, 1]   (bad)       0     0.0%   &lt;NA&gt;      </span></span>
+<span><span class="co">##    (1, Inf)   (very bad)  0     0.0%   &lt;NA&gt;      </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## All Pareto k estimates are ok (k &lt; 0.7).</span></span>
+<span><span class="co">## See help('pareto-k-diagnostic') for details.</span></span></code></pre>
+<p>Plot the estimated smooths of time from each species’ latent
+abundance process (on the log scale)</p>
+<div class="sourceCode" id="cb17"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/graphics/plot.default.html" class="external-link">plot</a></span><span class="op">(</span><span class="va">mod</span>, type <span class="op">=</span> <span class="st">'smooths'</span>, trend_effects <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-10-1.png" width="60%" style="display: block; margin: auto;"></p>
+<p><code>marginaleffects</code> support allows for more useful
+prediction-based interrogations on different scales. Objects that use
+family <code><a href="../reference/mvgam_families.html">nmix()</a></code> have a few additional prediction scales that
+can be used (i.e. <code>link</code>, <code>response</code>,
+<code>detection</code> or <code>latent_N</code>). For example, here are
+the estimated detection probabilities per species, which shows that the
+model has over-estimated detection probability for species 2 (originally
+simulated to be 0.45):</p>
+<div class="sourceCode" id="cb18"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">plot_predictions</span><span class="op">(</span><span class="va">mod</span>, condition <span class="op">=</span> <span class="st">'species'</span>,</span>
+<span>                 type <span class="op">=</span> <span class="st">'detection'</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Pr(detection)'</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylim</span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fl">0</span>, <span class="fl">1</span><span class="op">)</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">theme_classic</span><span class="op">(</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">theme</span><span class="op">(</span>legend.position <span class="op">=</span> <span class="st">'none'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-11-1.png" width="60%" style="display: block; margin: auto;"></p>
+<p>A common goal in N-mixture modelling is to estimate the true latent
+abundance. The model has automatically generated predictions of the
+latent abundance that are conditional on the observations. We can
+extract these and produce decent plots using a small function</p>
+<div class="sourceCode" id="cb19"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">hc</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/hindcast.mvgam.html">hindcast</a></span><span class="op">(</span><span class="va">mod</span>, type <span class="op">=</span> <span class="st">'latent_N'</span><span class="op">)</span></span>
+<span></span>
+<span><span class="co"># Function to plot latent abundance estimates vs truth</span></span>
+<span><span class="va">plot_latentN</span> <span class="op">=</span> <span class="kw">function</span><span class="op">(</span><span class="va">hindcasts</span>, <span class="va">data</span>, <span class="va">species</span> <span class="op">=</span> <span class="st">'sp_1'</span><span class="op">)</span><span class="op">{</span></span>
+<span>  <span class="va">all_series</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="va">data</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>                         <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">species</span> <span class="op">==</span> <span class="op">!</span><span class="op">!</span><span class="va">species</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>                         <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/pull.html" class="external-link">pull</a></span><span class="op">(</span><span class="va">series</span><span class="op">)</span><span class="op">)</span></span>
+<span>  </span>
+<span>  <span class="co"># Grab the first replicate that represents this series</span></span>
+<span>  <span class="co"># so we can get the true simulated values</span></span>
+<span>  <span class="va">series</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/numeric.html" class="external-link">as.numeric</a></span><span class="op">(</span><span class="va">all_series</span><span class="op">[</span><span class="fl">1</span><span class="op">]</span><span class="op">)</span></span>
+<span>  <span class="va">truths</span> <span class="op">&lt;-</span> <span class="va">data</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>    <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/arrange.html" class="external-link">arrange</a></span><span class="op">(</span><span class="va">time</span>, <span class="va">series</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>    <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">series</span> <span class="op">==</span> <span class="op">!</span><span class="op">!</span><span class="fu"><a href="https://rdrr.io/r/base/levels.html" class="external-link">levels</a></span><span class="op">(</span><span class="va">data</span><span class="op">$</span><span class="va">series</span><span class="op">)</span><span class="op">[</span><span class="va">series</span><span class="op">]</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>    <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/pull.html" class="external-link">pull</a></span><span class="op">(</span><span class="va">truth</span><span class="op">)</span></span>
+<span>  </span>
+<span>  <span class="co"># In case some replicates have missing observations,</span></span>
+<span>  <span class="co"># pull out predictions for ALL replicates and average over them</span></span>
+<span>  <span class="va">hcs</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/do.call.html" class="external-link">do.call</a></span><span class="op">(</span><span class="va">rbind</span>, <span class="fu"><a href="https://rdrr.io/r/base/lapply.html" class="external-link">lapply</a></span><span class="op">(</span><span class="va">all_series</span>, <span class="kw">function</span><span class="op">(</span><span class="va">x</span><span class="op">)</span><span class="op">{</span></span>
+<span>    <span class="va">ind</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/which.html" class="external-link">which</a></span><span class="op">(</span><span class="fu"><a href="../reference/index-mvgam.html">names</a></span><span class="op">(</span><span class="va">hindcasts</span><span class="op">$</span><span class="va">hindcasts</span><span class="op">)</span> <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="fu"><a href="https://rdrr.io/r/base/character.html" class="external-link">as.character</a></span><span class="op">(</span><span class="va">x</span><span class="op">)</span><span class="op">)</span></span>
+<span>    <span class="va">hindcasts</span><span class="op">$</span><span class="va">hindcasts</span><span class="op">[[</span><span class="va">ind</span><span class="op">]</span><span class="op">]</span></span>
+<span>  <span class="op">}</span><span class="op">)</span><span class="op">)</span></span>
+<span>  </span>
+<span>  <span class="co"># Calculate posterior empirical quantiles of predictions</span></span>
+<span>  <span class="va">pred_quantiles</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/t.html" class="external-link">t</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/apply.html" class="external-link">apply</a></span><span class="op">(</span><span class="va">hcs</span>, <span class="fl">2</span>, <span class="kw">function</span><span class="op">(</span><span class="va">x</span><span class="op">)</span> </span>
+<span>    <span class="fu"><a href="https://rdrr.io/r/stats/quantile.html" class="external-link">quantile</a></span><span class="op">(</span><span class="va">x</span>, probs <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fl">0.05</span>, <span class="fl">0.2</span>, <span class="fl">0.3</span>, <span class="fl">0.4</span>, </span>
+<span>                          <span class="fl">0.5</span>, <span class="fl">0.6</span>, <span class="fl">0.7</span>, <span class="fl">0.8</span>, <span class="fl">0.95</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></span>
+<span>  <span class="va">pred_quantiles</span><span class="op">$</span><span class="va">time</span> <span class="op">&lt;-</span> <span class="fl">1</span><span class="op">:</span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">NROW</a></span><span class="op">(</span><span class="va">pred_quantiles</span><span class="op">)</span></span>
+<span>  <span class="va">pred_quantiles</span><span class="op">$</span><span class="va">truth</span> <span class="op">&lt;-</span> <span class="va">truths</span></span>
+<span>  </span>
+<span>  <span class="co"># Grab observations</span></span>
+<span>  <span class="va">data</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>    <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/filter.html" class="external-link">filter</a></span><span class="op">(</span><span class="va">series</span> <span class="op"><a href="https://rdrr.io/r/base/match.html" class="external-link">%in%</a></span> <span class="va">all_series</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>    <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/select.html" class="external-link">select</a></span><span class="op">(</span><span class="va">time</span>, <span class="va">obs</span><span class="op">)</span> <span class="op">-&gt;</span> <span class="va">observations</span></span>
+<span>  </span>
+<span>  <span class="co"># Plot</span></span>
+<span>  <span class="fu">ggplot</span><span class="op">(</span><span class="va">pred_quantiles</span>, <span class="fu">aes</span><span class="op">(</span>x <span class="op">=</span> <span class="va">time</span>, group <span class="op">=</span> <span class="fl">1</span><span class="op">)</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">geom_ribbon</span><span class="op">(</span><span class="fu">aes</span><span class="op">(</span>ymin <span class="op">=</span> <span class="va">X5.</span>, ymax <span class="op">=</span> <span class="va">X95.</span><span class="op">)</span>, fill <span class="op">=</span> <span class="st">"#DCBCBC"</span><span class="op">)</span> <span class="op">+</span> </span>
+<span>    <span class="fu">geom_ribbon</span><span class="op">(</span><span class="fu">aes</span><span class="op">(</span>ymin <span class="op">=</span> <span class="va">X30.</span>, ymax <span class="op">=</span> <span class="va">X70.</span><span class="op">)</span>, fill <span class="op">=</span> <span class="st">"#B97C7C"</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">geom_line</span><span class="op">(</span><span class="fu">aes</span><span class="op">(</span>x <span class="op">=</span> <span class="va">time</span>, y <span class="op">=</span> <span class="va">truth</span><span class="op">)</span>,</span>
+<span>              colour <span class="op">=</span> <span class="st">'black'</span>, linewidth <span class="op">=</span> <span class="fl">1</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">geom_point</span><span class="op">(</span><span class="fu">aes</span><span class="op">(</span>x <span class="op">=</span> <span class="va">time</span>, y <span class="op">=</span> <span class="va">truth</span><span class="op">)</span>,</span>
+<span>               shape <span class="op">=</span> <span class="fl">21</span>, colour <span class="op">=</span> <span class="st">'white'</span>, fill <span class="op">=</span> <span class="st">'black'</span>,</span>
+<span>               size <span class="op">=</span> <span class="fl">2.5</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">geom_jitter</span><span class="op">(</span>data <span class="op">=</span> <span class="va">observations</span>, <span class="fu">aes</span><span class="op">(</span>x <span class="op">=</span> <span class="va">time</span>, y <span class="op">=</span> <span class="va">obs</span><span class="op">)</span>,</span>
+<span>                width <span class="op">=</span> <span class="fl">0.06</span>, </span>
+<span>                shape <span class="op">=</span> <span class="fl">21</span>, fill <span class="op">=</span> <span class="st">'darkred'</span>, colour <span class="op">=</span> <span class="st">'white'</span>, size <span class="op">=</span> <span class="fl">2.5</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">labs</span><span class="op">(</span>y <span class="op">=</span> <span class="st">'Latent abundance (N)'</span>,</span>
+<span>         x <span class="op">=</span> <span class="st">'Time'</span>,</span>
+<span>         title <span class="op">=</span> <span class="va">species</span><span class="op">)</span></span>
+<span><span class="op">}</span></span></code></pre></div>
+<p>Latent abundance plots vs the simulated truths for each species are
+shown below. Here, the red points show the imperfect observations, the
+black line shows the true latent abundance, and the ribbons show
+credible intervals of our estimates:</p>
+<div class="sourceCode" id="cb20"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">plot_latentN</span><span class="op">(</span><span class="va">hc</span>, <span class="va">testdat</span>, species <span class="op">=</span> <span class="st">'sp_1'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-13-1.png" width="60%" style="display: block; margin: auto;"></p>
+<div class="sourceCode" id="cb21"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">plot_latentN</span><span class="op">(</span><span class="va">hc</span>, <span class="va">testdat</span>, species <span class="op">=</span> <span class="st">'sp_2'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-13-2.png" width="60%" style="display: block; margin: auto;"></p>
+<p>We can see that estimates for both species have correctly captured
+the true temporal variation in abundance. However, it is also apparent
+that low detection probabilities (like for species 2) make it difficult
+to accurately estimate latent abundance. We could likely improve these
+estimates if we had some additional information that could inform our
+estimates of detection probability, such as covariates that reflect our
+ability to take accurate measurements</p>
+</div>
+</div>
+<div class="section level2">
+<h2 id="example-2-a-two-species-system-with-nonlinear-trends">Example 2: a two-species system with nonlinear trends<a class="anchor" aria-label="anchor" href="#example-2-a-two-species-system-with-nonlinear-trends"></a>
+</h2>
+<p>Now for another example with a larger dataset. We will use data from
+<a href="https://www.jeffdoser.com/files/spabundance-web/articles/nmixturemodels" target="_blank" class="external-link">Jeff Doser’s simulation example from the wonderful
+<code>spAbundance</code> package</a>. The simulated data include one
+continuous site-level covariate, one factor site-level covariate and two
+continuous sample-level covariates. This example will allow us to
+examine how we can include possibly nonlinear effects in the latent
+process and detection probability models.</p>
+<p>Download the data and grab observations / covariate measurements for
+one species</p>
+<div class="sourceCode" id="cb22"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="co"># Date link</span></span>
+<span><span class="fu"><a href="https://rdrr.io/r/base/load.html" class="external-link">load</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/connections.html" class="external-link">url</a></span><span class="op">(</span><span class="st">'https://github.com/doserjef/spAbundance/raw/main/data/dataNMixSim.rda'</span><span class="op">)</span><span class="op">)</span></span>
+<span><span class="va">data.one.sp</span> <span class="op">&lt;-</span> <span class="va">dataNMixSim</span></span>
+<span></span>
+<span><span class="co"># Pull out observations for one species</span></span>
+<span><span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span> <span class="op">&lt;-</span> <span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span><span class="op">[</span><span class="fl">1</span>, , <span class="op">]</span></span>
+<span></span>
+<span><span class="co"># Abundance covariates that don't change across repeat sampling observations</span></span>
+<span><span class="va">abund.cov</span> <span class="op">&lt;-</span> <span class="va">dataNMixSim</span><span class="op">$</span><span class="va">abund.covs</span><span class="op">[</span>, <span class="fl">1</span><span class="op">]</span></span>
+<span><span class="va">abund.factor</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">as.factor</a></span><span class="op">(</span><span class="va">dataNMixSim</span><span class="op">$</span><span class="va">abund.covs</span><span class="op">[</span>, <span class="fl">2</span><span class="op">]</span><span class="op">)</span></span>
+<span></span>
+<span><span class="co"># Detection covariates that can change across repeat sampling observations</span></span>
+<span><span class="co"># Note that `NA`s are not allowed for covariates in mvgam, so we randomly</span></span>
+<span><span class="co"># impute them here</span></span>
+<span><span class="va">det.cov</span> <span class="op">&lt;-</span> <span class="va">dataNMixSim</span><span class="op">$</span><span class="va">det.covs</span><span class="op">$</span><span class="va">det.cov.1</span><span class="op">[</span>,<span class="op">]</span></span>
+<span><span class="va">det.cov</span><span class="op">[</span><span class="fu"><a href="https://rdrr.io/r/base/NA.html" class="external-link">is.na</a></span><span class="op">(</span><span class="va">det.cov</span><span class="op">)</span><span class="op">]</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/stats/Normal.html" class="external-link">rnorm</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/length.html" class="external-link">length</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/which.html" class="external-link">which</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/NA.html" class="external-link">is.na</a></span><span class="op">(</span><span class="va">det.cov</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></span>
+<span><span class="va">det.cov2</span> <span class="op">&lt;-</span> <span class="va">dataNMixSim</span><span class="op">$</span><span class="va">det.covs</span><span class="op">$</span><span class="va">det.cov.2</span></span>
+<span><span class="va">det.cov2</span><span class="op">[</span><span class="fu"><a href="https://rdrr.io/r/base/NA.html" class="external-link">is.na</a></span><span class="op">(</span><span class="va">det.cov2</span><span class="op">)</span><span class="op">]</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/stats/Normal.html" class="external-link">rnorm</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/length.html" class="external-link">length</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/which.html" class="external-link">which</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/NA.html" class="external-link">is.na</a></span><span class="op">(</span><span class="va">det.cov2</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span></span></code></pre></div>
+<p>Next we wrangle into the appropriate ‘long’ data format, adding
+indicators of <code>time</code> and <code>series</code> for working in
+<code>mvgam</code>. We also add the <code>cap</code> variable to
+represent the maximum latent N to marginalize over for each
+observation</p>
+<div class="sourceCode" id="cb23"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">mod_data</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/base/do.call.html" class="external-link">do.call</a></span><span class="op">(</span><span class="va">rbind</span>,</span>
+<span>                    <span class="fu"><a href="https://rdrr.io/r/base/lapply.html" class="external-link">lapply</a></span><span class="op">(</span><span class="fl">1</span><span class="op">:</span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">NROW</a></span><span class="op">(</span><span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span><span class="op">)</span>, <span class="kw">function</span><span class="op">(</span><span class="va">x</span><span class="op">)</span><span class="op">{</span></span>
+<span>                      <span class="fu"><a href="https://rdrr.io/r/base/data.frame.html" class="external-link">data.frame</a></span><span class="op">(</span>y <span class="op">=</span> <span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span><span class="op">[</span><span class="va">x</span>,<span class="op">]</span>,</span>
+<span>                                 abund_cov <span class="op">=</span> <span class="va">abund.cov</span><span class="op">[</span><span class="va">x</span><span class="op">]</span>,</span>
+<span>                                 abund_fac <span class="op">=</span> <span class="va">abund.factor</span><span class="op">[</span><span class="va">x</span><span class="op">]</span>,</span>
+<span>                                 det_cov <span class="op">=</span> <span class="va">det.cov</span><span class="op">[</span><span class="va">x</span>,<span class="op">]</span>,</span>
+<span>                                 det_cov2 <span class="op">=</span> <span class="va">det.cov2</span><span class="op">[</span><span class="va">x</span>,<span class="op">]</span>,</span>
+<span>                                 replicate <span class="op">=</span> <span class="fl">1</span><span class="op">:</span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">NCOL</a></span><span class="op">(</span><span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span><span class="op">)</span>,</span>
+<span>                                 site <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="st">'site'</span>, <span class="va">x</span><span class="op">)</span><span class="op">)</span></span>
+<span>                    <span class="op">}</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>species <span class="op">=</span> <span class="st">'sp_1'</span>,</span>
+<span>                series <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">as.factor</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="va">site</span>, <span class="st">'_'</span>, <span class="va">species</span>, <span class="st">'_'</span>, <span class="va">replicate</span><span class="op">)</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>site <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="va">site</span>, levels <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="va">site</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                species <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="va">species</span>, levels <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/unique.html" class="external-link">unique</a></span><span class="op">(</span><span class="va">species</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                time <span class="op">=</span> <span class="fl">1</span>,</span>
+<span>                cap <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/Extremes.html" class="external-link">max</a></span><span class="op">(</span><span class="va">data.one.sp</span><span class="op">$</span><span class="va">y</span>, na.rm <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span> <span class="op">+</span> <span class="fl">20</span><span class="op">)</span></span></code></pre></div>
+<p>The data include observations for 225 sites with three replicates per
+site, though some observations are missing</p>
+<div class="sourceCode" id="cb24"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/nrow.html" class="external-link">NROW</a></span><span class="op">(</span><span class="va">mod_data</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## [1] 675</span></span></code></pre>
+<div class="sourceCode" id="cb26"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://pillar.r-lib.org/reference/glimpse.html" class="external-link">glimpse</a></span><span class="op">(</span><span class="va">mod_data</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## Rows: 675</span></span>
+<span><span class="co">## Columns: 11</span></span>
+<span><span class="co">## $ y         <span style="color: #949494; font-style: italic;">&lt;int&gt;</span> 1, NA, NA, NA, 2, 2, NA, 1, NA, NA, 0, 1, 0, 0, 0, 0, NA, NA…</span></span>
+<span><span class="co">## $ abund_cov <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> -0.3734384, -0.3734384, -0.3734384, 0.7064305, 0.7064305, 0.…</span></span>
+<span><span class="co">## $ abund_fac <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> 3, 3, 3, 4, 4, 4, 9, 9, 9, 2, 2, 2, 3, 3, 3, 2, 2, 2, 1, 1, …</span></span>
+<span><span class="co">## $ det_cov   <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> -1.2827999, -0.6412036, 1.7083192, 0.7640157, 0.1954809, 0.9…</span></span>
+<span><span class="co">## $ det_cov2  <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 2.030473137, 0.151511085, -0.439251153, -1.481393226, 1.0455…</span></span>
+<span><span class="co">## $ replicate <span style="color: #949494; font-style: italic;">&lt;int&gt;</span> 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, …</span></span>
+<span><span class="co">## $ site      <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> site1, site1, site1, site2, site2, site2, site3, site3, site…</span></span>
+<span><span class="co">## $ species   <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, sp_1, …</span></span>
+<span><span class="co">## $ series    <span style="color: #949494; font-style: italic;">&lt;fct&gt;</span> site1_sp_1_1, site1_sp_1_2, site1_sp_1_3, site2_sp_1_1, site…</span></span>
+<span><span class="co">## $ time      <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, …</span></span>
+<span><span class="co">## $ cap       <span style="color: #949494; font-style: italic;">&lt;dbl&gt;</span> 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, …</span></span></code></pre>
+<div class="sourceCode" id="cb28"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="va">mod_data</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">##    y  abund_cov abund_fac    det_cov   det_cov2 replicate  site species</span></span>
+<span><span class="co">## 1  1 -0.3734384         3 -1.2827999  2.0304731         1 site1    sp_1</span></span>
+<span><span class="co">## 2 NA -0.3734384         3 -0.6412036  0.1515111         2 site1    sp_1</span></span>
+<span><span class="co">## 3 NA -0.3734384         3  1.7083192 -0.4392512         3 site1    sp_1</span></span>
+<span><span class="co">## 4 NA  0.7064305         4  0.7640157 -1.4813932         1 site2    sp_1</span></span>
+<span><span class="co">## 5  2  0.7064305         4  0.1954809  1.0455536         2 site2    sp_1</span></span>
+<span><span class="co">## 6  2  0.7064305         4  0.9673034  1.9197118         3 site2    sp_1</span></span>
+<span><span class="co">##         series time cap</span></span>
+<span><span class="co">## 1 site1_sp_1_1    1  33</span></span>
+<span><span class="co">## 2 site1_sp_1_2    1  33</span></span>
+<span><span class="co">## 3 site1_sp_1_3    1  33</span></span>
+<span><span class="co">## 4 site2_sp_1_1    1  33</span></span>
+<span><span class="co">## 5 site2_sp_1_2    1  33</span></span>
+<span><span class="co">## 6 site2_sp_1_3    1  33</span></span></code></pre>
+<p>The final step for data preparation is of course the
+<code>trend_map</code>, which sets up the mapping between observation
+replicates and the latent abundance models. This is done in the same way
+as in the example above</p>
+<div class="sourceCode" id="cb30"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">mod_data</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="co"># each unique combination of site*species is a separate process</span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/mutate.html" class="external-link">mutate</a></span><span class="op">(</span>trend <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/numeric.html" class="external-link">as.numeric</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/factor.html" class="external-link">factor</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/base/paste.html" class="external-link">paste0</a></span><span class="op">(</span><span class="va">site</span>, <span class="va">species</span><span class="op">)</span><span class="op">)</span><span class="op">)</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/select.html" class="external-link">select</a></span><span class="op">(</span><span class="va">trend</span>, <span class="va">series</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/distinct.html" class="external-link">distinct</a></span><span class="op">(</span><span class="op">)</span> <span class="op">-&gt;</span> <span class="va">trend_map</span></span>
+<span></span>
+<span><span class="va">trend_map</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu">dplyr</span><span class="fu">::</span><span class="fu"><a href="https://dplyr.tidyverse.org/reference/arrange.html" class="external-link">arrange</a></span><span class="op">(</span><span class="va">trend</span><span class="op">)</span> <span class="op"><a href="../reference/pipe.html">%&gt;%</a></span></span>
+<span>  <span class="fu"><a href="https://rdrr.io/r/utils/head.html" class="external-link">head</a></span><span class="op">(</span><span class="fl">12</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">##    trend         series</span></span>
+<span><span class="co">## 1      1 site100_sp_1_1</span></span>
+<span><span class="co">## 2      1 site100_sp_1_2</span></span>
+<span><span class="co">## 3      1 site100_sp_1_3</span></span>
+<span><span class="co">## 4      2 site101_sp_1_1</span></span>
+<span><span class="co">## 5      2 site101_sp_1_2</span></span>
+<span><span class="co">## 6      2 site101_sp_1_3</span></span>
+<span><span class="co">## 7      3 site102_sp_1_1</span></span>
+<span><span class="co">## 8      3 site102_sp_1_2</span></span>
+<span><span class="co">## 9      3 site102_sp_1_3</span></span>
+<span><span class="co">## 10     4 site103_sp_1_1</span></span>
+<span><span class="co">## 11     4 site103_sp_1_2</span></span>
+<span><span class="co">## 12     4 site103_sp_1_3</span></span></code></pre>
+<p>Now we are ready to fit a model using <code><a href="../reference/mvgam.html">mvgam()</a></code>. Here we
+will use penalized splines for each of the continuous covariate effects
+to detect possible nonlinear associations. We also showcase how
+<code>mvgam</code> can make use of the different approximation
+algorithms available in <code>Stan</code> by using the meanfield
+variational Bayes approximator (this reduces computation time
+substantially)</p>
+<div class="sourceCode" id="cb32"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">mod</span> <span class="op">&lt;-</span> <span class="fu"><a href="../reference/mvgam.html">mvgam</a></span><span class="op">(</span></span>
+<span>  <span class="co"># effects of covariates on detection probability;</span></span>
+<span>  <span class="co"># here we use penalized splines for both continuous covariates</span></span>
+<span>  formula <span class="op">=</span> <span class="va">y</span> <span class="op">~</span> <span class="fu">s</span><span class="op">(</span><span class="va">det_cov</span>, k <span class="op">=</span> <span class="fl">3</span><span class="op">)</span> <span class="op">+</span> <span class="fu">s</span><span class="op">(</span><span class="va">det_cov2</span>, k <span class="op">=</span> <span class="fl">3</span><span class="op">)</span>,</span>
+<span>  </span>
+<span>  <span class="co"># effects of the covariates on latent abundance;</span></span>
+<span>  <span class="co"># here we use a penalized spline for the continuous covariate and</span></span>
+<span>  <span class="co"># hierarchical intercepts for the factor covariate</span></span>
+<span>  trend_formula <span class="op">=</span> <span class="op">~</span> <span class="fu">s</span><span class="op">(</span><span class="va">abund_cov</span>, k <span class="op">=</span> <span class="fl">3</span><span class="op">)</span> <span class="op">+</span></span>
+<span>    <span class="fu">s</span><span class="op">(</span><span class="va">abund_fac</span>, bs <span class="op">=</span> <span class="st">'re'</span><span class="op">)</span>,</span>
+<span>  </span>
+<span>  <span class="co"># link multiple observations to each site</span></span>
+<span>  trend_map <span class="op">=</span> <span class="va">trend_map</span>,</span>
+<span>  </span>
+<span>  <span class="co"># nmix() family and supplied data</span></span>
+<span>  family <span class="op">=</span> <span class="fu"><a href="../reference/mvgam_families.html">nmix</a></span><span class="op">(</span><span class="op">)</span>,</span>
+<span>  data <span class="op">=</span> <span class="va">mod_data</span>,</span>
+<span>  </span>
+<span>  <span class="co"># standard normal priors on key regression parameters</span></span>
+<span>  priors <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="fu">prior</span><span class="op">(</span><span class="fu">std_normal</span><span class="op">(</span><span class="op">)</span>, class <span class="op">=</span> <span class="st">'b'</span><span class="op">)</span>,</span>
+<span>             <span class="fu">prior</span><span class="op">(</span><span class="fu">std_normal</span><span class="op">(</span><span class="op">)</span>, class <span class="op">=</span> <span class="st">'Intercept'</span><span class="op">)</span>,</span>
+<span>             <span class="fu">prior</span><span class="op">(</span><span class="fu">std_normal</span><span class="op">(</span><span class="op">)</span>, class <span class="op">=</span> <span class="st">'Intercept_trend'</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>  </span>
+<span>  <span class="co"># use Stan's variational inference for quicker results</span></span>
+<span>  algorithm <span class="op">=</span> <span class="st">'meanfield'</span>,</span>
+<span>  samples <span class="op">=</span> <span class="fl">1000</span><span class="op">)</span></span></code></pre></div>
+<p>Inspect the model summary but don’t bother looking at estimates for
+all individual spline coefficients. Notice how we no longer receive
+information on convergence because we did not use MCMC sampling for this
+model</p>
+<div class="sourceCode" id="cb33"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu"><a href="https://rdrr.io/r/base/summary.html" class="external-link">summary</a></span><span class="op">(</span><span class="va">mod</span>, include_betas <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## GAM observation formula:</span></span>
+<span><span class="co">## y ~ s(det_cov, k = 3) + s(det_cov2, k = 3)</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM process formula:</span></span>
+<span><span class="co">## ~s(abund_cov, k = 3) + s(abund_fac, bs = "re")</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Family:</span></span>
+<span><span class="co">## nmix</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Link function:</span></span>
+<span><span class="co">## log</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Trend model:</span></span>
+<span><span class="co">## None</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N process models:</span></span>
+<span><span class="co">## 225 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N series:</span></span>
+<span><span class="co">## 675 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## N timepoints:</span></span>
+<span><span class="co">## 1 </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Status:</span></span>
+<span><span class="co">## Fitted using Stan </span></span>
+<span><span class="co">## 1 chains, each with iter = 1000; warmup = ; thin = 1 </span></span>
+<span><span class="co">## Total post-warmup draws = 1000</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM observation model coefficient (beta) estimates:</span></span>
+<span><span class="co">##             2.5%  50% 97.5% Rhat n.eff</span></span>
+<span><span class="co">## (Intercept) 0.35 0.75   1.2  NaN   NaN</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Approximate significance of GAM observation smooths:</span></span>
+<span><span class="co">##              edf Chi.sq p-value    </span></span>
+<span><span class="co">## s(det_cov)  1.99   86.7 0.00086 ***</span></span>
+<span><span class="co">## s(det_cov2) 2.00  359.2 &lt; 2e-16 ***</span></span>
+<span><span class="co">## ---</span></span>
+<span><span class="co">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM process model coefficient (beta) estimates:</span></span>
+<span><span class="co">##                   2.5% 50% 97.5% Rhat n.eff</span></span>
+<span><span class="co">## (Intercept)_trend 0.91 1.2   1.4  NaN   NaN</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## GAM process model group-level estimates:</span></span>
+<span><span class="co">##                           2.5%   50% 97.5% Rhat n.eff</span></span>
+<span><span class="co">## mean(s(abund_fac))_trend -1.70 -1.40 -1.20  NaN   NaN</span></span>
+<span><span class="co">## sd(s(abund_fac))_trend    0.17  0.28  0.48  NaN   NaN</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Approximate significance of GAM process smooths:</span></span>
+<span><span class="co">##               edf    F p-value  </span></span>
+<span><span class="co">## s(abund_cov) 1.90 2.13   0.978  </span></span>
+<span><span class="co">## s(abund_fac) 8.87 1.28   0.039 *</span></span>
+<span><span class="co">## ---</span></span>
+<span><span class="co">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Posterior approximation used: no diagnostics to compute</span></span></code></pre>
+<p>Again we can make use of <code>marginaleffects</code> support for
+interrogating the model through targeted predictions. First, we can
+inspect the estimated average detection probability</p>
+<div class="sourceCode" id="cb35"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="fu">avg_predictions</span><span class="op">(</span><span class="va">mod</span>, type <span class="op">=</span> <span class="st">'detection'</span><span class="op">)</span></span></code></pre></div>
+<pre><code><span><span class="co">## </span></span>
+<span><span class="co">##  Estimate 2.5 % 97.5 %</span></span>
+<span><span class="co">##     0.647 0.568  0.721</span></span>
+<span><span class="co">## </span></span>
+<span><span class="co">## Columns: estimate, conf.low, conf.high </span></span>
+<span><span class="co">## Type:  detection</span></span></code></pre>
+<p>Next investigate estimated effects of covariates on latent abundance
+using the <code>conditional_effects()</code> function and specifying
+<code>type = 'link'</code>; this will return plots on the expectation
+scale</p>
+<div class="sourceCode" id="cb37"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">abund_plots</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/graphics/plot.default.html" class="external-link">plot</a></span><span class="op">(</span><span class="fu">conditional_effects</span><span class="op">(</span><span class="va">mod</span>,</span>
+<span>                                        type <span class="op">=</span> <span class="st">'link'</span>,</span>
+<span>                                        effects <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">'abund_cov'</span>,</span>
+<span>                                                    <span class="st">'abund_fac'</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                    plot <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span></code></pre></div>
+<p>The effect of the continuous covariate on expected latent
+abundance</p>
+<div class="sourceCode" id="cb38"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">abund_plots</span><span class="op">[[</span><span class="fl">1</span><span class="op">]</span><span class="op">]</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Expected latent abundance'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-23-1.png" width="60%" style="display: block; margin: auto;"></p>
+<p>The effect of the factor covariate on expected latent abundance,
+estimated as a hierarchical random effect</p>
+<div class="sourceCode" id="cb39"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">abund_plots</span><span class="op">[[</span><span class="fl">2</span><span class="op">]</span><span class="op">]</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Expected latent abundance'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-24-1.png" width="60%" style="display: block; margin: auto;"></p>
+<p>Now we can investigate estimated effects of covariates on detection
+probability using <code>type = 'detection'</code></p>
+<div class="sourceCode" id="cb40"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">det_plots</span> <span class="op">&lt;-</span> <span class="fu"><a href="https://rdrr.io/r/graphics/plot.default.html" class="external-link">plot</a></span><span class="op">(</span><span class="fu">conditional_effects</span><span class="op">(</span><span class="va">mod</span>,</span>
+<span>                                      type <span class="op">=</span> <span class="st">'detection'</span>,</span>
+<span>                                      effects <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">'det_cov'</span>,</span>
+<span>                                                  <span class="st">'det_cov2'</span><span class="op">)</span><span class="op">)</span>,</span>
+<span>                  plot <span class="op">=</span> <span class="cn">FALSE</span><span class="op">)</span></span></code></pre></div>
+<p>The covariate smooths were estimated to be somewhat nonlinear on the
+logit scale according to the model summary (based on their approximate
+significances). But inspecting conditional effects of each covariate on
+the probability scale is more intuitive and useful</p>
+<div class="sourceCode" id="cb41"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">det_plots</span><span class="op">[[</span><span class="fl">1</span><span class="op">]</span><span class="op">]</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Pr(detection)'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-26-1.png" width="60%" style="display: block; margin: auto;"></p>
+<div class="sourceCode" id="cb42"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">det_plots</span><span class="op">[[</span><span class="fl">2</span><span class="op">]</span><span class="op">]</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Pr(detection)'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-26-2.png" width="60%" style="display: block; margin: auto;"></p>
+<p>More targeted predictions are also easy with
+<code>marginaleffects</code> support. For example, we can ask: How does
+detection probability change as we change <em>both</em> detection
+covariates?</p>
+<div class="sourceCode" id="cb43"><pre class="downlit sourceCode r">
+<code class="sourceCode R"><span><span class="va">fivenum_round</span> <span class="op">=</span> <span class="kw">function</span><span class="op">(</span><span class="va">x</span><span class="op">)</span><span class="fu"><a href="https://rdrr.io/r/base/Round.html" class="external-link">round</a></span><span class="op">(</span><span class="fu"><a href="https://rdrr.io/r/stats/fivenum.html" class="external-link">fivenum</a></span><span class="op">(</span><span class="va">x</span>, na.rm <span class="op">=</span> <span class="cn">TRUE</span><span class="op">)</span>, <span class="fl">2</span><span class="op">)</span></span>
+<span></span>
+<span><span class="fu">plot_predictions</span><span class="op">(</span><span class="va">mod</span>, </span>
+<span>                 newdata <span class="op">=</span> <span class="fu">datagrid</span><span class="op">(</span>det_cov <span class="op">=</span> <span class="va">unique</span>,</span>
+<span>                                    det_cov2 <span class="op">=</span> <span class="va">fivenum_round</span><span class="op">)</span>,</span>
+<span>                 by <span class="op">=</span> <span class="fu"><a href="https://rdrr.io/r/base/c.html" class="external-link">c</a></span><span class="op">(</span><span class="st">'det_cov'</span>, <span class="st">'det_cov2'</span><span class="op">)</span>,</span>
+<span>                 type <span class="op">=</span> <span class="st">'detection'</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">theme_classic</span><span class="op">(</span><span class="op">)</span> <span class="op">+</span></span>
+<span>  <span class="fu">ylab</span><span class="op">(</span><span class="st">'Pr(detection)'</span><span class="op">)</span></span></code></pre></div>
+<p><img src="nmixtures_files/figure-html/unnamed-chunk-27-1.png" width="60%" style="display: block; margin: auto;"></p>
+<p>The model has found support for some important covariate effects, but
+of course we’d want to interrogate how well the model predicts and think
+about possible spatial effects to capture unmodelled variation in latent
+abundance.</p>
+</div>
+<div class="section level2">
+<h2 id="further-reading">Further reading<a class="anchor" aria-label="anchor" href="#further-reading"></a>
+</h2>
+<p>The following papers and resources offer useful material about
+N-mixture models for ecological population dynamics investigations:</p>
+<p>Guélat, Jérôme, and Kéry, Marc. “<a href="https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.12983" class="external-link">Effects
+of Spatial Autocorrelation and Imperfect Detection on Species
+Distribution Models.</a>” <em>Methods in Ecology and Evolution</em> 9
+(2018): 1614–25.</p>
+<p>Kéry, Marc, and Royle Andrew J. “<a href="https://www.sciencedirect.com/book/9780128237687/applied-hierarchical-modeling-in-ecology-analysis-of-distribution-abundance-and-species-richness-in-r-and-bugs" class="external-link">Applied
+hierarchical modeling in ecology: Analysis of distribution, abundance
+and species richness in R and BUGS: Volume 2: Dynamic and advanced
+models</a>”. London, UK: Academic Press (2020).</p>
+<p>Royle, Andrew J. “<a href="https://onlinelibrary.wiley.com/doi/full/10.1111/j.0006-341X.2004.00142.x" class="external-link">N‐mixture
+models for estimating population size from spatially replicated
+counts.</a>” <em>Biometrics</em> 60.1 (2004): 108-115.</p>
+</div>
+  </main><aside class="col-md-3"><nav id="toc"><h2>On this page</h2>
+    </nav></aside>
+</div>
+
+
+
+    <footer><div class="pkgdown-footer-left">
+  <p></p>
+<p>Developed by <a href="https://researchers.uq.edu.au/researcher/15140" class="external-link">Nicholas J Clark</a>.</p>
+</div>
+
+<div class="pkgdown-footer-right">
+  <p></p>
+<p>Site built with <a href="https://pkgdown.r-lib.org/" class="external-link">pkgdown</a> 2.0.7.</p>
+</div>
+
+    </footer>
+</div>
+
+  
+
+  
+
+  </body>
+</html>
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-10-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-10-1.png
new file mode 100644
index 00000000..b8b37737
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-10-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-11-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-11-1.png
new file mode 100644
index 00000000..3613ea3b
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-11-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-1.png
new file mode 100644
index 00000000..41ab5c23
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-2.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-2.png
new file mode 100644
index 00000000..34245c72
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-13-2.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-23-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-23-1.png
new file mode 100644
index 00000000..1901e736
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-23-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-24-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-24-1.png
new file mode 100644
index 00000000..e702cd36
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-24-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-1.png
new file mode 100644
index 00000000..7d6cc370
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-1.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-2.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-2.png
new file mode 100644
index 00000000..568756ea
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-26-2.png differ
diff --git a/docs/articles/nmixtures_files/figure-html/unnamed-chunk-27-1.png b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-27-1.png
new file mode 100644
index 00000000..904820b4
Binary files /dev/null and b/docs/articles/nmixtures_files/figure-html/unnamed-chunk-27-1.png differ
diff --git a/src/mvgam.dll b/src/mvgam.dll
index 2b951a45..a860e064 100644
Binary files a/src/mvgam.dll and b/src/mvgam.dll differ
diff --git a/tests/testthat/Rplots.pdf b/tests/testthat/Rplots.pdf
index 5d576f9e..36a32cf5 100644
Binary files a/tests/testthat/Rplots.pdf and b/tests/testthat/Rplots.pdf differ
diff --git a/vignettes/nmixtures.Rmd b/vignettes/nmixtures.Rmd
new file mode 100644
index 00000000..2832e6bc
--- /dev/null
+++ b/vignettes/nmixtures.Rmd
@@ -0,0 +1,487 @@
+---
+title: "N-mixtures in mvgam"
+author: "Nicholas J Clark"
+date: "`r Sys.Date()`"
+output:
+  rmarkdown::html_vignette:
+  toc: yes
+vignette: >
+  %\VignetteIndexEntry{N-mixtures in mvgam}
+  %\VignetteEngine{knitr::rmarkdown}
+  \usepackage[utf8]{inputenc}
+---
+
+```{r setup, include=FALSE}
+knitr::opts_chunk$set(
+  echo = TRUE,
+  dpi = 150,
+  fig.asp = 0.8,
+  fig.width = 6,
+  out.width = "60%",
+  fig.align = "center")
+library(mvgam)
+library(ggplot2)
+library(dplyr)
+# A custom ggplot2 theme
+theme_set(theme_classic(base_size = 12, base_family = 'serif') +
+            theme(axis.line.x.bottom = element_line(colour = "black",
+                                                    size = 1),
+                  axis.line.y.left = element_line(colour = "black",
+                                                  size = 1)))
+options(ggplot2.discrete.colour = c("#A25050",
+                                    "#00008b",
+                                    'darkred',
+                                    "#010048"),
+        ggplot2.discrete.fill = c("#A25050",
+                                  "#00008b",
+                                  'darkred',
+                                  "#010048"))
+```
+
+The purpose of this vignette is to show how the `mvgam` package can be used to fit and interrogate N-mixture models for population abundance counts made with imperfect detection.
+
+## N-mixture models
+An N-mixture model is a fairly recent addition to the ecological modeller's toolkit that is designed to make inferences about variation in the abundance of species when observations are imperfect ([Royle 2004](https://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.2004.00142.x){target="_blank"}). Briefly, assume $\boldsymbol{Y_{i,r}}$ is the number of individuals recorded at site $i$ during replicate sampling observation $r$ (recorded as a non-negative integer). If multiple replicate surveys are done within a short enough period to satisfy the assumption that the population remained closed (i.e. there was no substantial change in true population size between replicate surveys), we can account for the fact that observations aren't perfect. This is done by assuming that these replicate observations are Binomial random variables that are parameterized by the true "latent" abundance $N$ and a detection probability $p$:
+
+\begin{align*}
+\boldsymbol{Y_{i,r}} & \sim \text{Binomial}(N_i, p_r) \\
+N_{i} & \sim \text{Poisson}(\lambda_i)  \end{align*}
+
+Using a set of linear predictors, we can estimate effects of covariates $\boldsymbol{X}$ on the expected latent abundance (with a log link for $\lambda$) and, jointly, effects of possibly different covariates (call them $\boldsymbol{Q}$) on detection probability (with a logit link for $p$):
+
+\begin{align*}
+log(\lambda) & = \beta \boldsymbol{X} \\
+logit(p) & = \gamma \boldsymbol{Q}\end{align*}
+
+`mvgam` can handle this type of model because it is designed to propagate unobserved temporal processes that evolve independently of the observation process in a State-space format. This setup adapts well to N-mixture models because they can be thought of as State-space models in which the latent state is a discrete variable representing the "true" but unknown population size. This is very convenient because we can incorporate any of the package's diverse effect types (i.e. multidimensional splines, time-varying effects, monotonic effects, random effects etc...) into the linear predictors. All that is required for this to work is a marginalization trick that allows `Stan`'s sampling algorithms to handle discrete parameters (see more about how this method of "integrating out" discrete parameters works in [this nice blog post by Maxwell Joseph](https://mbjoseph.github.io/posts/2020-04-28-a-step-by-step-guide-to-marginalizing-over-discrete-parameters-for-ecologists-using-stan/){target="_blank"}). 
+  
+The family `nmix()` is used to set up N-mixture models in `mvgam`, but we still need to do a little bit of data wrangling to ensure the data are set up in the correct format (this is especially true when we have more than one replicate survey per time period). The most important aspects are: (1) how we set up the observation `series` and `trend_map` arguments to ensure replicate surveys are mapped to the correct latent abundance model and (2) the inclusion of a `cap` variable that defines the maximum possible integer value to use for each observation when estimating latent abundance. The two examples below give a reasonable overview of how this can be done. 
+
+## Example 1: a two-species system with nonlinear trends
+First we will use a simple simulation in which multiple replicate observations are taken at each timepoint for two different species. The simulation produces observations at a single site over six years, with five replicate surveys per year. Each species is simulated to have different nonlinear temporal trends and different detection probabilities. For now, detection probability is fixed (i.e. it does not change over time or in association with any covariates). Notice that we add the `cap` variable, which does not need to be static, to define the maximum possible value that we think the latent abundance could be for each timepoint. This simply needs to be large enough that we get a reasonable idea of which latent N values are most likely, without adding too much computational cost:
+
+```{r}
+set.seed(999)
+# Simulate observations for species 1, which shows a declining trend and 0.7 detection probability
+data.frame(site = 1,
+           # five replicates per year; six years
+           replicate = rep(1:5, 6),
+           time = sort(rep(1:6, 5)),
+           species = 'sp_1',
+           # true abundance declines nonlinearly
+           truth = c(rep(28, 5),
+                     rep(26, 5),
+                     rep(23, 5),
+                     rep(16, 5),
+                     rep(14, 5),
+                     rep(14, 5)),
+           # observations are taken with detection prob = 0.7
+           obs = c(rbinom(5, 28, 0.7),
+                   rbinom(5, 26, 0.7),
+                   rbinom(5, 23, 0.7),
+                   rbinom(5, 15, 0.7),
+                   rbinom(5, 14, 0.7),
+                   rbinom(5, 14, 0.7))) %>%
+  # add 'series' information, which is an identifier of site, replicate and species
+  dplyr::mutate(series = paste0('site_', site,
+                                '_', species,
+                                '_rep_', replicate),
+                time = as.numeric(time),
+                # add a 'cap' variable that defines the maximum latent N to 
+                # marginalize over when estimating latent abundance; in other words
+                # how large do we realistically think the true abundance could be?
+                cap = 100) %>%
+  dplyr::select(- replicate) -> testdat
+
+# Now add another species that has a different temporal trend and a smaller 
+# detection probability (0.45 for this species)
+testdat = testdat %>%
+  dplyr::bind_rows(data.frame(site = 1,
+                              replicate = rep(1:5, 6),
+                              time = sort(rep(1:6, 5)),
+                              species = 'sp_2',
+                              truth = c(rep(4, 5),
+                                        rep(7, 5),
+                                        rep(15, 5),
+                                        rep(16, 5),
+                                        rep(19, 5),
+                                        rep(18, 5)),
+                              obs = c(rbinom(5, 4, 0.45),
+                                      rbinom(5, 7, 0.45),
+                                      rbinom(5, 15, 0.45),
+                                      rbinom(5, 16, 0.45),
+                                      rbinom(5, 19, 0.45),
+                                      rbinom(5, 18, 0.45))) %>%
+                     dplyr::mutate(series = paste0('site_', site,
+                                                   '_', species,
+                                                   '_rep_', replicate),
+                                   time = as.numeric(time),
+                                   cap = 50) %>%
+                     dplyr::select(-replicate))
+```
+
+This data format isn't too difficult to set up, but it does differ from the traditional multidimensional array setup that is commonly used for fitting N-mixture models in other software packages. Next we ensure that species and series IDs are included as factor variables, in case we'd like to allow certain effects to vary by species
+```{r}
+testdat$species <- factor(testdat$species,
+                          levels = unique(testdat$species))
+testdat$series <- factor(testdat$series,
+                         levels = unique(testdat$series))
+```
+
+Preview the dataset to get an idea of how it is structured:
+```{r}
+dplyr::glimpse(testdat)
+head(testdat, 12)
+```
+
+### Setting up the `trend_map`
+
+Finally, we need to set up the `trend_map` object. This is crucial for allowing multiple observations to be linked to the same latent process model (see more information about this argument in the [Shared latent states vignette](https://nicholasjclark.github.io/mvgam/articles/shared_states.html){target="_blank"}. In this case, the mapping operates by species and site to state that each set of replicate observations from the same time point should all share the exact same latent abundance model:
+```{r}
+testdat %>%
+  # each unique combination of site*species is a separate process
+  dplyr::mutate(trend = as.numeric(factor(paste0(site, species)))) %>%
+  dplyr::select(trend, series) %>%
+  dplyr::distinct() -> trend_map
+trend_map
+```
+
+Notice how all of the replicates for species 1 in site 1 share the same process (i.e. the same `trend`). This will ensure that all replicates are Binomial draws of the same latent N.
+
+### Modelling with the `nmix()` family
+
+Now we are ready to fit a model using `mvgam()`. This model will allow each species to have different detection probabilities and different temporal trends. We will use `Cmdstan` as the backend, which by default will use Hamiltonian Monte Carlo for full Bayesian inference
+
+```{r include = FALSE, results='hide'}
+mod <- mvgam(
+  # the observation formula sets up linear predictors for
+  # detection probability on the logit scale
+  formula = obs ~ species - 1,
+  
+  # the trend_formula sets up the linear predictors for 
+  # the latent abundance processes on the log scale
+  trend_formula = ~ s(time, by = trend, k = 4) + species,
+  
+  # the trend_map takes care of the mapping
+  trend_map = trend_map,
+  
+  # nmix() family and data
+  family = nmix(),
+  data = testdat,
+  
+  # priors can be set in the usual way
+  priors = c(prior(std_normal(), class = b),
+             prior(normal(1, 1.5), class = Intercept_trend)))
+```
+
+```{r eval = FALSE}
+mod <- mvgam(
+  # the observation formula sets up linear predictors for
+  # detection probability on the logit scale
+  formula = obs ~ species - 1,
+  
+  # the trend_formula sets up the linear predictors for 
+  # the latent abundance processes on the log scale
+  trend_formula = ~ s(time, by = trend, k = 4) + species,
+  
+  # the trend_map takes care of the mapping
+  trend_map = trend_map,
+  
+  # nmix() family and data
+  family = nmix(),
+  data = testdat,
+  
+  # priors can be set in the usual way
+  priors = c(prior(std_normal(), class = b),
+             prior(normal(1, 1.5), class = Intercept_trend)))
+```
+
+View the automatically-generated `Stan` code to get a sense of how the marginalization over latent N works
+```{r}
+code(mod)
+```
+
+The summary of this model shows that it has converged nicely
+```{r}
+summary(mod)
+```
+
+`loo()` functionality works just as it does for all `mvgam` models to aid in model comparison / selection
+```{r}
+loo(mod)
+```
+
+Plot the estimated smooths of time from each species' latent abundance process (on the log scale)
+```{r}
+plot(mod, type = 'smooths', trend_effects = TRUE)
+```
+
+`marginaleffects` support allows for more useful prediction-based interrogations on different scales. Objects that use family `nmix()` have a few additional prediction scales that can be used (i.e. `link`, `response`, `detection` or `latent_N`). For example, here are the estimated detection probabilities per species, which shows that the model has over-estimated detection probability for species 2 (originally simulated to be 0.45):
+```{r}
+plot_predictions(mod, condition = 'species',
+                 type = 'detection') +
+  ylab('Pr(detection)') +
+  ylim(c(0, 1)) +
+  theme_classic() +
+  theme(legend.position = 'none')
+```
+
+A common goal in N-mixture modelling is to estimate the true latent abundance. The model has automatically generated predictions of the latent abundance that are conditional on the observations. We can extract these and produce decent plots using a small function
+```{r}
+hc <- hindcast(mod, type = 'latent_N')
+
+# Function to plot latent abundance estimates vs truth
+plot_latentN = function(hindcasts, data, species = 'sp_1'){
+  all_series <- unique(data %>%
+                         dplyr::filter(species == !!species) %>%
+                         dplyr::pull(series))
+  
+  # Grab the first replicate that represents this series
+  # so we can get the true simulated values
+  series <- as.numeric(all_series[1])
+  truths <- data %>%
+    dplyr::arrange(time, series) %>%
+    dplyr::filter(series == !!levels(data$series)[series]) %>%
+    dplyr::pull(truth)
+  
+  # In case some replicates have missing observations,
+  # pull out predictions for ALL replicates and average over them
+  hcs <- do.call(rbind, lapply(all_series, function(x){
+    ind <- which(names(hindcasts$hindcasts) %in% as.character(x))
+    hindcasts$hindcasts[[ind]]
+  }))
+  
+  # Calculate posterior empirical quantiles of predictions
+  pred_quantiles <- data.frame(t(apply(hcs, 2, function(x) 
+    quantile(x, probs = c(0.05, 0.2, 0.3, 0.4, 
+                          0.5, 0.6, 0.7, 0.8, 0.95)))))
+  pred_quantiles$time <- 1:NROW(pred_quantiles)
+  pred_quantiles$truth <- truths
+  
+  # Grab observations
+  data %>%
+    dplyr::filter(series %in% all_series) %>%
+    dplyr::select(time, obs) -> observations
+  
+  # Plot
+  ggplot(pred_quantiles, aes(x = time, group = 1)) +
+    geom_ribbon(aes(ymin = X5., ymax = X95.), fill = "#DCBCBC") + 
+    geom_ribbon(aes(ymin = X30., ymax = X70.), fill = "#B97C7C") +
+    geom_line(aes(x = time, y = truth),
+              colour = 'black', linewidth = 1) +
+    geom_point(aes(x = time, y = truth),
+               shape = 21, colour = 'white', fill = 'black',
+               size = 2.5) +
+    geom_jitter(data = observations, aes(x = time, y = obs),
+                width = 0.06, 
+                shape = 21, fill = 'darkred', colour = 'white', size = 2.5) +
+    labs(y = 'Latent abundance (N)',
+         x = 'Time',
+         title = species)
+}
+```
+
+Latent abundance plots vs the simulated truths for each species are shown below. Here, the red points show the imperfect observations, the black line shows the true latent abundance, and the ribbons show credible intervals of our estimates:
+```{r}
+plot_latentN(hc, testdat, species = 'sp_1')
+plot_latentN(hc, testdat, species = 'sp_2')
+```
+
+We can see that estimates for both species have correctly captured the true temporal variation in abundance. However, it is also apparent that low detection probabilities (like for species 2) make it difficult to accurately estimate latent abundance. We could likely improve these estimates if we had some additional information that could inform our estimates of detection probability, such as covariates that reflect our ability to take accurate measurements
+
+## Example 2: a two-species system with nonlinear trends
+
+Now for another example with a larger dataset. We will use data from [Jeff Doser's simulation example from the wonderful `spAbundance` package](https://www.jeffdoser.com/files/spabundance-web/articles/nmixturemodels){target="_blank"}. The simulated data include one continuous site-level covariate, one factor site-level covariate and two continuous sample-level covariates. This example will allow us to examine how we can include possibly nonlinear effects in the latent process and detection probability models.
+  
+Download the data and grab observations / covariate measurements for one species
+```{r}
+# Date link
+load(url('https://github.com/doserjef/spAbundance/raw/main/data/dataNMixSim.rda'))
+data.one.sp <- dataNMixSim
+
+# Pull out observations for one species
+data.one.sp$y <- data.one.sp$y[1, , ]
+
+# Abundance covariates that don't change across repeat sampling observations
+abund.cov <- dataNMixSim$abund.covs[, 1]
+abund.factor <- as.factor(dataNMixSim$abund.covs[, 2])
+
+# Detection covariates that can change across repeat sampling observations
+# Note that `NA`s are not allowed for covariates in mvgam, so we randomly
+# impute them here
+det.cov <- dataNMixSim$det.covs$det.cov.1[,]
+det.cov[is.na(det.cov)] <- rnorm(length(which(is.na(det.cov))))
+det.cov2 <- dataNMixSim$det.covs$det.cov.2
+det.cov2[is.na(det.cov2)] <- rnorm(length(which(is.na(det.cov2))))
+```
+
+Next we wrangle into the appropriate 'long' data format, adding indicators of `time` and `series` for working in `mvgam`. We also add the `cap` variable to represent the maximum latent N to marginalize over for each observation
+```{r}
+mod_data <- do.call(rbind,
+                    lapply(1:NROW(data.one.sp$y), function(x){
+                      data.frame(y = data.one.sp$y[x,],
+                                 abund_cov = abund.cov[x],
+                                 abund_fac = abund.factor[x],
+                                 det_cov = det.cov[x,],
+                                 det_cov2 = det.cov2[x,],
+                                 replicate = 1:NCOL(data.one.sp$y),
+                                 site = paste0('site', x))
+                    })) %>%
+  dplyr::mutate(species = 'sp_1',
+                series = as.factor(paste0(site, '_', species, '_', replicate))) %>%
+  dplyr::mutate(site = factor(site, levels = unique(site)),
+                species = factor(species, levels = unique(species)),
+                time = 1,
+                cap = max(data.one.sp$y, na.rm = TRUE) + 20)
+```
+
+The data include observations for 225 sites with three replicates per site, though some observations are missing
+```{r}
+NROW(mod_data)
+dplyr::glimpse(mod_data)
+head(mod_data)
+```
+
+The final step for data preparation is of course the `trend_map`, which sets up the mapping between observation replicates and the latent abundance models. This is done in the same way as in the example above
+```{r}
+mod_data %>%
+  # each unique combination of site*species is a separate process
+  dplyr::mutate(trend = as.numeric(factor(paste0(site, species)))) %>%
+  dplyr::select(trend, series) %>%
+  dplyr::distinct() -> trend_map
+
+trend_map %>%
+  dplyr::arrange(trend) %>%
+  head(12)
+```
+
+Now we are ready to fit a model using `mvgam()`. Here we will use penalized splines for each of the continuous covariate effects to detect possible nonlinear associations. We also showcase how `mvgam` can make use of the different approximation algorithms available in `Stan` by using the meanfield variational Bayes approximator (this reduces computation time substantially)
+```{r include = FALSE, results='hide'}
+mod <- mvgam(
+  # effects of covariates on detection probability;
+  # here we use penalized splines for both continuous covariates
+  formula = y ~ s(det_cov, k = 3) + s(det_cov2, k = 3),
+  
+  # effects of the covariates on latent abundance;
+  # here we use a penalized spline for the continuous covariate and
+  # hierarchical intercepts for the factor covariate
+  trend_formula = ~ s(abund_cov, k = 3) +
+    s(abund_fac, bs = 're'),
+  
+  # link multiple observations to each site
+  trend_map = trend_map,
+  
+  # nmix() family and supplied data
+  family = nmix(),
+  data = mod_data,
+  
+  # standard normal priors on key regression parameters
+  priors = c(prior(std_normal(), class = 'b'),
+             prior(std_normal(), class = 'Intercept'),
+             prior(std_normal(), class = 'Intercept_trend')),
+  
+  # use Stan's variational inference for quicker results
+  algorithm = 'meanfield',
+  samples = 1000)
+```
+
+```{r eval=FALSE}
+mod <- mvgam(
+  # effects of covariates on detection probability;
+  # here we use penalized splines for both continuous covariates
+  formula = y ~ s(det_cov, k = 3) + s(det_cov2, k = 3),
+  
+  # effects of the covariates on latent abundance;
+  # here we use a penalized spline for the continuous covariate and
+  # hierarchical intercepts for the factor covariate
+  trend_formula = ~ s(abund_cov, k = 3) +
+    s(abund_fac, bs = 're'),
+  
+  # link multiple observations to each site
+  trend_map = trend_map,
+  
+  # nmix() family and supplied data
+  family = nmix(),
+  data = mod_data,
+  
+  # standard normal priors on key regression parameters
+  priors = c(prior(std_normal(), class = 'b'),
+             prior(std_normal(), class = 'Intercept'),
+             prior(std_normal(), class = 'Intercept_trend')),
+  
+  # use Stan's variational inference for quicker results
+  algorithm = 'meanfield',
+  samples = 1000)
+```
+
+Inspect the model summary but don't bother looking at estimates for all individual spline coefficients. Notice how we no longer receive information on convergence because we did not use MCMC sampling for this model
+```{r}
+summary(mod, include_betas = FALSE)
+```
+
+Again we can make use of `marginaleffects` support for interrogating the model through targeted predictions. First, we can inspect the estimated average detection probability
+```{r}
+avg_predictions(mod, type = 'detection')
+```
+
+Next investigate estimated effects of covariates on latent abundance using the `conditional_effects()` function and specifying `type = 'link'`; this will return plots on the expectation scale
+```{r}
+abund_plots <- plot(conditional_effects(mod,
+                                        type = 'link',
+                                        effects = c('abund_cov',
+                                                    'abund_fac')),
+                    plot = FALSE)
+```
+
+The effect of the continuous covariate on expected latent abundance
+```{r}
+abund_plots[[1]] +
+  ylab('Expected latent abundance')
+```
+
+The effect of the factor covariate on expected latent abundance, estimated as a hierarchical random effect
+```{r}
+abund_plots[[2]] +
+  ylab('Expected latent abundance')
+```
+
+Now we can investigate estimated effects of covariates on detection probability using `type = 'detection'`
+```{r}
+det_plots <- plot(conditional_effects(mod,
+                                      type = 'detection',
+                                      effects = c('det_cov',
+                                                  'det_cov2')),
+                  plot = FALSE)
+```
+
+The covariate smooths were estimated to be somewhat nonlinear on the logit scale according to the model summary (based on their approximate significances). But inspecting conditional effects of each covariate on the probability scale is more intuitive and useful
+```{r}
+det_plots[[1]] +
+  ylab('Pr(detection)')
+det_plots[[2]] +
+  ylab('Pr(detection)')
+```
+
+More targeted predictions are also easy with `marginaleffects` support. For example, we can ask: How does detection probability change as we change *both* detection covariates?
+```{r}
+fivenum_round = function(x)round(fivenum(x, na.rm = TRUE), 2)
+
+plot_predictions(mod, 
+                 newdata = datagrid(det_cov = unique,
+                                    det_cov2 = fivenum_round),
+                 by = c('det_cov', 'det_cov2'),
+                 type = 'detection') +
+  theme_classic() +
+  ylab('Pr(detection)')
+```
+
+The model has found support for some important covariate effects, but of course we'd want to interrogate how well the model predicts and think about possible spatial effects to capture unmodelled variation in latent abundance.
+
+## Further reading
+The following papers and resources offer useful material about N-mixture models for ecological population dynamics investigations:
+  
+Guélat, Jérôme, and Kéry, Marc. “[Effects of Spatial Autocorrelation and Imperfect Detection on Species Distribution Models.](https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.12983)” *Methods in Ecology and Evolution* 9 (2018): 1614–25.
+  
+Kéry, Marc, and Royle Andrew J. "[Applied hierarchical modeling in ecology: Analysis of distribution, abundance and species richness in R and BUGS: Volume 2: Dynamic and advanced models](https://www.sciencedirect.com/book/9780128237687/applied-hierarchical-modeling-in-ecology-analysis-of-distribution-abundance-and-species-richness-in-r-and-bugs)". London, UK: Academic Press (2020).
+  
+Royle, Andrew J. "[N‐mixture models for estimating population size from spatially replicated counts.](https://onlinelibrary.wiley.com/doi/full/10.1111/j.0006-341X.2004.00142.x)" *Biometrics* 60.1 (2004): 108-115.