params <-
list(EVAL = TRUE)

## ----SETTINGS-knitr, include=FALSE--------------------------------------------
stopifnot(require(knitr))
opts_chunk$set(
  comment=NA,
  eval = if (isTRUE(exists("params"))) params$EVAL else FALSE,
  dev = "png",
  dpi = 150,
  fig.asp = 0.618,
  fig.width = 5,
  out.width = "60%",
  fig.align = "center"
)

## ----setup, message=FALSE-----------------------------------------------------
library("rstan")
library("loo")
set.seed(4711)

## ----llfun_logistic-----------------------------------------------------------
# we'll add an argument log to toggle whether this is a log-likelihood or 
# likelihood function. this will be useful later in the vignette.
llfun_logistic <- function(data_i, draws, log = TRUE) {
  x_i <- as.matrix(data_i[, which(grepl(colnames(data_i), pattern = "X")), drop=FALSE])
  logit_pred <- draws %*% t(x_i)
  dbinom(x = data_i$y, size = 1, prob = 1/(1 + exp(-logit_pred)), log = log)
}

## ----eval=FALSE---------------------------------------------------------------
# # Prepare data
# url <- "http://stat.columbia.edu/~gelman/arm/examples/arsenic/wells.dat"
# wells <- read.table(url)
# wells$dist100 <- with(wells, dist / 100)
# X <- model.matrix(~ dist100 + arsenic, wells)
# standata <- list(y = wells$switch, X = X, N = nrow(X), P = ncol(X))
# 
# # Compile
# stan_mod <- stan_model("logistic.stan")
# 
# # Fit model
# fit_1 <- sampling(stan_mod, data = standata, seed = 4711)
# print(fit_1, pars = "beta")

## ----eval=FALSE---------------------------------------------------------------
# # used for draws argument to loo_i
# parameter_draws_1 <- extract(fit_1)$beta
# 
# # used for data argument to loo_i
# stan_df_1 <- as.data.frame(standata)
# 
# # compute relative efficiency (this is slow and optional but is recommended to allow
# # for adjusting PSIS effective sample size based on MCMC effective sample size)
# r_eff <- relative_eff(llfun_logistic,
#                       log = FALSE, # relative_eff wants likelihood not log-likelihood values
#                       chain_id = rep(1:4, each = 1000),
#                       data = stan_df_1,
#                       draws = parameter_draws_1,
#                       cores = 2)
# 
# loo_i(i = 1, llfun_logistic, r_eff = r_eff, data = stan_df_1, draws = parameter_draws_1)

## ----eval=FALSE---------------------------------------------------------------
# set.seed(4711)
# loo_ss_1 <-
#   loo_subsample(
#     llfun_logistic,
#     observations = 100, # take a subsample of size 100
#     cores = 2,
#     # these next objects were computed above
#     r_eff = r_eff,
#     draws = parameter_draws_1,
#     data = stan_df_1
#   )
# print(loo_ss_1)

## ----eval=FALSE---------------------------------------------------------------
# set.seed(4711)
# loo_ss_1b <-
#   update(
#     loo_ss_1,
#     observations = 200, # subsample 200 instead of 100
#     r_eff = r_eff,
#     draws = parameter_draws_1,
#     data = stan_df_1
#   )
# print(loo_ss_1b)

## ----eval=FALSE---------------------------------------------------------------
# set.seed(4711)
# loo_ss_1c <-
#   loo_subsample(
#     x = llfun_logistic,
#     r_eff = r_eff,
#     draws = parameter_draws_1,
#     data = stan_df_1,
#     observations = 100,
#     estimator = "hh_pps", # use Hansen-Hurwitz
#     loo_approximation = "lpd", # use lpd instead of plpd
#     loo_approximation_draws = 100,
#     cores = 2
#   )
# print(loo_ss_1c)

## ----eval=FALSE---------------------------------------------------------------
# fit_laplace <- optimizing(stan_mod, data = standata, draws = 2000,
#                           importance_resampling = TRUE)
# parameter_draws_laplace <- fit_laplace$theta_tilde # draws from approximate posterior
# log_p <- fit_laplace$log_p # log density of the posterior
# log_g <- fit_laplace$log_g # log density of the approximation

## ----eval=FALSE---------------------------------------------------------------
# set.seed(4711)
# loo_ap_1 <-
#   loo_approximate_posterior(
#     x = llfun_logistic,
#     draws = parameter_draws_laplace,
#     data = stan_df_1,
#     log_p = log_p,
#     log_g = log_g,
#     cores = 2
#   )
# print(loo_ap_1)

## ----eval=FALSE---------------------------------------------------------------
# set.seed(4711)
# loo_ap_ss_1 <-
#   loo_subsample(
#     x = llfun_logistic,
#     draws = parameter_draws_laplace,
#     data = stan_df_1,
#     log_p = log_p,
#     log_g = log_g,
#     observations = 100,
#     cores = 2
#   )
# print(loo_ap_ss_1)

## ----eval=FALSE---------------------------------------------------------------
# standata$X[, "arsenic"] <- log(standata$X[, "arsenic"])
# fit_2 <- sampling(stan_mod, data = standata)
# parameter_draws_2 <- extract(fit_2)$beta
# stan_df_2 <- as.data.frame(standata)
# 
# # recompute subsampling loo for first model for demonstration purposes
# 
# # compute relative efficiency (this is slow and optional but is recommended to allow
# # for adjusting PSIS effective sample size based on MCMC effective sample size)
# r_eff_1 <- relative_eff(
#   llfun_logistic,
#   log = FALSE, # relative_eff wants likelihood not log-likelihood values
#   chain_id = rep(1:4, each = 1000),
#   data = stan_df_1,
#   draws = parameter_draws_1,
#   cores = 2
# )
# 
# set.seed(4711)
# loo_ss_1 <- loo_subsample(
#   x = llfun_logistic,
#   r_eff = r_eff_1,
#   draws = parameter_draws_1,
#   data = stan_df_1,
#   observations = 200,
#   cores = 2
# )
# 
# # compute subsampling loo for a second model (with log-arsenic)
# 
# r_eff_2 <- relative_eff(
#   llfun_logistic,
#   log = FALSE, # relative_eff wants likelihood not log-likelihood values
#   chain_id = rep(1:4, each = 1000),
#   data = stan_df_2,
#   draws = parameter_draws_2,
#   cores = 2
# )
# loo_ss_2 <- loo_subsample(
#   x = llfun_logistic,
#   r_eff = r_eff_2,
#   draws = parameter_draws_2,
#   data = stan_df_2,
#   observations = 200,
#   cores = 2
# )
# 
# print(loo_ss_2)

## ----eval=FALSE---------------------------------------------------------------
# # Compare
# comp <- loo_compare(loo_ss_1, loo_ss_2)
# print(comp)

## ----eval=FALSE---------------------------------------------------------------
# loo_ss_2 <-
#   loo_subsample(
#     x = llfun_logistic,
#     r_eff = r_eff_2,
#     draws = parameter_draws_2,
#     data = stan_df_2,
#     observations = loo_ss_1,
#     cores = 2
#   )

## ----eval=FALSE---------------------------------------------------------------
# idx <- obs_idx(loo_ss_1)
# loo_ss_2 <- loo_subsample(
#   x = llfun_logistic,
#   r_eff = r_eff_2,
#   draws = parameter_draws_2,
#   data = stan_df_2,
#   observations = idx,
#   cores = 2
# )

## ----eval=FALSE---------------------------------------------------------------
# comp <- loo_compare(loo_ss_1, loo_ss_2)
# print(comp)

## ----eval=FALSE---------------------------------------------------------------
# # use loo() instead of loo_subsample() to compute full PSIS-LOO for model 2
# loo_full_2 <- loo(
#   x = llfun_logistic,
#   r_eff = r_eff_2,
#   draws = parameter_draws_2,
#   data = stan_df_2,
#   cores = 2
# )
# loo_compare(loo_ss_1, loo_full_2)