Corpus constitution
Data loading
Data Processing
- Information scrapping and cleaning
Counting and more
Analyzes
- GLM
- Contextual analysis
  - Syntagma curation

Antibiotics and food in the American press: A text mining study.
Antoine Bridier-Nahmias\(\dagger\), Estera Badau\(\dagger\), Pi Nyvall Collen ,Antoine Andremont, Jocelyne Arquembourg

\(\dagger\): These authors contributed equally to this work

Corpus constitution

The articles have been searched upon the Factiva database, based on key words and expressions used in conjunction. Terms and expressions researched were the following:

antibiotic resistance, antimicrobial resistance, 
antibiotic free or antibiotic-free, antibiotics and food, 
antibiotics and farming, antibiotics and resistant, antibiotics and salmonella, 
salmonella and resistant, salmonella and outbreak, 
antibiotics and campylobacter and resistant, antibiotics and routine, 
antibiotics and routinely, antibiotics and One Health;
(antibio* near3 food) or (antibio* near3 farm*) or (antibio* near3 salmonell*) 
or (antibio* near3 campylobacter*) or (antibio* near3 animal*) or 
(antibio* near3 feed)

Data loading

The corpus is consituted by articles saved in independent pdf files.

# list pdf files
pdf_list <-
  list.files(path = "../data/corpus/", pattern = "^.*pdf$", full.names = TRUE, recursive = TRUE)
# scrap their text content
pdf_txt <-
  lapply(X = pdf_list, FUN = function(x) paste0(pdf_text(x), collapse = "\n" ))
# split them over each newline
pdf_split <-
  sapply(X = pdf_txt, function(x) str_split(string = unlist(x), pattern = "\n"))
# eliminating leading spaces in each line
pdf_split_strp <-
  lapply(X = pdf_split, function(x) str_replace(string = x, pattern = "^[[:space:]]+", replacement = ""))

Data Processing

Information scrapping and cleaning

# This function will take care of the parsing
gogo_gadgeto_get_info <- function(text_vector){
  # HD is the title tag
  title <- gsub(pattern = "HD(.*)", replacement = "\\1",
                x = grep(pattern = "^HD.*", x = text_vector, value = TRUE))
  title <- str_remove_all(string = title, pattern = "^ *")
  # BY is the author tag
  author <- gsub(pattern = "(?:BY|By)(.*)", replacement = "\\1",
                 x = grep(pattern = "^(?:BY|By).*", x = text_vector, value = TRUE))
  author <- ifelse(test = length(author) == 0, yes = "", no = author)
  
  # SN is the journal tag
  journal <- gsub(pattern = "SN(.*)", replacement = "\\1",
                  x = grep(pattern = "^SN.*", x = text_vector, value = TRUE))
  journal <- ifelse(test = length(journal) == 0, yes = "", no = journal)
  journal <- str_replace(journal, "^ +", "")
  
  # PD is the publication date tag
  pub_date <- gsub(pattern = "PD(.*)", replacement = "\\1",
                   x = grep(pattern = "^PD.*", x = text_vector, value = TRUE))
  pub_date <- ifelse(test = length(pub_date) == 0, yes = "", no = pub_date)
  pub_date <- gsub(pattern = "aot", replacement = "august", x = pub_date)
  pub_date <- dmy(pub_date)
  
  # output is a tibble with all the informations
  article_info <- tibble(title = title,
                             author = author,
                             journal = journal,
                             pub_date = pub_date)
  return(article_info)
}
# extract informations of each article w/ gogo_gadgeto_get_info
pdf_info <-
  lapply(X = pdf_split_strp, FUN = gogo_gadgeto_get_info)

We will now fuse the articles and their respective informations in a dataframe, and then we will remove the headers and footers. This operation is noisy because of the inconsistency in the footer formatting.

# making a data.frame with the info and the text
pdf_txt_info <- list()
for (i in 1:length(pdf_split_strp)) {
  pdf_txt_info[[i]] <- 
    cbind.data.frame(pdf_info[[i]], 
                     text = as.character(pdf_split_strp[[i]]), 
                     stringsAsFactors = FALSE)
}
# Removing header and footer in each dataframe
# The footer is inconsistent across article and 
# many different lines are needed to purge it out
# check for a string : sum(unlist(lapply(pdf_txt_info, function(x) str_detect(string = x$text, pattern = "^LP"))))
behead_and_befoot <- function(df_in){
  df_out <-
    df_in %>%
    filter(cumsum(str_detect(text, pattern = "^LP")) >= 1) %>%
    filter(cumsum(str_detect(text, pattern = "^NS") ) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^Illustrations:") ) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^ART") ) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^CT") ) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^IPD") ) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^.*\\|.*\\|.*")) < 1) %>%
    filter(cumsum(str_detect(text, pattern = "^AN ")) < 1) %>% 
    filter(cumsum(str_detect(text, pattern = "^RF ")) < 1) %>% 
    filter(cumsum(str_detect(text, pattern = "^CO ")) < 1) %>%
    filter(!str_detect(text, pattern = "Factiva")) %>%
    filter(!str_detect(text, pattern = "^TD$")) %>%
    filter(!str_detect(text, pattern = "^LP$")) %>%
    filter(!str_detect(text, pattern = "^$")) %>% 
    identity()
  return(df_out)
}
txt_clean <-
  lapply(X = pdf_txt_info, 
         FUN = behead_and_befoot)

We are ready to unite everything in one data.frame, beforehand we’ll just add a unique id for each article.

# before uniting them, each article needs to receive a unique ID
for (i in 1:length(txt_clean)) {
  txt_clean[[i]] <- cbind.data.frame(txt_clean[[i]], id = i)
  txt_clean[[i]]$text[1] <- paste(txt_clean[[i]]$title[1], 
                                  txt_clean[[i]]$text[1], 
                                  sep = " ")
}
# uniting everything into a big dataframe
corpus_txt <-
  do.call(rbind, txt_clean)

The tokenzation can now take place. We can use multiple ngrams size, we will start with 1grams first i.e: words.

corpus_1_grams_unfiltered <- 
  unnest_tokens(tbl = corpus_txt, 
                output = "word", 
                input = "text", 
                token = "ngrams", 
                n = 1)

Counting and more

Let’s first extract some figures about the whole corpus

articla <-
  length(unique(corpus_1_grams_unfiltered$id))
articla_by_journal <-
  corpus_1_grams_unfiltered %>%
  group_by(journal) %>%
  summarize(n = n_distinct(id))
worda <- 
  format(nrow(corpus_1_grams_unfiltered), big.mark = ",")
worda_uniq <-
  format(length(unique(corpus_1_grams_unfiltered$word)), big.mark = ",")
worda_by_journal <-
  corpus_1_grams_unfiltered %>%
  group_by(journal) %>% count()
worda_uniq_by_journal <-
  corpus_1_grams_unfiltered %>%
  group_by(journal) %>%
  summarize(n = n_distinct(word))
# articla;articla_by_journal;worda;worda_uniq; worda_by_journal;worda_uniq_by_journal

The total number of articles:
overall: 516
by journal:
The total number of words in the corpus
overall: 493,202
by journal:
The total number of distinct words in the corpus
overall: 22,814
by journal:

Publication chronology

timeline_events <- read_delim("../data/timeline_events.tsv", 
                              "\t", escape_double = FALSE, trim_ws = TRUE, comment = "#")

Parsed with column specification:
cols(
  date = [34mcol_date(format = "")[39m,
  full_event = [31mcol_character()[39m,
  event_label = [31mcol_character()[39m
)

timeline_events <-
  timeline_events %>%
  mutate(event_label = str_replace_all(string = event_label, pattern = "XXX", replacement = "\n")) %>%
  mutate(date = ymd(date)) %>%
  mutate(date_lab = paste(month(date, label = TRUE, abbr = TRUE, locale = "en_US.utf8"), year(date))) %>%
  mutate(event_label = paste0(event_label,"\n", date_lab)) %>% 
  mutate(ypos = 0.1, ypos = ypos * c(1, -1)) %>%  # in order to appear above or under the timeline
  mutate(ydate = ypos*0.5)

longer object length is not a multiple of shorter object length

article_hist_dodge <-
  corpus_1_grams_unfiltered %>%
  ungroup() %>%
  select(id, pub_date, journal) %>%
  group_by(id) %>%
  slice(1) %>%
  mutate(year = ymd(paste0(year(pub_date),"01","01"))) %>%
  group_by(year, journal) %>%
  mutate(count = n()) %>%
  slice(1)
histo <-
  ggplot(data = article_hist_dodge) +
  geom_col(mapping = aes(x = year, y = count, fill = journal), 
           position = "dodge", alpha = 0.8, colour = "black") +
  scale_color_manual(values = c(alpha("black", 0.1), alpha("black", 0.1))) +
  scale_fill_manual(values = c("steelblue", "violetred3")) +
  scale_x_date(breaks = seq(from = ymd("1980/01/01"), to = ymd("2015/01/01"), by = "5 years"),
               date_labels = "%Y",
               minor_breaks = waiver(),
               date_minor_breaks = "1 years",
               limits = c(ymd("1979/01/01"),ymd("2017/01/01"))) + 
  background_grid(major = "xy", 
                  minor = "xy", 
                  colour.major = rgb(red = 0.5,green = 0.5,blue = 0.5, alpha = 0.5),
                  colour.minor = rgb(red = 0.5,green = 0.5,blue = 0.5, alpha = 0.1)) +
  theme(legend.position = "top",
        legend.direction = "horizontal")
histo

timeline <- 
  ggplot(data = timeline_events) +
  geom_point(mapping = aes(x = date, y = ypos)) +
  geom_segment(mapping = aes(xend = date, x = date, y = ypos, yend = 0)) +
  geom_hline(yintercept = 0, color = "black", size=0.3) + # timeline itself
  ggrepel::geom_label_repel(mapping = aes(x = date, y = ypos, label = event_label), inherit.aes = FALSE) +
  # ggrepel::geom_label_repel(mapping = aes(x = date, y = ydate, label = date_lab, angle = 25), point.padding = 0, inherit.aes = FALSE) +
  scale_x_date(breaks = seq(from = ymd("1980/01/01"), to = ymd("2015/01/01"), by = "5 years"),
               date_labels = "%Y",
               minor_breaks = waiver(),
               date_minor_breaks = "1 years",
               limits = c(ymd("1979/01/01"),ymd("2017/01/01"))) + 
  theme(axis.line.y = element_blank(),
        axis.text.y = element_blank(),
        axis.title.x = element_blank(),
        axis.title.y = element_blank(),
        axis.ticks.y = element_blank(),
        axis.text.x = element_blank(),
        axis.ticks.x = element_blank(),
        axis.line.x = element_blank()
          )
timeline

Counts and TF-IDF

We will compute the following:

corpus_length: the total number of documents in the corpus
article_length: the total number of words in each article
n_article: the count of each word in each article
word_in_n: for each word, how many articles contain it
n_tot: total count of each word
n_journal: total count of each word by journal

suppressMessages(
  my_stop_words <-
    read_table(
      file = "../data/my_stop_words.txt",
      col_names = "stop_word"
    )
)
corpus_tfidf_full <-
  corpus_1_grams_unfiltered %>%
  # filter(id %in% c(30:100,400:500) ) %>%
  # filter(id %in% c(517) ) %>%
  
  # clean dataset
  mutate(word = str_to_lower(string = word)) %>% 
  mutate(word = str_replace_all(string = word, pattern = "([[:alpha:]]*)\\.([[:alpha:]]*)", replacement = "\\1\\2")) %>%
  mutate(word = str_replace_all(string = word, pattern = "'s$", replacement = "")) %>%
  # mutate(word = str_replace_all(string = word, pattern = "[^a-z]", replacement = "")) %>%
  filter(!(str_detect(string = word, pattern = "washpostcom"))) %>% # Tokenization splits on @ !!!!!!!
  filter(word != "") %>% 
  filter(nchar(word) > 1) %>% 
  filter(!str_detect(string = word, pattern = "^[0-9]|[[:punct:]]+$")) %>%
  
  # lemmatization (better than stemming) and last filtering
  mutate(stem = stem_words(word)) %>%
  filter(!word %in% my_stop_words$stop_word) %>% 
  
  # total number of articles
  mutate(corpus_length = length(unique(id) )) %>%  
  
  # total word in article
  group_by(id) %>%
  mutate(article_length = n()) %>%
  
  # count of each word by article
  group_by(id, stem) %>% 
  mutate(n_article = n()) %>% 
  
  # word count
  group_by(stem) %>% 
  mutate(n_total = n()) %>% 
  group_by(stem, journal) %>% 
  mutate(n_journal = n()) %>% 
  ungroup() %>%
  # compute tf-idf
  
  mutate(tf = n_article / article_length) %>% # text frequency
  group_by(stem) %>% 
  mutate(word_in_n = length(unique(id))) %>% 
  mutate(idf = log(corpus_length / word_in_n) ) %>% # inverse document frequency
  mutate(tf_idf = tf * idf) %>% 
  ungroup() %>% 
  
  # Choose a representant for each stem, the most common term could be the best
  group_by(stem) %>%
  mutate(ori_word = word) %>%
  group_by(ori_word) %>% 
  mutate(n_ori = n()) %>%
  arrange(desc(n_ori)) %>%
  group_by(stem) %>% 
  mutate(word = word[1]) %>%
  select(-n_ori) %>% 
  ungroup()
# write_delim(x = corpus_tfidf_full, path = "../output/corpus_tfidf_full.tsv", delim = "\t", col_names = TRUE)
# corpus_tfidf_full <- 
#   read_delim(file = "../output/corpus_tfidf_full.tsv", delim = "\t", col_names = TRUE)
corpus_tfidf <-
  corpus_tfidf_full %>% 
  # reduce
  group_by(id, word) %>%
  slice(1) %>% 
  ungroup() %>%
  
  # filter out  words with tf-idf == 0
  filter(tf_idf > 0) %>% 
  identity()
corpus_tfidf %>% 
  filter(!(word %in% stop_words$word)) %>%
  filter(n_total >= 50) %>% 
  arrange(desc(n_total)) %>% 
  group_by(word, journal) %>% 
  slice(1) %>%
  select(word, journal, pub_date, n_total, n_journal) %>%
  arrange(desc(n_total)) %>% 
  datatable(caption = "Words appearing at least 50 times", filter = "top") %>% 
  identity()

Word count evolution through time

corpus_year <-
  corpus_tfidf_full %>%
  # Filter out a word if one member of the family (ori_word) is a stopword
  group_by(word) %>% 
  mutate(is_stop = ifelse(test = sum(ori_word %in% stop_words$word) >= 1, yes = TRUE, no = FALSE)) %>%
  filter(!is_stop) %>% 
  mutate(is_stop = NULL) %>% 
  ungroup() %>% 
  filter(n_total > 350) %>%
  mutate(year = year(pub_date)) %>%
  group_by(word, year, journal) %>%
  mutate(n_year = n()) %>%
  slice(1) %>%
  ungroup() %>%
  mutate(word = reorder(word, desc(n_total)))# Conversion to factor for ordering in the facet_wrapping of the plot
my_labeller <-
  unique(paste0(corpus_year$word, "(",corpus_year$n_total,")"))
names(my_labeller) <- unique(corpus_year$word)
word_time_plot <-
  ggplot(corpus_year) +
  geom_line(mapping = aes(x = pub_date, y = n_year, colour = journal)) +
  ylab("count") +
    xlab("Year") +
  scale_color_manual(values = c("steelblue", "violetred3")) +
  scale_x_date(breaks = seq(from = ymd("1980/01/01"), to = ymd("2015/01/01"), by = "5 years"),
               date_labels = "%Y",
               minor_breaks = waiver(),
               date_minor_breaks = "1 years",
               limits = c(ymd("1979/01/01"),ymd("2017/01/01"))) + # 1 year before because dodge needs a bit of space apparently
  theme_bw() +
  theme(legend.position = "top", legend.text = element_text(size = 12)) +
  facet_wrap(~word, ncol = 3, labeller = as_labeller(my_labeller), scales = "free")
# ggdraw() + draw_plot(word_time_plot) + ggsave(filename = "../output/words_time.pdf", width = 30, height = 90, units = "cm")
word_time_plot

# For the paper
selected_word_time_plot <-
  corpus_year %>%
  filter(str_detect(string = word, pattern = "^antibiotics$|^farm$|^industry$")) %>%
  ggplot() +
  geom_line(mapping = aes(x = pub_date, y = n_year, colour = journal)) +
  ylab("count") +
  xlab("Year") +
  scale_color_manual(values = c("steelblue", "violetred3"), 
                     guide = guide_legend(title = NULL)) +
  scale_x_date(breaks = seq(from = ymd("1980/01/01"), to = ymd("2015/01/01"), by = "5 years"),
               date_labels = "%Y",
               minor_breaks = waiver(),
               date_minor_breaks = "1 years",
               limits = c(ymd("1979/01/01"),ymd("2017/01/01"))) + # 1 year before because dodge needs a bit of space apparently
  theme_bw() +
  theme(legend.position = "top", legend.text = element_text(size = 12)) +
  facet_wrap(~word, ncol = 1, labeller = as_labeller(my_labeller), scales = "free")

selected_word_time_plot

Analyzes

GLM

What are the term that could discriminate between an article from the WP and the NYT?

corpus_glm_wide <-
  corpus_tfidf %>% 
  select(word, id, journal, tf_idf) %>% 
  mutate(id_journal = journal, journal = NULL) %>% # journal is a word present in the corpus 
  spread(key = word, value = tf_idf) %>% 
  base::replace(x = ., list = is.na(.), values = 0) %>%
  ungroup() %>% 
  select(-id) %>% 
  mutate(id_journal = as.factor(id_journal)) %>% 
  ungroup() %>% 
  identity()
standardize_classic <- 
  function(x) return((x - mean(x)) / sd(x))
standardize_gelman <- 
  function(x) return(x - mean(x) / 2 * sd(x)) # strange, see https://andrewgelman.com/2009/07/11/when_to_standar/
standardized_tf_idf <- # corpus_glm_wide[, -1]
  apply(X = as.matrix(corpus_glm_wide[ ,-1]), 
        MARGIN = 2,  
         FUN = standardize_classic)
response_var <- 
  corpus_glm_wide$id_journal
response_var_bool <- 
  ifelse(test = response_var == "The Washington Post", 
         yes = TRUE, 
         no = FALSE)

set.seed(c(12,10,2018,18,20)) # cv.glmnet has a random part
system.time(
corpus_lasso <- 
  cv.glmnet(x = standardized_tf_idf, 
                          y = response_var_bool, 
                          family = "binomial", 
                          nfolds = 10, 
                          type.measure = "auc", # could be "auc" or "class"
                          intercept = FALSE,
                          alpha = 0.5)
)

   user  system elapsed 
 13.482   0.293  13.802

plot(corpus_lasso)

worda <- 
  dimnames(coef(corpus_lasso))[[1]]
beta_df <- 
  data.frame(word = worda,beta_coef = as.vector(coef.cv.glmnet(corpus_lasso, corpus_lasso$lambda.min))) %>% 
  filter(beta_coef != 0) %>%
  arrange(desc(beta_coef)) %>% 
  mutate(p = exp((beta_coef)) / (1 + exp((beta_coef))) ) %>% 
  mutate(lab_beta_coef = (signif(beta_coef, 2))) %>% 
  identity()
beta_df

tilos <-
  ggplot(data = beta_df, mapping = aes(x = factor(0), y = reorder(word, beta_coef))) +
  geom_tile(aes(fill = beta_coef)) +
  geom_text(aes(label = word)) +
  scale_fill_gradient2(low = "steelblue",
                       mid = "white", 
                       high = "violetred3", 
                       midpoint = 0, 
                       space = "Lab", 
                       breaks = c(max(beta_df$beta_coef), min(beta_df$beta_coef)),
                       labels = c("WP", "NYT") ) +
  scale_y_discrete(labels = (sort(beta_df$lab_beta_coef, decreasing = FALSE)) ) +
  ggtitle("") +
  xlab("word") +
  ylab("beta coefficient from the standardized logistic regression") +
  theme_classic() +
  theme(axis.text = element_text(), 
        axis.text.x = element_blank(), 
        axis.ticks.x = element_blank(), 
        panel.background = element_blank(), 
        panel.grid.major = element_blank(), 
        panel.grid.minor = element_blank(),
        legend.title = element_blank()
        ) +
  geom_blank()
tilos

# predos <- 
#   predict.cv.glmnet(object = corpus_lasso, 
#                     newx = standardized_tf_idf, 
#                     s = "lambda.min", 
#                     type = "class")
# table(predos == response_var_bool)

Contextual analysis

Syntagma curation

In the next section, we will concentrate on counting manually curated terms or expressions (syntagmas) They will be presented in a named list containing all the terms considered equivalent. We will then extract all the sentences in which they occur and analyse their context (in general and across time).

curated_syntagma <- 
  list(
    "antibiotic_resistance" = 
      c("antibiotic resistance", "antibiotic-resistance", "resistant to antibiotics", "resistance to antibiotics"),
    "antibiotic_free" = 
      c("antibiotic free", "antibiotic-free", "antibioticsfree", "free of antibiotics"),
    "routine_use" = 
      c("routine use", "routinely used"),
    "judicious_use" = 
      c("judicious use"),
    "responsible_use" = 
      c("responsible use"),
    "prudent_use" = 
      c("prudent use"),
    "indiscriminate_use" = 
      c("indiscriminate use"),
    "food_borne" = 
      c("food borne", "food-borne")
  )
curated_syntagma

$antibiotic_resistance
[1] "antibiotic resistance"     "antibiotic-resistance"     "resistant to antibiotics"  "resistance to antibiotics"

$antibiotic_free
[1] "antibiotic free"     "antibiotic-free"     "antibioticsfree"     "free of antibiotics"

$routine_use
[1] "routine use"    "routinely used"

$judicious_use
[1] "judicious use"

$responsible_use
[1] "responsible use"

$prudent_use
[1] "prudent use"

$indiscriminate_use
[1] "indiscriminate use"

$food_borne
[1] "food borne" "food-borne"

The first step is to divide the corpus in sentences.
Remark unnest_tokens(token = "sentences") clearly fails whenever it encounters an abbreviation containing a dot.

corpus_sentences <-
  corpus_txt %>% 
  # Each article has to be re-concatenated
  group_by(id) %>% 
  # filter(id %in% 1:5) %>%
  mutate(article = paste(text, collapse = " ")) %>%
  select(-text) %>% 
  distinct() %>%
  ungroup() %>% 
# Could/should be done in one pass with a list of terms!
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "dr\\.", ignore_case = TRUE), replacement = "dr")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "prof\\.", ignore_case = TRUE), replacement = "prof")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "mr\\.", ignore_case = TRUE), replacement = "mr")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "ms\\.", ignore_case = TRUE), replacement = "ms")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "mrs\\.", ignore_case = TRUE), replacement = "mrs")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "st\\.", ignore_case = TRUE), replacement = "st")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "rep\\.", ignore_case = TRUE), replacement = "rep")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "u\\.s\\.", ignore_case = TRUE), replacement = "usa")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "f\\.d\\.a\\.", ignore_case = TRUE), replacement = "fda")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "gov\\.", ignore_case = TRUE), replacement = "gov")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "sen\\.", ignore_case = TRUE), replacement = "sen")) %>%
  mutate(article = str_replace_all(string = article, pattern = regex(pattern = "( .{1})\\.", ignore_case = TRUE), replacement = "\\1")) %>%
  unnest_tokens(output = "sentence", 
                input = article, 
                token = "sentences", 
                to_lower = TRUE) %>%
  mutate(length = nchar(sentence)) %>%
  select(length, everything()) %>% 
  ungroup() %>% 
  identity()
# Diagnose problems with abbreviations (Mr. Dr. etc)
end_sentences_corpus <-
  corpus_sentences %>%
  filter(str_detect(string = sentence, pattern = "^[[:alnum:]]{1,5}\\.$")) %>%
  group_by(sentence) %>%
  summarize(n = n()) %>%
  ungroup() %>%
  mutate(n_char = nchar(sentence)) %>%
  arrange(desc(n))

We can now try to isolate sentences containing our terms of interest.

corpus_syntagma_sentence <-
  lapply(X = curated_syntagma, FUN = function(syntagma){
    corpus_sentences %>%
      rowwise() %>%
      mutate(syntagmus = ifelse(test = sum(str_detect(string = sentence, pattern = syntagma)) > 0, yes = syntagma, no = NA)) %>%
      filter(!is.na(syntagmus))
  })
corpus_syntagma_sentence <-
  do.call(what = rbind, args = corpus_syntagma_sentence)
table(corpus_syntagma_sentence$syntagmus)


      antibiotic free antibiotic resistance            food borne    indiscriminate use         judicious use           prudent use 
                  125                   299                   119                    16                    14                     7 
      responsible use           routine use 
                    1                    53

table(corpus_syntagma_sentence$syntagmus, corpus_syntagma_sentence$journal)

                       
                        The New York Times The Washington Post
  antibiotic free                       88                  37
  antibiotic resistance                165                 134
  food borne                            55                  64
  indiscriminate use                    13                   3
  judicious use                          9                   5
  prudent use                            6                   1
  responsible use                        1                   0
  routine use                           38                  15

On this new dataframe, we can count the occurence of each word in the sentence context of each syntagma, overall and divided by journal:

corpus_syntagma_word <-
  corpus_syntagma_sentence %>%
  unnest_tokens(output = "word", input = sentence, token = "ngrams", n = 1) %>%
  filter(!(word %in% stop_words$word)) %>%
  filter(is.na(str_match(string = word, pattern = "[0-9]"))) %>% # no match in str_match() returns NA
  mutate(word = str_replace_all(string = word, pattern = "\\.", replacement = "")) %>%
  mutate(word = str_replace_all(string = word, pattern = "(.*)'s", replacement = "\\1")) %>%
  mutate(stem = stem_words(word)) %>%
  
  # Choose a representant for each stem, the most common term could be the best
  group_by(stem) %>%
  mutate(ori_word = word) %>%
  group_by(ori_word) %>% 
  mutate(n_ori = n()) %>%
  arrange(desc(n_ori)) %>%
  group_by(stem) %>% 
  mutate(word = word[1]) %>%
  select(-n_ori) %>% 
  ungroup() %>% 
  
  group_by(syntagmus, stem) %>%
  mutate(n_total = n()) %>%
  group_by(syntagmus, journal, stem) %>%
  mutate(n_journal = n()) %>%
  slice(1) %>%
  ungroup() %>% 
  select(syntagmus, word, journal, n_journal, n_total) %>%
  arrange(desc(n_total)) %>%
  identity()

Grouping rowwise data frame strips rowwise natureGrouping rowwise data frame strips rowwise nature

corpus_syntagma_word %>% 
    datatable(filter = "top", rownames = FALSE, options = list(pageLength = 10))

Figures printing and saving

Packages loading

─ Session info ─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────

─ Packages ─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
 package        * version date       lib source        
 askpass          1.1     2019-01-13 [1] CRAN (R 3.6.0)
 assertthat       0.2.1   2019-03-21 [1] CRAN (R 3.6.0)
 backports        1.1.4   2019-04-10 [1] CRAN (R 3.6.0)
 base64enc        0.1-3   2015-07-28 [1] CRAN (R 3.6.0)
 broom            0.5.2   2019-04-07 [1] CRAN (R 3.6.0)
 callr            3.2.0   2019-03-15 [1] CRAN (R 3.6.0)
 cli              1.1.0   2019-03-19 [1] CRAN (R 3.6.0)
 codetools        0.2-16  2018-12-24 [2] CRAN (R 3.6.0)
 colorspace       1.4-1   2019-03-18 [1] CRAN (R 3.6.0)
 cowplot        * 0.9.4   2019-01-08 [1] CRAN (R 3.6.0)
 crayon           1.3.4   2017-09-16 [1] CRAN (R 3.6.0)
 crosstalk        1.0.0   2016-12-21 [1] CRAN (R 3.6.0)
 data.table       1.12.2  2019-04-07 [1] CRAN (R 3.6.0)
 desc             1.2.0   2018-05-01 [1] CRAN (R 3.6.0)
 devtools         2.0.2   2019-04-08 [1] CRAN (R 3.6.0)
 digest           0.6.18  2018-10-10 [1] CRAN (R 3.6.0)
 dplyr          * 0.8.0.1 2019-02-15 [1] CRAN (R 3.6.0)
 DT             * 0.5     2018-11-05 [1] CRAN (R 3.6.0)
 evaluate         0.13    2019-02-12 [1] CRAN (R 3.6.0)
 foreach        * 1.4.4   2017-12-12 [1] CRAN (R 3.6.0)
 fs               1.2.7   2019-03-19 [1] CRAN (R 3.6.0)
 generics         0.0.2   2018-11-29 [1] CRAN (R 3.6.0)
 ggplot2        * 3.1.1   2019-04-07 [1] CRAN (R 3.6.0)
 ggrepel          0.8.0   2018-05-09 [1] CRAN (R 3.6.0)
 glmnet         * 2.0-16  2018-04-02 [1] CRAN (R 3.6.0)
 glue             1.3.1   2019-03-12 [1] CRAN (R 3.6.0)
 gtable           0.3.0   2019-03-25 [1] CRAN (R 3.6.0)
 hms              0.4.2   2018-03-10 [1] CRAN (R 3.6.0)
 htmltools        0.3.6   2017-04-28 [1] CRAN (R 3.6.0)
 htmlwidgets      1.3     2018-09-30 [1] CRAN (R 3.6.0)
 httpuv           1.5.1   2019-04-05 [1] CRAN (R 3.6.0)
 iterators        1.0.10  2018-07-13 [1] CRAN (R 3.6.0)
 janeaustenr      0.1.5   2017-06-10 [1] CRAN (R 3.6.0)
 jsonlite         1.6     2018-12-07 [1] CRAN (R 3.6.0)
 knitr            1.22    2019-03-08 [1] CRAN (R 3.6.0)
 koRpus         * 0.11-5  2018-10-28 [1] CRAN (R 3.6.0)
 koRpus.lang.en * 0.1-2   2018-03-21 [1] CRAN (R 3.6.0)
 labeling         0.3     2014-08-23 [1] CRAN (R 3.6.0)
 later            0.8.0   2019-02-11 [1] CRAN (R 3.6.0)
 lattice          0.20-38 2018-11-04 [2] CRAN (R 3.6.0)
 lazyeval         0.2.2   2019-03-15 [1] CRAN (R 3.6.0)
 lubridate      * 1.7.4   2018-04-11 [1] CRAN (R 3.6.0)
 magrittr         1.5     2014-11-22 [1] CRAN (R 3.6.0)
 Matrix         * 1.2-17  2019-03-22 [2] CRAN (R 3.6.0)
 memoise          1.1.0   2017-04-21 [1] CRAN (R 3.6.0)
 mime             0.6     2018-10-05 [1] CRAN (R 3.6.0)
 munsell          0.5.0   2018-06-12 [1] CRAN (R 3.6.0)
 nlme             3.1-139 2019-04-09 [2] CRAN (R 3.6.0)
 pdftools       * 2.2     2019-03-10 [1] CRAN (R 3.6.0)
 pillar           1.3.1   2018-12-15 [1] CRAN (R 3.6.0)
 pkgbuild         1.0.3   2019-03-20 [1] CRAN (R 3.6.0)
 pkgconfig        2.0.2   2018-08-16 [1] CRAN (R 3.6.0)
 pkgload          1.0.2   2018-10-29 [1] CRAN (R 3.6.0)
 plyr             1.8.4   2016-06-08 [1] CRAN (R 3.6.0)
 prettyunits      1.0.2   2015-07-13 [1] CRAN (R 3.6.0)
 processx         3.3.0   2019-03-10 [1] CRAN (R 3.6.0)
 promises         1.0.1   2018-04-13 [1] CRAN (R 3.6.0)
 ps               1.3.0   2018-12-21 [1] CRAN (R 3.6.0)
 purrr            0.3.2   2019-03-15 [1] CRAN (R 3.6.0)
 qpdf             1.1     2019-03-07 [1] CRAN (R 3.6.0)
 R6               2.4.0   2019-02-14 [1] CRAN (R 3.6.0)
 Rcpp             1.0.1   2019-03-17 [1] CRAN (R 3.6.0)
 readr          * 1.3.1   2018-12-21 [1] CRAN (R 3.6.0)
 remotes          2.0.4   2019-04-10 [1] CRAN (R 3.6.0)
 rlang            0.3.4   2019-04-07 [1] CRAN (R 3.6.0)
 rmarkdown        1.12    2019-03-14 [1] CRAN (R 3.6.0)
 rprojroot        1.3-2   2018-01-03 [1] CRAN (R 3.6.0)
 rstudioapi       0.10    2019-03-19 [1] CRAN (R 3.6.0)
 scales           1.0.0   2018-08-09 [1] CRAN (R 3.6.0)
 sessioninfo      1.1.1   2018-11-05 [1] CRAN (R 3.6.0)
 shiny            1.3.2   2019-04-22 [1] CRAN (R 3.6.0)
 SnowballC        0.6.0   2019-01-15 [1] CRAN (R 3.6.0)
 stringi          1.4.3   2019-03-12 [1] CRAN (R 3.6.0)
 stringr        * 1.4.0   2019-02-10 [1] CRAN (R 3.6.0)
 sylly          * 0.1-5   2018-07-29 [1] CRAN (R 3.6.0)
 sylly.en         0.1-3   2018-03-19 [1] CRAN (R 3.6.0)
 textstem       * 0.1.4   2018-04-09 [1] CRAN (R 3.6.0)
 tibble           2.1.1   2019-03-16 [1] CRAN (R 3.6.0)
 tidyr          * 0.8.3   2019-03-01 [1] CRAN (R 3.6.0)
 tidyselect       0.2.5   2018-10-11 [1] CRAN (R 3.6.0)
 tidytext       * 0.2.0   2018-10-17 [1] CRAN (R 3.6.0)
 tokenizers       0.2.1   2018-03-29 [1] CRAN (R 3.6.0)
 usethis          1.5.0   2019-04-07 [1] CRAN (R 3.6.0)
 withr            2.1.2   2018-03-15 [1] CRAN (R 3.6.0)
 xfun             0.6     2019-04-02 [1] CRAN (R 3.6.0)
 xtable           1.8-4   2019-04-21 [1] CRAN (R 3.6.0)
 yaml             2.2.0   2018-07-25 [1] CRAN (R 3.6.0)

[1] /home/abn/R/x86_64-pc-linux-gnu-library/3.6
[2] /usr/lib/R/library

LS0tCnRpdGxlOiAiQW50aWJpb3RpY3MgYW5kIGZvb2QgaW4gdGhlIEFtZXJpY2FuIHByZXNzOiBBIHRleHQgbWluaW5nIHN0dWR5LiIKYXV0aG9yOiAiYW50b2luZS5icmlkaWVyLW5haG1pYXNAaW5zZXJtLmZyIgpvdXRwdXQ6CiAgaHRtbF9ub3RlYm9vazogCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogZmFsc2UKICAgIHRvY19kZXB0aDogMwogICAgdGhlbWU6ICJmbGF0bHkiCiAgICBoaWdobGlnaHQ6ICJweWdtZW50cyIKLS0tCgoqQW50aWJpb3RpY3MgYW5kIGZvb2QgaW4gdGhlIEFtZXJpY2FuIHByZXNzOiBBIHRleHQgbWluaW5nIHN0dWR5LiogIAo8c21hbGw+QW50b2luZSBCcmlkaWVyLU5haG1pYXMkXGRhZ2dlciQsIEVzdGVyYSBCYWRhdSRcZGFnZ2VyJCwgUGkgTnl2YWxsIENvbGxlbgosQW50b2luZSBBbmRyZW1vbnQsIEpvY2VseW5lIEFycXVlbWJvdXJnPC9zbWFsbD4KCgo8c21hbGw+JFxkYWdnZXIkOiBUaGVzZSBhdXRob3JzIGNvbnRyaWJ1dGVkIGVxdWFsbHkgdG8gdGhpcyB3b3JrPC9zbWFsbD4KCiMgQ29ycHVzIGNvbnN0aXR1dGlvbgpUaGUgYXJ0aWNsZXMgaGF2ZSBiZWVuIHNlYXJjaGVkIHVwb24gdGhlIEZhY3RpdmEgZGF0YWJhc2UsIGJhc2VkIG9uIGtleSB3b3JkcyAKYW5kIGV4cHJlc3Npb25zIHVzZWQgaW4gY29uanVuY3Rpb24uIFRlcm1zIGFuZCBleHByZXNzaW9ucyByZXNlYXJjaGVkIHdlcmUgdGhlIApmb2xsb3dpbmc6IApgYGAKYW50aWJpb3RpYyByZXNpc3RhbmNlLCBhbnRpbWljcm9iaWFsIHJlc2lzdGFuY2UsIAphbnRpYmlvdGljIGZyZWUgb3IgYW50aWJpb3RpYy1mcmVlLCBhbnRpYmlvdGljcyBhbmQgZm9vZCwgCmFudGliaW90aWNzIGFuZCBmYXJtaW5nLCBhbnRpYmlvdGljcyBhbmQgcmVzaXN0YW50LCBhbnRpYmlvdGljcyBhbmQgc2FsbW9uZWxsYSwgCnNhbG1vbmVsbGEgYW5kIHJlc2lzdGFudCwgc2FsbW9uZWxsYSBhbmQgb3V0YnJlYWssIAphbnRpYmlvdGljcyBhbmQgY2FtcHlsb2JhY3RlciBhbmQgcmVzaXN0YW50LCBhbnRpYmlvdGljcyBhbmQgcm91dGluZSwgCmFudGliaW90aWNzIGFuZCByb3V0aW5lbHksIGFudGliaW90aWNzIGFuZCBPbmUgSGVhbHRoOwooYW50aWJpbyogbmVhcjMgZm9vZCkgb3IgKGFudGliaW8qIG5lYXIzIGZhcm0qKSBvciAoYW50aWJpbyogbmVhcjMgc2FsbW9uZWxsKikgCm9yIChhbnRpYmlvKiBuZWFyMyBjYW1weWxvYmFjdGVyKikgb3IgKGFudGliaW8qIG5lYXIzIGFuaW1hbCopIG9yIAooYW50aWJpbyogbmVhcjMgZmVlZCkKYGBgCgojIERhdGEgbG9hZGluZwpUaGUgY29ycHVzIGlzIGNvbnNpdHV0ZWQgYnkgYXJ0aWNsZXMgc2F2ZWQgaW4gaW5kZXBlbmRlbnQgcGRmIGZpbGVzLgpgYGB7ciBjb3JwdXNfbG9hZGluZ30KIyBsaXN0IHBkZiBmaWxlcwpwZGZfbGlzdCA8LQogIGxpc3QuZmlsZXMocGF0aCA9ICIuLi9kYXRhL2NvcnB1cy8iLCBwYXR0ZXJuID0gIl4uKnBkZiQiLCBmdWxsLm5hbWVzID0gVFJVRSwgcmVjdXJzaXZlID0gVFJVRSkKCiMgc2NyYXAgdGhlaXIgdGV4dCBjb250ZW50CnBkZl90eHQgPC0KICBsYXBwbHkoWCA9IHBkZl9saXN0LCBGVU4gPSBmdW5jdGlvbih4KSBwYXN0ZTAocGRmX3RleHQoeCksIGNvbGxhcHNlID0gIlxuIiApKQoKIyBzcGxpdCB0aGVtIG92ZXIgZWFjaCBuZXdsaW5lCnBkZl9zcGxpdCA8LQogIHNhcHBseShYID0gcGRmX3R4dCwgZnVuY3Rpb24oeCkgc3RyX3NwbGl0KHN0cmluZyA9IHVubGlzdCh4KSwgcGF0dGVybiA9ICJcbiIpKQoKIyBlbGltaW5hdGluZyBsZWFkaW5nIHNwYWNlcyBpbiBlYWNoIGxpbmUKcGRmX3NwbGl0X3N0cnAgPC0KICBsYXBwbHkoWCA9IHBkZl9zcGxpdCwgZnVuY3Rpb24oeCkgc3RyX3JlcGxhY2Uoc3RyaW5nID0geCwgcGF0dGVybiA9ICJeW1s6c3BhY2U6XV0rIiwgcmVwbGFjZW1lbnQgPSAiIikpCmBgYAoKIyBEYXRhIFByb2Nlc3NpbmcKCiMjIEluZm9ybWF0aW9uIHNjcmFwcGluZyBhbmQgY2xlYW5pbmcKYGBge3IgcGFyc2luZ19pbmZvfQojIFRoaXMgZnVuY3Rpb24gd2lsbCB0YWtlIGNhcmUgb2YgdGhlIHBhcnNpbmcKZ29nb19nYWRnZXRvX2dldF9pbmZvIDwtIGZ1bmN0aW9uKHRleHRfdmVjdG9yKXsKICAjIEhEIGlzIHRoZSB0aXRsZSB0YWcKICB0aXRsZSA8LSBnc3ViKHBhdHRlcm4gPSAiSEQoLiopIiwgcmVwbGFjZW1lbnQgPSAiXFwxIiwKICAgICAgICAgICAgICAgIHggPSBncmVwKHBhdHRlcm4gPSAiXkhELioiLCB4ID0gdGV4dF92ZWN0b3IsIHZhbHVlID0gVFJVRSkpCiAgdGl0bGUgPC0gc3RyX3JlbW92ZV9hbGwoc3RyaW5nID0gdGl0bGUsIHBhdHRlcm4gPSAiXiAqIikKICAjIEJZIGlzIHRoZSBhdXRob3IgdGFnCiAgYXV0aG9yIDwtIGdzdWIocGF0dGVybiA9ICIoPzpCWXxCeSkoLiopIiwgcmVwbGFjZW1lbnQgPSAiXFwxIiwKICAgICAgICAgICAgICAgICB4ID0gZ3JlcChwYXR0ZXJuID0gIl4oPzpCWXxCeSkuKiIsIHggPSB0ZXh0X3ZlY3RvciwgdmFsdWUgPSBUUlVFKSkKICBhdXRob3IgPC0gaWZlbHNlKHRlc3QgPSBsZW5ndGgoYXV0aG9yKSA9PSAwLCB5ZXMgPSAiIiwgbm8gPSBhdXRob3IpCiAgCiAgIyBTTiBpcyB0aGUgam91cm5hbCB0YWcKICBqb3VybmFsIDwtIGdzdWIocGF0dGVybiA9ICJTTiguKikiLCByZXBsYWNlbWVudCA9ICJcXDEiLAogICAgICAgICAgICAgICAgICB4ID0gZ3JlcChwYXR0ZXJuID0gIl5TTi4qIiwgeCA9IHRleHRfdmVjdG9yLCB2YWx1ZSA9IFRSVUUpKQogIGpvdXJuYWwgPC0gaWZlbHNlKHRlc3QgPSBsZW5ndGgoam91cm5hbCkgPT0gMCwgeWVzID0gIiIsIG5vID0gam91cm5hbCkKICBqb3VybmFsIDwtIHN0cl9yZXBsYWNlKGpvdXJuYWwsICJeICsiLCAiIikKICAKICAjIFBEIGlzIHRoZSBwdWJsaWNhdGlvbiBkYXRlIHRhZwogIHB1Yl9kYXRlIDwtIGdzdWIocGF0dGVybiA9ICJQRCguKikiLCByZXBsYWNlbWVudCA9ICJcXDEiLAogICAgICAgICAgICAgICAgICAgeCA9IGdyZXAocGF0dGVybiA9ICJeUEQuKiIsIHggPSB0ZXh0X3ZlY3RvciwgdmFsdWUgPSBUUlVFKSkKICBwdWJfZGF0ZSA8LSBpZmVsc2UodGVzdCA9IGxlbmd0aChwdWJfZGF0ZSkgPT0gMCwgeWVzID0gIiIsIG5vID0gcHViX2RhdGUpCiAgcHViX2RhdGUgPC0gZ3N1YihwYXR0ZXJuID0gImFvdCIsIHJlcGxhY2VtZW50ID0gImF1Z3VzdCIsIHggPSBwdWJfZGF0ZSkKICBwdWJfZGF0ZSA8LSBkbXkocHViX2RhdGUpCiAgCiAgIyBvdXRwdXQgaXMgYSB0aWJibGUgd2l0aCBhbGwgdGhlIGluZm9ybWF0aW9ucwogIGFydGljbGVfaW5mbyA8LSB0aWJibGUodGl0bGUgPSB0aXRsZSwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICBhdXRob3IgPSBhdXRob3IsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgam91cm5hbCA9IGpvdXJuYWwsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgcHViX2RhdGUgPSBwdWJfZGF0ZSkKICByZXR1cm4oYXJ0aWNsZV9pbmZvKQp9CgojIGV4dHJhY3QgaW5mb3JtYXRpb25zIG9mIGVhY2ggYXJ0aWNsZSB3LyBnb2dvX2dhZGdldG9fZ2V0X2luZm8KcGRmX2luZm8gPC0KICBsYXBwbHkoWCA9IHBkZl9zcGxpdF9zdHJwLCBGVU4gPSBnb2dvX2dhZGdldG9fZ2V0X2luZm8pCmBgYAoKV2Ugd2lsbCBub3cgZnVzZSB0aGUgYXJ0aWNsZXMgYW5kIHRoZWlyIHJlc3BlY3RpdmUgaW5mb3JtYXRpb25zIGluIGEgZGF0YWZyYW1lLCAKYW5kIHRoZW4gd2Ugd2lsbCByZW1vdmUgdGhlIGhlYWRlcnMgYW5kIGZvb3RlcnMuClRoaXMgb3BlcmF0aW9uIGlzIG5vaXN5IGJlY2F1c2Ugb2YgdGhlIGluY29uc2lzdGVuY3kgaW4gdGhlIGZvb3RlciBmb3JtYXR0aW5nLgpgYGB7ciBhZGRpbmdfaW5mb30KIyBtYWtpbmcgYSBkYXRhLmZyYW1lIHdpdGggdGhlIGluZm8gYW5kIHRoZSB0ZXh0CnBkZl90eHRfaW5mbyA8LSBsaXN0KCkKZm9yIChpIGluIDE6bGVuZ3RoKHBkZl9zcGxpdF9zdHJwKSkgewogIHBkZl90eHRfaW5mb1tbaV1dIDwtIAogICAgY2JpbmQuZGF0YS5mcmFtZShwZGZfaW5mb1tbaV1dLCAKICAgICAgICAgICAgICAgICAgICAgdGV4dCA9IGFzLmNoYXJhY3RlcihwZGZfc3BsaXRfc3RycFtbaV1dKSwgCiAgICAgICAgICAgICAgICAgICAgIHN0cmluZ3NBc0ZhY3RvcnMgPSBGQUxTRSkKfQoKIyBSZW1vdmluZyBoZWFkZXIgYW5kIGZvb3RlciBpbiBlYWNoIGRhdGFmcmFtZQojIFRoZSBmb290ZXIgaXMgaW5jb25zaXN0ZW50IGFjcm9zcyBhcnRpY2xlIGFuZCAKIyBtYW55IGRpZmZlcmVudCBsaW5lcyBhcmUgbmVlZGVkIHRvIHB1cmdlIGl0IG91dAojIGNoZWNrIGZvciBhIHN0cmluZyA6IHN1bSh1bmxpc3QobGFwcGx5KHBkZl90eHRfaW5mbywgZnVuY3Rpb24oeCkgc3RyX2RldGVjdChzdHJpbmcgPSB4JHRleHQsIHBhdHRlcm4gPSAiXkxQIikpKSkKYmVoZWFkX2FuZF9iZWZvb3QgPC0gZnVuY3Rpb24oZGZfaW4pewogIGRmX291dCA8LQogICAgZGZfaW4gJT4lCiAgICBmaWx0ZXIoY3Vtc3VtKHN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeTFAiKSkgPj0gMSkgJT4lCiAgICBmaWx0ZXIoY3Vtc3VtKHN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeTlMiKSApIDwgMSkgJT4lCiAgICBmaWx0ZXIoY3Vtc3VtKHN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeSWxsdXN0cmF0aW9uczoiKSApIDwgMSkgJT4lCiAgICBmaWx0ZXIoY3Vtc3VtKHN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeQVJUIikgKSA8IDEpICU+JQogICAgZmlsdGVyKGN1bXN1bShzdHJfZGV0ZWN0KHRleHQsIHBhdHRlcm4gPSAiXkNUIikgKSA8IDEpICU+JQogICAgZmlsdGVyKGN1bXN1bShzdHJfZGV0ZWN0KHRleHQsIHBhdHRlcm4gPSAiXklQRCIpICkgPCAxKSAlPiUKICAgIGZpbHRlcihjdW1zdW0oc3RyX2RldGVjdCh0ZXh0LCBwYXR0ZXJuID0gIl4uKlxcfC4qXFx8LioiKSkgPCAxKSAlPiUKICAgIGZpbHRlcihjdW1zdW0oc3RyX2RldGVjdCh0ZXh0LCBwYXR0ZXJuID0gIl5BTiAiKSkgPCAxKSAlPiUgCiAgICBmaWx0ZXIoY3Vtc3VtKHN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeUkYgIikpIDwgMSkgJT4lIAogICAgZmlsdGVyKGN1bXN1bShzdHJfZGV0ZWN0KHRleHQsIHBhdHRlcm4gPSAiXkNPICIpKSA8IDEpICU+JQogICAgZmlsdGVyKCFzdHJfZGV0ZWN0KHRleHQsIHBhdHRlcm4gPSAiRmFjdGl2YSIpKSAlPiUKICAgIGZpbHRlcighc3RyX2RldGVjdCh0ZXh0LCBwYXR0ZXJuID0gIl5URCQiKSkgJT4lCiAgICBmaWx0ZXIoIXN0cl9kZXRlY3QodGV4dCwgcGF0dGVybiA9ICJeTFAkIikpICU+JQogICAgZmlsdGVyKCFzdHJfZGV0ZWN0KHRleHQsIHBhdHRlcm4gPSAiXiQiKSkgJT4lIAogICAgaWRlbnRpdHkoKQogIHJldHVybihkZl9vdXQpCn0KCnR4dF9jbGVhbiA8LQogIGxhcHBseShYID0gcGRmX3R4dF9pbmZvLCAKICAgICAgICAgRlVOID0gYmVoZWFkX2FuZF9iZWZvb3QpCmBgYAoKV2UgYXJlIHJlYWR5IHRvIHVuaXRlIGV2ZXJ5dGhpbmcgaW4gb25lIGRhdGEuZnJhbWUsIGJlZm9yZWhhbmQgd2UnbGwganVzdCBhZGQgYSAKdW5pcXVlIGlkIGZvciBlYWNoIGFydGljbGUuCmBgYHtyIHVuaXRlfQojIGJlZm9yZSB1bml0aW5nIHRoZW0sIGVhY2ggYXJ0aWNsZSBuZWVkcyB0byByZWNlaXZlIGEgdW5pcXVlIElECmZvciAoaSBpbiAxOmxlbmd0aCh0eHRfY2xlYW4pKSB7CiAgdHh0X2NsZWFuW1tpXV0gPC0gY2JpbmQuZGF0YS5mcmFtZSh0eHRfY2xlYW5bW2ldXSwgaWQgPSBpKQogIHR4dF9jbGVhbltbaV1dJHRleHRbMV0gPC0gcGFzdGUodHh0X2NsZWFuW1tpXV0kdGl0bGVbMV0sIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgdHh0X2NsZWFuW1tpXV0kdGV4dFsxXSwgCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBzZXAgPSAiICIpCn0KCiMgdW5pdGluZyBldmVyeXRoaW5nIGludG8gYSBiaWcgZGF0YWZyYW1lCmNvcnB1c190eHQgPC0KICBkby5jYWxsKHJiaW5kLCB0eHRfY2xlYW4pCgpgYGAKClRoZSB0b2tlbnphdGlvbiBjYW4gbm93IHRha2UgcGxhY2UuIFdlIGNhbiB1c2UgbXVsdGlwbGUgbmdyYW1zIHNpemUsIHdlIHdpbGwgCnN0YXJ0IHdpdGggMWdyYW1zIGZpcnN0ICppLmUqOiB3b3Jkcy4gIApgYGB7ciAxX2dyYW1zfQpjb3JwdXNfMV9ncmFtc191bmZpbHRlcmVkIDwtIAogIHVubmVzdF90b2tlbnModGJsID0gY29ycHVzX3R4dCwgCiAgICAgICAgICAgICAgICBvdXRwdXQgPSAid29yZCIsIAogICAgICAgICAgICAgICAgaW5wdXQgPSAidGV4dCIsIAogICAgICAgICAgICAgICAgdG9rZW4gPSAibmdyYW1zIiwgCiAgICAgICAgICAgICAgICBuID0gMSkKYGBgCgojIENvdW50aW5nIGFuZCBtb3JlCkxldCdzIGZpcnN0IGV4dHJhY3Qgc29tZSBmaWd1cmVzIGFib3V0IHRoZSB3aG9sZSBjb3JwdXMKYGBge3IgZ2xvYmFsX2ZpZ3VyZXMsIHJlc3VsdHMgPSBGQUxTRX0KYXJ0aWNsYSA8LQogIGxlbmd0aCh1bmlxdWUoY29ycHVzXzFfZ3JhbXNfdW5maWx0ZXJlZCRpZCkpCgphcnRpY2xhX2J5X2pvdXJuYWwgPC0KICBjb3JwdXNfMV9ncmFtc191bmZpbHRlcmVkICU+JQogIGdyb3VwX2J5KGpvdXJuYWwpICU+JQogIHN1bW1hcml6ZShuID0gbl9kaXN0aW5jdChpZCkpCgp3b3JkYSA8LSAKICBmb3JtYXQobnJvdyhjb3JwdXNfMV9ncmFtc191bmZpbHRlcmVkKSwgYmlnLm1hcmsgPSAiLCIpCgp3b3JkYV91bmlxIDwtCiAgZm9ybWF0KGxlbmd0aCh1bmlxdWUoY29ycHVzXzFfZ3JhbXNfdW5maWx0ZXJlZCR3b3JkKSksIGJpZy5tYXJrID0gIiwiKQoKd29yZGFfYnlfam91cm5hbCA8LQogIGNvcnB1c18xX2dyYW1zX3VuZmlsdGVyZWQgJT4lCiAgZ3JvdXBfYnkoam91cm5hbCkgJT4lIGNvdW50KCkKCndvcmRhX3VuaXFfYnlfam91cm5hbCA8LQogIGNvcnB1c18xX2dyYW1zX3VuZmlsdGVyZWQgJT4lCiAgZ3JvdXBfYnkoam91cm5hbCkgJT4lCiAgc3VtbWFyaXplKG4gPSBuX2Rpc3RpbmN0KHdvcmQpKQoKIyBhcnRpY2xhO2FydGljbGFfYnlfam91cm5hbDt3b3JkYTt3b3JkYV91bmlxOyB3b3JkYV9ieV9qb3VybmFsO3dvcmRhX3VuaXFfYnlfam91cm5hbApgYGAKCi0gVGhlIHRvdGFsIG51bWJlciBvZiBhcnRpY2xlczoKLSBvdmVyYWxsOiBgciBhcnRpY2xhYAotIGJ5IGpvdXJuYWw6IGByIGFydGljbGFfYnlfam91cm5hbGAKCi0gVGhlIHRvdGFsIG51bWJlciBvZiB3b3JkcyBpbiB0aGUgY29ycHVzCi0gb3ZlcmFsbDogYHIgd29yZGFgCi0gYnkgam91cm5hbDogYHIgd29yZGFfYnlfam91cm5hbGAKCi0gVGhlIHRvdGFsIG51bWJlciBvZiBkaXN0aW5jdCB3b3JkcyBpbiB0aGUgY29ycHVzCi0gb3ZlcmFsbDogYHIgd29yZGFfdW5pcWAKLSBieSBqb3VybmFsOiBgciB3b3JkYV91bmlxX2J5X2pvdXJuYWxgCgojIyBQdWJsaWNhdGlvbiBjaHJvbm9sb2d5CmBgYHtyIHB1Yl9jaHJvbm8sIGZpZy5oZWlnaHQ9OCwgZmlnLndpZHRoPTE1LCBmaWcuYXNwPTAuNX0KdGltZWxpbmVfZXZlbnRzIDwtIHJlYWRfZGVsaW0oIi4uL2RhdGEvdGltZWxpbmVfZXZlbnRzLnRzdiIsIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAiXHQiLCBlc2NhcGVfZG91YmxlID0gRkFMU0UsIHRyaW1fd3MgPSBUUlVFLCBjb21tZW50ID0gIiMiKQoKdGltZWxpbmVfZXZlbnRzIDwtCiAgdGltZWxpbmVfZXZlbnRzICU+JQogIG11dGF0ZShldmVudF9sYWJlbCA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBldmVudF9sYWJlbCwgcGF0dGVybiA9ICJYWFgiLCByZXBsYWNlbWVudCA9ICJcbiIpKSAlPiUKICBtdXRhdGUoZGF0ZSA9IHltZChkYXRlKSkgJT4lCiAgbXV0YXRlKGRhdGVfbGFiID0gcGFzdGUobW9udGgoZGF0ZSwgbGFiZWwgPSBUUlVFLCBhYmJyID0gVFJVRSwgbG9jYWxlID0gImVuX1VTLnV0ZjgiKSwgeWVhcihkYXRlKSkpICU+JQogIG11dGF0ZShldmVudF9sYWJlbCA9IHBhc3RlMChldmVudF9sYWJlbCwiXG4iLCBkYXRlX2xhYikpICU+JSAKICBtdXRhdGUoeXBvcyA9IDAuMSwgeXBvcyA9IHlwb3MgKiBjKDEsIC0xKSkgJT4lICAjIGluIG9yZGVyIHRvIGFwcGVhciBhYm92ZSBvciB1bmRlciB0aGUgdGltZWxpbmUKICBtdXRhdGUoeWRhdGUgPSB5cG9zKjAuNSkKCmFydGljbGVfaGlzdF9kb2RnZSA8LQogIGNvcnB1c18xX2dyYW1zX3VuZmlsdGVyZWQgJT4lCiAgdW5ncm91cCgpICU+JQogIHNlbGVjdChpZCwgcHViX2RhdGUsIGpvdXJuYWwpICU+JQogIGdyb3VwX2J5KGlkKSAlPiUKICBzbGljZSgxKSAlPiUKICBtdXRhdGUoeWVhciA9IHltZChwYXN0ZTAoeWVhcihwdWJfZGF0ZSksIjAxIiwiMDEiKSkpICU+JQogIGdyb3VwX2J5KHllYXIsIGpvdXJuYWwpICU+JQogIG11dGF0ZShjb3VudCA9IG4oKSkgJT4lCiAgc2xpY2UoMSkKCmhpc3RvIDwtCiAgZ2dwbG90KGRhdGEgPSBhcnRpY2xlX2hpc3RfZG9kZ2UpICsKICBnZW9tX2NvbChtYXBwaW5nID0gYWVzKHggPSB5ZWFyLCB5ID0gY291bnQsIGZpbGwgPSBqb3VybmFsKSwgCiAgICAgICAgICAgcG9zaXRpb24gPSAiZG9kZ2UiLCBhbHBoYSA9IDAuOCwgY29sb3VyID0gImJsYWNrIikgKwogIHNjYWxlX2NvbG9yX21hbnVhbCh2YWx1ZXMgPSBjKGFscGhhKCJibGFjayIsIDAuMSksIGFscGhhKCJibGFjayIsIDAuMSkpKSArCiAgc2NhbGVfZmlsbF9tYW51YWwodmFsdWVzID0gYygic3RlZWxibHVlIiwgInZpb2xldHJlZDMiKSkgKwogIHNjYWxlX3hfZGF0ZShicmVha3MgPSBzZXEoZnJvbSA9IHltZCgiMTk4MC8wMS8wMSIpLCB0byA9IHltZCgiMjAxNS8wMS8wMSIpLCBieSA9ICI1IHllYXJzIiksCiAgICAgICAgICAgICAgIGRhdGVfbGFiZWxzID0gIiVZIiwKICAgICAgICAgICAgICAgbWlub3JfYnJlYWtzID0gd2FpdmVyKCksCiAgICAgICAgICAgICAgIGRhdGVfbWlub3JfYnJlYWtzID0gIjEgeWVhcnMiLAogICAgICAgICAgICAgICBsaW1pdHMgPSBjKHltZCgiMTk3OS8wMS8wMSIpLHltZCgiMjAxNy8wMS8wMSIpKSkgKyAKICBiYWNrZ3JvdW5kX2dyaWQobWFqb3IgPSAieHkiLCAKICAgICAgICAgICAgICAgICAgbWlub3IgPSAieHkiLCAKICAgICAgICAgICAgICAgICAgY29sb3VyLm1ham9yID0gcmdiKHJlZCA9IDAuNSxncmVlbiA9IDAuNSxibHVlID0gMC41LCBhbHBoYSA9IDAuNSksCiAgICAgICAgICAgICAgICAgIGNvbG91ci5taW5vciA9IHJnYihyZWQgPSAwLjUsZ3JlZW4gPSAwLjUsYmx1ZSA9IDAuNSwgYWxwaGEgPSAwLjEpKSArCiAgdGhlbWUobGVnZW5kLnBvc2l0aW9uID0gInRvcCIsCiAgICAgICAgbGVnZW5kLmRpcmVjdGlvbiA9ICJob3Jpem9udGFsIikKaGlzdG8KCnRpbWVsaW5lIDwtIAogIGdncGxvdChkYXRhID0gdGltZWxpbmVfZXZlbnRzKSArCiAgZ2VvbV9wb2ludChtYXBwaW5nID0gYWVzKHggPSBkYXRlLCB5ID0geXBvcykpICsKICBnZW9tX3NlZ21lbnQobWFwcGluZyA9IGFlcyh4ZW5kID0gZGF0ZSwgeCA9IGRhdGUsIHkgPSB5cG9zLCB5ZW5kID0gMCkpICsKICBnZW9tX2hsaW5lKHlpbnRlcmNlcHQgPSAwLCBjb2xvciA9ICJibGFjayIsIHNpemUgPSAwLjMpICsgIyB0aW1lbGluZSBpdHNlbGYKICBnZ3JlcGVsOjpnZW9tX2xhYmVsX3JlcGVsKG1hcHBpbmcgPSBhZXMoeCA9IGRhdGUsIHkgPSB5cG9zLCBsYWJlbCA9IGV2ZW50X2xhYmVsKSwgaW5oZXJpdC5hZXMgPSBGQUxTRSkgKwogICMgZ2dyZXBlbDo6Z2VvbV9sYWJlbF9yZXBlbChtYXBwaW5nID0gYWVzKHggPSBkYXRlLCB5ID0geWRhdGUsIGxhYmVsID0gZGF0ZV9sYWIsIGFuZ2xlID0gMjUpLCBwb2ludC5wYWRkaW5nID0gMCwgaW5oZXJpdC5hZXMgPSBGQUxTRSkgKwogIHNjYWxlX3hfZGF0ZShicmVha3MgPSBzZXEoZnJvbSA9IHltZCgiMTk4MC8wMS8wMSIpLCB0byA9IHltZCgiMjAxNS8wMS8wMSIpLCBieSA9ICI1IHllYXJzIiksCiAgICAgICAgICAgICAgIGRhdGVfbGFiZWxzID0gIiVZIiwKICAgICAgICAgICAgICAgbWlub3JfYnJlYWtzID0gd2FpdmVyKCksCiAgICAgICAgICAgICAgIGRhdGVfbWlub3JfYnJlYWtzID0gIjEgeWVhcnMiLAogICAgICAgICAgICAgICBsaW1pdHMgPSBjKHltZCgiMTk3OS8wMS8wMSIpLHltZCgiMjAxNy8wMS8wMSIpKSkgKyAKICB0aGVtZShheGlzLmxpbmUueSA9IGVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRleHQueSA9IGVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRpdGxlLnggPSBlbGVtZW50X2JsYW5rKCksCiAgICAgICAgYXhpcy50aXRsZS55ID0gZWxlbWVudF9ibGFuaygpLAogICAgICAgIGF4aXMudGlja3MueSA9IGVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfYmxhbmsoKSwKICAgICAgICBheGlzLnRpY2tzLnggPSBlbGVtZW50X2JsYW5rKCksCiAgICAgICAgYXhpcy5saW5lLnggPSBlbGVtZW50X2JsYW5rKCkKICAgICAgICAgICkKdGltZWxpbmUKCmBgYAoKIyMgQ291bnRzIGFuZCBURi1JREYKV2Ugd2lsbCBjb21wdXRlIHRoZSBmb2xsb3dpbmc6CgotICpjb3JwdXNfbGVuZ3RoKjogdGhlIHRvdGFsIG51bWJlciBvZiBkb2N1bWVudHMgaW4gdGhlIGNvcnB1cwotICphcnRpY2xlX2xlbmd0aCo6IHRoZSB0b3RhbCBudW1iZXIgb2Ygd29yZHMgaW4gZWFjaCBhcnRpY2xlCi0gKm5fYXJ0aWNsZSo6IHRoZSBjb3VudCBvZiBlYWNoIHdvcmQgaW4gZWFjaCBhcnRpY2xlCi0gKndvcmRfaW5fbio6IGZvciBlYWNoIHdvcmQsIGhvdyBtYW55IGFydGljbGVzIGNvbnRhaW4gaXQKLSAqbl90b3QqOiB0b3RhbCBjb3VudCBvZiBlYWNoIHdvcmQKLSAqbl9qb3VybmFsKjogdG90YWwgY291bnQgb2YgZWFjaCB3b3JkIGJ5IGpvdXJuYWwKYGBge3IgdGZpZGZfYnlfYXJ0aWNsZX0Kc3VwcHJlc3NNZXNzYWdlcygKICBteV9zdG9wX3dvcmRzIDwtCiAgICByZWFkX3RhYmxlKAogICAgICBmaWxlID0gIi4uL2RhdGEvbXlfc3RvcF93b3Jkcy50eHQiLAogICAgICBjb2xfbmFtZXMgPSAic3RvcF93b3JkIgogICAgKQopCmNvcnB1c190ZmlkZl9mdWxsIDwtCiAgY29ycHVzXzFfZ3JhbXNfdW5maWx0ZXJlZCAlPiUKICAjIGZpbHRlcihpZCAlaW4lIGMoMzA6MTAwLDQwMDo1MDApICkgJT4lCiAgIyBmaWx0ZXIoaWQgJWluJSBjKDUxNykgKSAlPiUKICAKICAjIGNsZWFuIGRhdGFzZXQKICBtdXRhdGUod29yZCA9IHN0cl90b19sb3dlcihzdHJpbmcgPSB3b3JkKSkgJT4lIAogIG11dGF0ZSh3b3JkID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IHdvcmQsIHBhdHRlcm4gPSAiKFtbOmFscGhhOl1dKilcXC4oW1s6YWxwaGE6XV0qKSIsIHJlcGxhY2VtZW50ID0gIlxcMVxcMiIpKSAlPiUKICBtdXRhdGUod29yZCA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSB3b3JkLCBwYXR0ZXJuID0gIidzJCIsIHJlcGxhY2VtZW50ID0gIiIpKSAlPiUKICAjIG11dGF0ZSh3b3JkID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IHdvcmQsIHBhdHRlcm4gPSAiW15hLXpdIiwgcmVwbGFjZW1lbnQgPSAiIikpICU+JQogIGZpbHRlcighKHN0cl9kZXRlY3Qoc3RyaW5nID0gd29yZCwgcGF0dGVybiA9ICJ3YXNocG9zdGNvbSIpKSkgJT4lICMgVG9rZW5pemF0aW9uIHNwbGl0cyBvbiBAICEhISEhISEKICBmaWx0ZXIod29yZCAhPSAiIikgJT4lIAogIGZpbHRlcihuY2hhcih3b3JkKSA+IDEpICU+JSAKICBmaWx0ZXIoIXN0cl9kZXRlY3Qoc3RyaW5nID0gd29yZCwgcGF0dGVybiA9ICJeWzAtOV18W1s6cHVuY3Q6XV0rJCIpKSAlPiUKICAKICAjIGxlbW1hdGl6YXRpb24gKGJldHRlciB0aGFuIHN0ZW1taW5nKSBhbmQgbGFzdCBmaWx0ZXJpbmcKICBtdXRhdGUoc3RlbSA9IHN0ZW1fd29yZHMod29yZCkpICU+JQogIGZpbHRlcighd29yZCAlaW4lIG15X3N0b3Bfd29yZHMkc3RvcF93b3JkKSAlPiUgCiAgCiAgIyB0b3RhbCBudW1iZXIgb2YgYXJ0aWNsZXMKICBtdXRhdGUoY29ycHVzX2xlbmd0aCA9IGxlbmd0aCh1bmlxdWUoaWQpICkpICU+JSAgCiAgCiAgIyB0b3RhbCB3b3JkIGluIGFydGljbGUKICBncm91cF9ieShpZCkgJT4lCiAgbXV0YXRlKGFydGljbGVfbGVuZ3RoID0gbigpKSAlPiUKICAKICAjIGNvdW50IG9mIGVhY2ggd29yZCBieSBhcnRpY2xlCiAgZ3JvdXBfYnkoaWQsIHN0ZW0pICU+JSAKICBtdXRhdGUobl9hcnRpY2xlID0gbigpKSAlPiUgCiAgCiAgIyB3b3JkIGNvdW50CiAgZ3JvdXBfYnkoc3RlbSkgJT4lIAogIG11dGF0ZShuX3RvdGFsID0gbigpKSAlPiUgCiAgZ3JvdXBfYnkoc3RlbSwgam91cm5hbCkgJT4lIAogIG11dGF0ZShuX2pvdXJuYWwgPSBuKCkpICU+JSAKICB1bmdyb3VwKCkgJT4lCiAgIyBjb21wdXRlIHRmLWlkZgogIAogIG11dGF0ZSh0ZiA9IG5fYXJ0aWNsZSAvIGFydGljbGVfbGVuZ3RoKSAlPiUgIyB0ZXh0IGZyZXF1ZW5jeQogIGdyb3VwX2J5KHN0ZW0pICU+JSAKICBtdXRhdGUod29yZF9pbl9uID0gbGVuZ3RoKHVuaXF1ZShpZCkpKSAlPiUgCiAgbXV0YXRlKGlkZiA9IGxvZyhjb3JwdXNfbGVuZ3RoIC8gd29yZF9pbl9uKSApICU+JSAjIGludmVyc2UgZG9jdW1lbnQgZnJlcXVlbmN5CiAgbXV0YXRlKHRmX2lkZiA9IHRmICogaWRmKSAlPiUgCiAgdW5ncm91cCgpICU+JSAKICAKICAjIENob29zZSBhIHJlcHJlc2VudGFudCBmb3IgZWFjaCBzdGVtLCB0aGUgbW9zdCBjb21tb24gdGVybSBjb3VsZCBiZSB0aGUgYmVzdAogIGdyb3VwX2J5KHN0ZW0pICU+JQogIG11dGF0ZShvcmlfd29yZCA9IHdvcmQpICU+JQogIGdyb3VwX2J5KG9yaV93b3JkKSAlPiUgCiAgbXV0YXRlKG5fb3JpID0gbigpKSAlPiUKICBhcnJhbmdlKGRlc2Mobl9vcmkpKSAlPiUKICBncm91cF9ieShzdGVtKSAlPiUgCiAgbXV0YXRlKHdvcmQgPSB3b3JkWzFdKSAlPiUKICBzZWxlY3QoLW5fb3JpKSAlPiUgCiAgdW5ncm91cCgpCgojIHdyaXRlX2RlbGltKHggPSBjb3JwdXNfdGZpZGZfZnVsbCwgcGF0aCA9ICIuLi9vdXRwdXQvY29ycHVzX3RmaWRmX2Z1bGwudHN2IiwgZGVsaW0gPSAiXHQiLCBjb2xfbmFtZXMgPSBUUlVFKQojIGNvcnB1c190ZmlkZl9mdWxsIDwtIAojICAgcmVhZF9kZWxpbShmaWxlID0gIi4uL291dHB1dC9jb3JwdXNfdGZpZGZfZnVsbC50c3YiLCBkZWxpbSA9ICJcdCIsIGNvbF9uYW1lcyA9IFRSVUUpCgpjb3JwdXNfdGZpZGYgPC0KICBjb3JwdXNfdGZpZGZfZnVsbCAlPiUgCiAgIyByZWR1Y2UKICBncm91cF9ieShpZCwgd29yZCkgJT4lCiAgc2xpY2UoMSkgJT4lIAogIHVuZ3JvdXAoKSAlPiUKICAKICAjIGZpbHRlciBvdXQgIHdvcmRzIHdpdGggdGYtaWRmID09IDAKICBmaWx0ZXIodGZfaWRmID4gMCkgJT4lIAogIGlkZW50aXR5KCkKCmNvcnB1c190ZmlkZiAlPiUgCiAgZmlsdGVyKCEod29yZCAlaW4lIHN0b3Bfd29yZHMkd29yZCkpICU+JQogIGZpbHRlcihuX3RvdGFsID49IDUwKSAlPiUgCiAgYXJyYW5nZShkZXNjKG5fdG90YWwpKSAlPiUgCiAgZ3JvdXBfYnkod29yZCwgam91cm5hbCkgJT4lIAogIHNsaWNlKDEpICU+JQogIHNlbGVjdCh3b3JkLCBqb3VybmFsLCBwdWJfZGF0ZSwgbl90b3RhbCwgbl9qb3VybmFsKSAlPiUKICBhcnJhbmdlKGRlc2Mobl90b3RhbCkpICU+JSAKICBkYXRhdGFibGUoY2FwdGlvbiA9ICJXb3JkcyBhcHBlYXJpbmcgYXQgbGVhc3QgNTAgdGltZXMiLCBmaWx0ZXIgPSAidG9wIikgJT4lIAogIGlkZW50aXR5KCkKYGBgCgojIyBXb3JkIGNvdW50IGV2b2x1dGlvbiB0aHJvdWdoIHRpbWUKYGBge3Igd29yZHNfdGltZSwgZmlnLndpZHRoID0gMTUsIGZpZy5oZWlnaHQ9IDM1fQpjb3JwdXNfeWVhciA8LQogIGNvcnB1c190ZmlkZl9mdWxsICU+JQogICMgRmlsdGVyIG91dCBhIHdvcmQgaWYgb25lIG1lbWJlciBvZiB0aGUgZmFtaWx5IChvcmlfd29yZCkgaXMgYSBzdG9wd29yZAogIGdyb3VwX2J5KHdvcmQpICU+JSAKICBtdXRhdGUoaXNfc3RvcCA9IGlmZWxzZSh0ZXN0ID0gc3VtKG9yaV93b3JkICVpbiUgc3RvcF93b3JkcyR3b3JkKSA+PSAxLCB5ZXMgPSBUUlVFLCBubyA9IEZBTFNFKSkgJT4lCiAgZmlsdGVyKCFpc19zdG9wKSAlPiUgCiAgbXV0YXRlKGlzX3N0b3AgPSBOVUxMKSAlPiUgCiAgdW5ncm91cCgpICU+JSAKICBmaWx0ZXIobl90b3RhbCA+IDM1MCkgJT4lCiAgbXV0YXRlKHllYXIgPSB5ZWFyKHB1Yl9kYXRlKSkgJT4lCiAgZ3JvdXBfYnkod29yZCwgeWVhciwgam91cm5hbCkgJT4lCiAgbXV0YXRlKG5feWVhciA9IG4oKSkgJT4lCiAgc2xpY2UoMSkgJT4lCiAgdW5ncm91cCgpICU+JQogIG11dGF0ZSh3b3JkID0gcmVvcmRlcih3b3JkLCBkZXNjKG5fdG90YWwpKSkjIENvbnZlcnNpb24gdG8gZmFjdG9yIGZvciBvcmRlcmluZyBpbiB0aGUgZmFjZXRfd3JhcHBpbmcgb2YgdGhlIHBsb3QKCm15X2xhYmVsbGVyIDwtCiAgdW5pcXVlKHBhc3RlMChjb3JwdXNfeWVhciR3b3JkLCAiKCIsY29ycHVzX3llYXIkbl90b3RhbCwiKSIpKQpuYW1lcyhteV9sYWJlbGxlcikgPC0gdW5pcXVlKGNvcnB1c195ZWFyJHdvcmQpCgp3b3JkX3RpbWVfcGxvdCA8LQogIGdncGxvdChjb3JwdXNfeWVhcikgKwogIGdlb21fbGluZShtYXBwaW5nID0gYWVzKHggPSBwdWJfZGF0ZSwgeSA9IG5feWVhciwgY29sb3VyID0gam91cm5hbCkpICsKICB5bGFiKCJjb3VudCIpICsKICAgIHhsYWIoIlllYXIiKSArCiAgc2NhbGVfY29sb3JfbWFudWFsKHZhbHVlcyA9IGMoInN0ZWVsYmx1ZSIsICJ2aW9sZXRyZWQzIikpICsKICBzY2FsZV94X2RhdGUoYnJlYWtzID0gc2VxKGZyb20gPSB5bWQoIjE5ODAvMDEvMDEiKSwgdG8gPSB5bWQoIjIwMTUvMDEvMDEiKSwgYnkgPSAiNSB5ZWFycyIpLAogICAgICAgICAgICAgICBkYXRlX2xhYmVscyA9ICIlWSIsCiAgICAgICAgICAgICAgIG1pbm9yX2JyZWFrcyA9IHdhaXZlcigpLAogICAgICAgICAgICAgICBkYXRlX21pbm9yX2JyZWFrcyA9ICIxIHllYXJzIiwKICAgICAgICAgICAgICAgbGltaXRzID0gYyh5bWQoIjE5NzkvMDEvMDEiKSx5bWQoIjIwMTcvMDEvMDEiKSkpICsgIyAxIHllYXIgYmVmb3JlIGJlY2F1c2UgZG9kZ2UgbmVlZHMgYSBiaXQgb2Ygc3BhY2UgYXBwYXJlbnRseQogIHRoZW1lX2J3KCkgKwogIHRoZW1lKGxlZ2VuZC5wb3NpdGlvbiA9ICJ0b3AiLCBsZWdlbmQudGV4dCA9IGVsZW1lbnRfdGV4dChzaXplID0gMTIpKSArCiAgZmFjZXRfd3JhcCh+d29yZCwgbmNvbCA9IDMsIGxhYmVsbGVyID0gYXNfbGFiZWxsZXIobXlfbGFiZWxsZXIpLCBzY2FsZXMgPSAiZnJlZSIpCiMgZ2dkcmF3KCkgKyBkcmF3X3Bsb3Qod29yZF90aW1lX3Bsb3QpICsgZ2dzYXZlKGZpbGVuYW1lID0gIi4uL291dHB1dC93b3Jkc190aW1lLnBkZiIsIHdpZHRoID0gMzAsIGhlaWdodCA9IDkwLCB1bml0cyA9ICJjbSIpCndvcmRfdGltZV9wbG90CgojIEZvciB0aGUgcGFwZXIKc2VsZWN0ZWRfd29yZF90aW1lX3Bsb3QgPC0KICBjb3JwdXNfeWVhciAlPiUKICBmaWx0ZXIoc3RyX2RldGVjdChzdHJpbmcgPSB3b3JkLCBwYXR0ZXJuID0gIl5hbnRpYmlvdGljcyR8XmZhcm0kfF5pbmR1c3RyeSQiKSkgJT4lCiAgZ2dwbG90KCkgKwogIGdlb21fbGluZShtYXBwaW5nID0gYWVzKHggPSBwdWJfZGF0ZSwgeSA9IG5feWVhciwgY29sb3VyID0gam91cm5hbCkpICsKICB5bGFiKCJjb3VudCIpICsKICB4bGFiKCJZZWFyIikgKwogIHNjYWxlX2NvbG9yX21hbnVhbCh2YWx1ZXMgPSBjKCJzdGVlbGJsdWUiLCAidmlvbGV0cmVkMyIpLCAKICAgICAgICAgICAgICAgICAgICAgZ3VpZGUgPSBndWlkZV9sZWdlbmQodGl0bGUgPSBOVUxMKSkgKwogIHNjYWxlX3hfZGF0ZShicmVha3MgPSBzZXEoZnJvbSA9IHltZCgiMTk4MC8wMS8wMSIpLCB0byA9IHltZCgiMjAxNS8wMS8wMSIpLCBieSA9ICI1IHllYXJzIiksCiAgICAgICAgICAgICAgIGRhdGVfbGFiZWxzID0gIiVZIiwKICAgICAgICAgICAgICAgbWlub3JfYnJlYWtzID0gd2FpdmVyKCksCiAgICAgICAgICAgICAgIGRhdGVfbWlub3JfYnJlYWtzID0gIjEgeWVhcnMiLAogICAgICAgICAgICAgICBsaW1pdHMgPSBjKHltZCgiMTk3OS8wMS8wMSIpLHltZCgiMjAxNy8wMS8wMSIpKSkgKyAjIDEgeWVhciBiZWZvcmUgYmVjYXVzZSBkb2RnZSBuZWVkcyBhIGJpdCBvZiBzcGFjZSBhcHBhcmVudGx5CiAgdGhlbWVfYncoKSArCiAgdGhlbWUobGVnZW5kLnBvc2l0aW9uID0gInRvcCIsIGxlZ2VuZC50ZXh0ID0gZWxlbWVudF90ZXh0KHNpemUgPSAxMikpICsKICBmYWNldF93cmFwKH53b3JkLCBuY29sID0gMSwgbGFiZWxsZXIgPSBhc19sYWJlbGxlcihteV9sYWJlbGxlciksIHNjYWxlcyA9ICJmcmVlIikKYGBgCmBgYHtyfQpzZWxlY3RlZF93b3JkX3RpbWVfcGxvdApgYGAKCgojIEFuYWx5emVzCiMjIEdMTQpXaGF0IGFyZSB0aGUgdGVybSB0aGF0IGNvdWxkIGRpc2NyaW1pbmF0ZSBiZXR3ZWVuIGFuIGFydGljbGUgZnJvbSB0aGUgV1AgYW5kIHRoZSBOWVQ/CmBgYHtyIGdsbV9kYXRhfQpjb3JwdXNfZ2xtX3dpZGUgPC0KICBjb3JwdXNfdGZpZGYgJT4lIAogIHNlbGVjdCh3b3JkLCBpZCwgam91cm5hbCwgdGZfaWRmKSAlPiUgCiAgbXV0YXRlKGlkX2pvdXJuYWwgPSBqb3VybmFsLCBqb3VybmFsID0gTlVMTCkgJT4lICMgam91cm5hbCBpcyBhIHdvcmQgcHJlc2VudCBpbiB0aGUgY29ycHVzIAogIHNwcmVhZChrZXkgPSB3b3JkLCB2YWx1ZSA9IHRmX2lkZikgJT4lIAogIGJhc2U6OnJlcGxhY2UoeCA9IC4sIGxpc3QgPSBpcy5uYSguKSwgdmFsdWVzID0gMCkgJT4lCiAgdW5ncm91cCgpICU+JSAKICBzZWxlY3QoLWlkKSAlPiUgCiAgbXV0YXRlKGlkX2pvdXJuYWwgPSBhcy5mYWN0b3IoaWRfam91cm5hbCkpICU+JSAKICB1bmdyb3VwKCkgJT4lIAogIGlkZW50aXR5KCkKCnN0YW5kYXJkaXplX2NsYXNzaWMgPC0gCiAgZnVuY3Rpb24oeCkgcmV0dXJuKCh4IC0gbWVhbih4KSkgLyBzZCh4KSkKc3RhbmRhcmRpemVfZ2VsbWFuIDwtIAogIGZ1bmN0aW9uKHgpIHJldHVybih4IC0gbWVhbih4KSAvIDIgKiBzZCh4KSkgIyBzdHJhbmdlLCBzZWUgaHR0cHM6Ly9hbmRyZXdnZWxtYW4uY29tLzIwMDkvMDcvMTEvd2hlbl90b19zdGFuZGFyLwoKc3RhbmRhcmRpemVkX3RmX2lkZiA8LSAjIGNvcnB1c19nbG1fd2lkZVssIC0xXQogIGFwcGx5KFggPSBhcy5tYXRyaXgoY29ycHVzX2dsbV93aWRlWyAsLTFdKSwgCiAgICAgICAgTUFSR0lOID0gMiwgIAogICAgICAgICBGVU4gPSBzdGFuZGFyZGl6ZV9jbGFzc2ljKQoKcmVzcG9uc2VfdmFyIDwtIAogIGNvcnB1c19nbG1fd2lkZSRpZF9qb3VybmFsCnJlc3BvbnNlX3Zhcl9ib29sIDwtIAogIGlmZWxzZSh0ZXN0ID0gcmVzcG9uc2VfdmFyID09ICJUaGUgV2FzaGluZ3RvbiBQb3N0IiwgCiAgICAgICAgIHllcyA9IFRSVUUsIAogICAgICAgICBubyA9IEZBTFNFKQoKYGBgCgpgYGB7ciBnbG1fY2FsY30Kc2V0LnNlZWQoYygxMiwxMCwyMDE4LDE4LDIwKSkgIyBjdi5nbG1uZXQgaGFzIGEgcmFuZG9tIHBhcnQKc3lzdGVtLnRpbWUoCmNvcnB1c19sYXNzbyA8LSAKICBjdi5nbG1uZXQoeCA9IHN0YW5kYXJkaXplZF90Zl9pZGYsIAogICAgICAgICAgICAgICAgICAgICAgICAgIHkgPSByZXNwb25zZV92YXJfYm9vbCwgCiAgICAgICAgICAgICAgICAgICAgICAgICAgZmFtaWx5ID0gImJpbm9taWFsIiwgCiAgICAgICAgICAgICAgICAgICAgICAgICAgbmZvbGRzID0gMTAsIAogICAgICAgICAgICAgICAgICAgICAgICAgIHR5cGUubWVhc3VyZSA9ICJhdWMiLCAjIGNvdWxkIGJlICJhdWMiIG9yICJjbGFzcyIKICAgICAgICAgICAgICAgICAgICAgICAgICBpbnRlcmNlcHQgPSBGQUxTRSwKICAgICAgICAgICAgICAgICAgICAgICAgICBhbHBoYSA9IDAuNSkKKQpwbG90KGNvcnB1c19sYXNzbykKCndvcmRhX2xhc3NvIDwtIAogIGRpbW5hbWVzKGNvZWYoY29ycHVzX2xhc3NvKSlbWzFdXQoKYmV0YV9kZiA8LSAKICBkYXRhLmZyYW1lKHdvcmQgPSB3b3JkYV9sYXNzbyxiZXRhX2NvZWYgPSBhcy52ZWN0b3IoY29lZi5jdi5nbG1uZXQoY29ycHVzX2xhc3NvLCBjb3JwdXNfbGFzc28kbGFtYmRhLm1pbikpKSAlPiUgCiAgZmlsdGVyKGJldGFfY29lZiAhPSAwKSAlPiUKICBhcnJhbmdlKGRlc2MoYmV0YV9jb2VmKSkgJT4lIAogIG11dGF0ZShwID0gZXhwKChiZXRhX2NvZWYpKSAvICgxICsgZXhwKChiZXRhX2NvZWYpKSkgKSAlPiUgCiAgbXV0YXRlKGxhYl9iZXRhX2NvZWYgPSAoc2lnbmlmKGJldGFfY29lZiwgMikpKSAlPiUgCiAgaWRlbnRpdHkoKQpiZXRhX2RmIAoKCnRpbG9zIDwtCiAgZ2dwbG90KGRhdGEgPSBiZXRhX2RmLCBtYXBwaW5nID0gYWVzKHggPSBmYWN0b3IoMCksIHkgPSByZW9yZGVyKHdvcmQsIGJldGFfY29lZikpKSArCiAgZ2VvbV90aWxlKGFlcyhmaWxsID0gYmV0YV9jb2VmKSkgKwogIGdlb21fdGV4dChhZXMobGFiZWwgPSB3b3JkKSkgKwogIHNjYWxlX2ZpbGxfZ3JhZGllbnQyKGxvdyA9ICJzdGVlbGJsdWUiLAogICAgICAgICAgICAgICAgICAgICAgIG1pZCA9ICJ3aGl0ZSIsIAogICAgICAgICAgICAgICAgICAgICAgIGhpZ2ggPSAidmlvbGV0cmVkMyIsIAogICAgICAgICAgICAgICAgICAgICAgIG1pZHBvaW50ID0gMCwgCiAgICAgICAgICAgICAgICAgICAgICAgc3BhY2UgPSAiTGFiIiwgCiAgICAgICAgICAgICAgICAgICAgICAgYnJlYWtzID0gYyhtYXgoYmV0YV9kZiRiZXRhX2NvZWYpLCBtaW4oYmV0YV9kZiRiZXRhX2NvZWYpKSwKICAgICAgICAgICAgICAgICAgICAgICBsYWJlbHMgPSBjKCJXUCIsICJOWVQiKSApICsKICBzY2FsZV95X2Rpc2NyZXRlKGxhYmVscyA9IChzb3J0KGJldGFfZGYkbGFiX2JldGFfY29lZiwgZGVjcmVhc2luZyA9IEZBTFNFKSkgKSArCiAgZ2d0aXRsZSgiIikgKwogIHhsYWIoIndvcmQiKSArCiAgeWxhYigiYmV0YSBjb2VmZmljaWVudCBmcm9tIHRoZSBzdGFuZGFyZGl6ZWQgbG9naXN0aWMgcmVncmVzc2lvbiIpICsKICB0aGVtZV9jbGFzc2ljKCkgKwogIHRoZW1lKGF4aXMudGV4dCA9IGVsZW1lbnRfdGV4dCgpLCAKICAgICAgICBheGlzLnRleHQueCA9IGVsZW1lbnRfYmxhbmsoKSwgCiAgICAgICAgYXhpcy50aWNrcy54ID0gZWxlbWVudF9ibGFuaygpLCAKICAgICAgICBwYW5lbC5iYWNrZ3JvdW5kID0gZWxlbWVudF9ibGFuaygpLCAKICAgICAgICBwYW5lbC5ncmlkLm1ham9yID0gZWxlbWVudF9ibGFuaygpLCAKICAgICAgICBwYW5lbC5ncmlkLm1pbm9yID0gZWxlbWVudF9ibGFuaygpLAogICAgICAgIGxlZ2VuZC50aXRsZSA9IGVsZW1lbnRfYmxhbmsoKQogICAgICAgICkgKwogIGdlb21fYmxhbmsoKQp0aWxvcwoKIyBwcmVkb3MgPC0gCiMgICBwcmVkaWN0LmN2LmdsbW5ldChvYmplY3QgPSBjb3JwdXNfbGFzc28sIAojICAgICAgICAgICAgICAgICAgICAgbmV3eCA9IHN0YW5kYXJkaXplZF90Zl9pZGYsIAojICAgICAgICAgICAgICAgICAgICAgcyA9ICJsYW1iZGEubWluIiwgCiMgICAgICAgICAgICAgICAgICAgICB0eXBlID0gImNsYXNzIikKIyB0YWJsZShwcmVkb3MgPT0gcmVzcG9uc2VfdmFyX2Jvb2wpCmBgYAoKIyMgQ29udGV4dHVhbCBhbmFseXNpcwojIyMgU3ludGFnbWEgY3VyYXRpb24KSW4gdGhlIG5leHQgc2VjdGlvbiwgd2Ugd2lsbCBjb25jZW50cmF0ZSBvbiBjb3VudGluZyBtYW51YWxseSBjdXJhdGVkIHRlcm1zIG9yIGV4cHJlc3Npb25zIChzeW50YWdtYXMpClRoZXkgd2lsbCBiZSBwcmVzZW50ZWQgaW4gYSBuYW1lZCBsaXN0IGNvbnRhaW5pbmcgYWxsIHRoZSB0ZXJtcyBjb25zaWRlcmVkIGVxdWl2YWxlbnQuIFdlIHdpbGwgdGhlbiBleHRyYWN0IGFsbCB0aGUgc2VudGVuY2VzIGluIHdoaWNoIHRoZXkgb2NjdXIgYW5kIGFuYWx5c2UgdGhlaXIgY29udGV4dCAoaW4gZ2VuZXJhbCBhbmQgYWNyb3NzIHRpbWUpLgpgYGB7ciBjdXJhdGVkX3N5bnRhZ21hfQpjdXJhdGVkX3N5bnRhZ21hIDwtIAogIGxpc3QoCiAgICAiYW50aWJpb3RpY19yZXNpc3RhbmNlIiA9IAogICAgICBjKCJhbnRpYmlvdGljIHJlc2lzdGFuY2UiLCAiYW50aWJpb3RpYy1yZXNpc3RhbmNlIiwgInJlc2lzdGFudCB0byBhbnRpYmlvdGljcyIsICJyZXNpc3RhbmNlIHRvIGFudGliaW90aWNzIiksCiAgICAiYW50aWJpb3RpY19mcmVlIiA9IAogICAgICBjKCJhbnRpYmlvdGljIGZyZWUiLCAiYW50aWJpb3RpYy1mcmVlIiwgImFudGliaW90aWNzZnJlZSIsICJmcmVlIG9mIGFudGliaW90aWNzIiksCiAgICAicm91dGluZV91c2UiID0gCiAgICAgIGMoInJvdXRpbmUgdXNlIiwgInJvdXRpbmVseSB1c2VkIiksCiAgICAianVkaWNpb3VzX3VzZSIgPSAKICAgICAgYygianVkaWNpb3VzIHVzZSIpLAogICAgInJlc3BvbnNpYmxlX3VzZSIgPSAKICAgICAgYygicmVzcG9uc2libGUgdXNlIiksCiAgICAicHJ1ZGVudF91c2UiID0gCiAgICAgIGMoInBydWRlbnQgdXNlIiksCiAgICAiaW5kaXNjcmltaW5hdGVfdXNlIiA9IAogICAgICBjKCJpbmRpc2NyaW1pbmF0ZSB1c2UiKSwKICAgICJmb29kX2Jvcm5lIiA9IAogICAgICBjKCJmb29kIGJvcm5lIiwgImZvb2QtYm9ybmUiKQogICkKY3VyYXRlZF9zeW50YWdtYQpgYGAKClRoZSBmaXJzdCBzdGVwIGlzIHRvIGRpdmlkZSB0aGUgY29ycHVzIGluIHNlbnRlbmNlcy4gIApSZW1hcmsgYHVubmVzdF90b2tlbnModG9rZW4gPSAic2VudGVuY2VzIilgIGNsZWFybHkgZmFpbHMgd2hlbmV2ZXIgaXQgZW5jb3VudGVycyBhbiBhYmJyZXZpYXRpb24gY29udGFpbmluZyBhIGRvdC4KYGBge3IgY29ycHVzX3NlbnRlbmNlc30KY29ycHVzX3NlbnRlbmNlcyA8LQogIGNvcnB1c190eHQgJT4lIAogICMgRWFjaCBhcnRpY2xlIGhhcyB0byBiZSByZS1jb25jYXRlbmF0ZWQKICBncm91cF9ieShpZCkgJT4lIAogICMgZmlsdGVyKGlkICVpbiUgMTo1KSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHBhc3RlKHRleHQsIGNvbGxhcHNlID0gIiAiKSkgJT4lCiAgc2VsZWN0KC10ZXh0KSAlPiUgCiAgZGlzdGluY3QoKSAlPiUKICB1bmdyb3VwKCkgJT4lIAojIENvdWxkL3Nob3VsZCBiZSBkb25lIGluIG9uZSBwYXNzIHdpdGggYSBsaXN0IG9mIHRlcm1zIQogIG11dGF0ZShhcnRpY2xlID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IGFydGljbGUsIHBhdHRlcm4gPSByZWdleChwYXR0ZXJuID0gImRyXFwuIiwgaWdub3JlX2Nhc2UgPSBUUlVFKSwgcmVwbGFjZW1lbnQgPSAiZHIiKSkgJT4lCiAgbXV0YXRlKGFydGljbGUgPSBzdHJfcmVwbGFjZV9hbGwoc3RyaW5nID0gYXJ0aWNsZSwgcGF0dGVybiA9IHJlZ2V4KHBhdHRlcm4gPSAicHJvZlxcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gInByb2YiKSkgJT4lCiAgbXV0YXRlKGFydGljbGUgPSBzdHJfcmVwbGFjZV9hbGwoc3RyaW5nID0gYXJ0aWNsZSwgcGF0dGVybiA9IHJlZ2V4KHBhdHRlcm4gPSAibXJcXC4iLCBpZ25vcmVfY2FzZSA9IFRSVUUpLCByZXBsYWNlbWVudCA9ICJtciIpKSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBhcnRpY2xlLCBwYXR0ZXJuID0gcmVnZXgocGF0dGVybiA9ICJtc1xcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gIm1zIikpICU+JQogIG11dGF0ZShhcnRpY2xlID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IGFydGljbGUsIHBhdHRlcm4gPSByZWdleChwYXR0ZXJuID0gIm1yc1xcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gIm1ycyIpKSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBhcnRpY2xlLCBwYXR0ZXJuID0gcmVnZXgocGF0dGVybiA9ICJzdFxcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gInN0IikpICU+JQogIG11dGF0ZShhcnRpY2xlID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IGFydGljbGUsIHBhdHRlcm4gPSByZWdleChwYXR0ZXJuID0gInJlcFxcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gInJlcCIpKSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBhcnRpY2xlLCBwYXR0ZXJuID0gcmVnZXgocGF0dGVybiA9ICJ1XFwuc1xcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gInVzYSIpKSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBhcnRpY2xlLCBwYXR0ZXJuID0gcmVnZXgocGF0dGVybiA9ICJmXFwuZFxcLmFcXC4iLCBpZ25vcmVfY2FzZSA9IFRSVUUpLCByZXBsYWNlbWVudCA9ICJmZGEiKSkgJT4lCiAgbXV0YXRlKGFydGljbGUgPSBzdHJfcmVwbGFjZV9hbGwoc3RyaW5nID0gYXJ0aWNsZSwgcGF0dGVybiA9IHJlZ2V4KHBhdHRlcm4gPSAiZ292XFwuIiwgaWdub3JlX2Nhc2UgPSBUUlVFKSwgcmVwbGFjZW1lbnQgPSAiZ292IikpICU+JQogIG11dGF0ZShhcnRpY2xlID0gc3RyX3JlcGxhY2VfYWxsKHN0cmluZyA9IGFydGljbGUsIHBhdHRlcm4gPSByZWdleChwYXR0ZXJuID0gInNlblxcLiIsIGlnbm9yZV9jYXNlID0gVFJVRSksIHJlcGxhY2VtZW50ID0gInNlbiIpKSAlPiUKICBtdXRhdGUoYXJ0aWNsZSA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSBhcnRpY2xlLCBwYXR0ZXJuID0gcmVnZXgocGF0dGVybiA9ICIoIC57MX0pXFwuIiwgaWdub3JlX2Nhc2UgPSBUUlVFKSwgcmVwbGFjZW1lbnQgPSAiXFwxIikpICU+JQogIHVubmVzdF90b2tlbnMob3V0cHV0ID0gInNlbnRlbmNlIiwgCiAgICAgICAgICAgICAgICBpbnB1dCA9IGFydGljbGUsIAogICAgICAgICAgICAgICAgdG9rZW4gPSAic2VudGVuY2VzIiwgCiAgICAgICAgICAgICAgICB0b19sb3dlciA9IFRSVUUpICU+JQogIG11dGF0ZShsZW5ndGggPSBuY2hhcihzZW50ZW5jZSkpICU+JQogIHNlbGVjdChsZW5ndGgsIGV2ZXJ5dGhpbmcoKSkgJT4lIAogIHVuZ3JvdXAoKSAlPiUgCiAgaWRlbnRpdHkoKQoKCgojIERpYWdub3NlIHByb2JsZW1zIHdpdGggYWJicmV2aWF0aW9ucyAoTXIuIERyLiBldGMpCmVuZF9zZW50ZW5jZXNfY29ycHVzIDwtCiAgY29ycHVzX3NlbnRlbmNlcyAlPiUKICBmaWx0ZXIoc3RyX2RldGVjdChzdHJpbmcgPSBzZW50ZW5jZSwgcGF0dGVybiA9ICJeW1s6YWxudW06XV17MSw1fVxcLiQiKSkgJT4lCiAgZ3JvdXBfYnkoc2VudGVuY2UpICU+JQogIHN1bW1hcml6ZShuID0gbigpKSAlPiUKICB1bmdyb3VwKCkgJT4lCiAgbXV0YXRlKG5fY2hhciA9IG5jaGFyKHNlbnRlbmNlKSkgJT4lCiAgYXJyYW5nZShkZXNjKG4pKQpgYGAKCldlIGNhbiBub3cgdHJ5IHRvIGlzb2xhdGUgc2VudGVuY2VzIGNvbnRhaW5pbmcgb3VyIHRlcm1zIG9mIGludGVyZXN0LgpgYGB7cn0KY29ycHVzX3N5bnRhZ21hX3NlbnRlbmNlIDwtCiAgbGFwcGx5KFggPSBjdXJhdGVkX3N5bnRhZ21hLCBGVU4gPSBmdW5jdGlvbihzeW50YWdtYSl7CiAgICBjb3JwdXNfc2VudGVuY2VzICU+JQogICAgICByb3d3aXNlKCkgJT4lCiAgICAgIG11dGF0ZShzeW50YWdtdXMgPSBpZmVsc2UodGVzdCA9IHN1bShzdHJfZGV0ZWN0KHN0cmluZyA9IHNlbnRlbmNlLCBwYXR0ZXJuID0gc3ludGFnbWEpKSA+IDAsIHllcyA9IHN5bnRhZ21hLCBubyA9IE5BKSkgJT4lCiAgICAgIGZpbHRlcighaXMubmEoc3ludGFnbXVzKSkKICB9KQoKY29ycHVzX3N5bnRhZ21hX3NlbnRlbmNlIDwtCiAgZG8uY2FsbCh3aGF0ID0gcmJpbmQsIGFyZ3MgPSBjb3JwdXNfc3ludGFnbWFfc2VudGVuY2UpCnRhYmxlKGNvcnB1c19zeW50YWdtYV9zZW50ZW5jZSRzeW50YWdtdXMpCnRhYmxlKGNvcnB1c19zeW50YWdtYV9zZW50ZW5jZSRzeW50YWdtdXMsIGNvcnB1c19zeW50YWdtYV9zZW50ZW5jZSRqb3VybmFsKQpgYGAKCk9uIHRoaXMgbmV3IGRhdGFmcmFtZSwgd2UgY2FuIGNvdW50IHRoZSBvY2N1cmVuY2Ugb2YgZWFjaCB3b3JkIGluIHRoZSBzZW50ZW5jZSBjb250ZXh0IG9mIGVhY2gKc3ludGFnbWEsIG92ZXJhbGwgYW5kIGRpdmlkZWQgYnkgam91cm5hbDoKCmBgYHtyfQpjb3JwdXNfc3ludGFnbWFfd29yZCA8LQogIGNvcnB1c19zeW50YWdtYV9zZW50ZW5jZSAlPiUKICB1bm5lc3RfdG9rZW5zKG91dHB1dCA9ICJ3b3JkIiwgaW5wdXQgPSBzZW50ZW5jZSwgdG9rZW4gPSAibmdyYW1zIiwgbiA9IDEpICU+JQogIGZpbHRlcighKHdvcmQgJWluJSBzdG9wX3dvcmRzJHdvcmQpKSAlPiUKICBmaWx0ZXIoaXMubmEoc3RyX21hdGNoKHN0cmluZyA9IHdvcmQsIHBhdHRlcm4gPSAiWzAtOV0iKSkpICU+JSAjIG5vIG1hdGNoIGluIHN0cl9tYXRjaCgpIHJldHVybnMgTkEKICBtdXRhdGUod29yZCA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSB3b3JkLCBwYXR0ZXJuID0gIlxcLiIsIHJlcGxhY2VtZW50ID0gIiIpKSAlPiUKICBtdXRhdGUod29yZCA9IHN0cl9yZXBsYWNlX2FsbChzdHJpbmcgPSB3b3JkLCBwYXR0ZXJuID0gIiguKikncyIsIHJlcGxhY2VtZW50ID0gIlxcMSIpKSAlPiUKICBtdXRhdGUoc3RlbSA9IHN0ZW1fd29yZHMod29yZCkpICU+JQogIAogICMgQ2hvb3NlIGEgcmVwcmVzZW50YW50IGZvciBlYWNoIHN0ZW0sIHRoZSBtb3N0IGNvbW1vbiB0ZXJtIGNvdWxkIGJlIHRoZSBiZXN0CiAgZ3JvdXBfYnkoc3RlbSkgJT4lCiAgbXV0YXRlKG9yaV93b3JkID0gd29yZCkgJT4lCiAgZ3JvdXBfYnkob3JpX3dvcmQpICU+JSAKICBtdXRhdGUobl9vcmkgPSBuKCkpICU+JQogIGFycmFuZ2UoZGVzYyhuX29yaSkpICU+JQogIGdyb3VwX2J5KHN0ZW0pICU+JSAKICBtdXRhdGUod29yZCA9IHdvcmRbMV0pICU+JQogIHNlbGVjdCgtbl9vcmkpICU+JSAKICB1bmdyb3VwKCkgJT4lIAogIAogIGdyb3VwX2J5KHN5bnRhZ211cywgc3RlbSkgJT4lCiAgbXV0YXRlKG5fdG90YWwgPSBuKCkpICU+JQogIGdyb3VwX2J5KHN5bnRhZ211cywgam91cm5hbCwgc3RlbSkgJT4lCiAgbXV0YXRlKG5fam91cm5hbCA9IG4oKSkgJT4lCiAgc2xpY2UoMSkgJT4lCiAgdW5ncm91cCgpICU+JSAKICBzZWxlY3Qoc3ludGFnbXVzLCB3b3JkLCBqb3VybmFsLCBuX2pvdXJuYWwsIG5fdG90YWwpICU+JQogIGFycmFuZ2UoZGVzYyhuX3RvdGFsKSkgJT4lCiAgaWRlbnRpdHkoKQpjb3JwdXNfc3ludGFnbWFfd29yZCAlPiUgCiAgICBkYXRhdGFibGUoZmlsdGVyID0gInRvcCIsIHJvd25hbWVzID0gRkFMU0UsIG9wdGlvbnMgPSBsaXN0KHBhZ2VMZW5ndGggPSAxMCkpCmBgYAoKCgoKCkZpZ3VyZXMgcHJpbnRpbmcgYW5kIHNhdmluZwpgYGB7ciBmaWdfcHJpbnQsIGVjaG8gPSBGQUxTRSwgcmVzdWx0cyA9IEZBTFNFfQojIHBsb3RfZ3JpZChoaXN0bywgc2VsZWN0ZWRfd29yZF90aW1lX3Bsb3QsIG5jb2wgPSAxLCBsYWJlbHMgPSBjKCJBIiwgIkIiKSkgKwojICAgIGdnc2F2ZShmaWxlbmFtZSA9ICIuLi9vdXRwdXQvZmlnMS5zdmciLCB3aWR0aCA9IDIwLCBoZWlnaHQgPSAzMCwgdW5pdHMgPSAiY20iKQoKIyBnZ3NhdmUocGxvdCA9IHRpbWVsaW5lLCBmaWxlbmFtZSA9ICIuLi9vdXRwdXQvdGltZWxpbmUuc3ZnIiwgd2lkdGggPSAyMCwgaGVpZ2h0ID0gMTApCiMgZ2dzYXZlKHBsb3QgPSB0aWxvcywgZmlsZW5hbWUgPSAiLi4vb3V0cHV0L2ZpZ18yXy5zdmciLCB3aWR0aCA9IDE1LCBoZWlnaHQgPSAyMCwgdW5pdHMgPSAiY20iKQpzYXZlX3Bsb3QoZmlsZW5hbWUgPSAiLi4vb3V0cHV0L3dvcmRfdXNhZ2UucGRmIiwgcGxvdCA9IHNlbGVjdGVkX3dvcmRfdGltZV9wbG90LCBiYXNlX2FzcGVjdF9yYXRpbyA9IDEuMiwgYmFzZV9oZWlnaHQgPSA1KQpzYXZlX3Bsb3QoZmlsZW5hbWUgPSAiLi4vb3V0cHV0L2JldGEucGRmIiwgcGxvdCA9IHRpbG9zLCBiYXNlX2FzcGVjdF9yYXRpbyA9IDAuOCwgYmFzZV9oZWlnaHQgPSA0KQpgYGAKCgoKCgpQYWNrYWdlcyBsb2FkaW5nCmBgYHtyIHNldHVwLCBlY2hvID0gRkFMU0UsbWVzc2FnZSA9IEZBTFNFfQp1c2VkX3Bja2dzIDwtIGMoInJlYWRyIiwgCiAgICAgICAgICAgICAgICAicGRmdG9vbHMiLAogICAgICAgICAgICAgICAgImRwbHlyIiwgCiAgICAgICAgICAgICAgICAidGlkeXIiLCAKICAgICAgICAgICAgICAgICJzdHJpbmdyIiwKICAgICAgICAgICAgICAgICJsdWJyaWRhdGUiLAogICAgICAgICAgICAgICAgInRpZHl0ZXh0IiwKICAgICAgICAgICAgICAgICJnZ3Bsb3QyIiwgCiAgICAgICAgICAgICAgICAiY293cGxvdCIsCiAgICAgICAgICAgICAgICAidGV4dHN0ZW0iLAogICAgICAgICAgICAgICAgIkRUIiwKICAgICAgICAgICAgICAgICJnbG1uZXQiKQoKbXlfcGFja2FnZXMgPC0gZnVuY3Rpb24ocGFja2FnZXMsIGluc3RhbGxfcGFja2FnZXMgPSBGQUxTRSl7CiAgdXNlZF9wY2tncyA8LSBwYWNrYWdlcwogIGZvciAocGFja3VzIGluIHVzZWRfcGNrZ3MpIHsKICAgIHBhY2t1cyA8LSBhcy5jaGFyYWN0ZXIocGFja3VzKQogICAgcGNrZ19wcmVzZW50IDwtIAogICAgICByZXF1aXJlKHBhY2t1cywgCiAgICAgICAgICAgICAgY2hhcmFjdGVyLm9ubHkgPSBUUlVFLCAKICAgICAgICAgICAgICBxdWlldGx5ID0gVFJVRSkKICAgIGlmIChwY2tnX3ByZXNlbnQpIHsKICAgICAgbGlicmFyeShwYWNrdXMsIAogICAgICAgICAgICAgIGNoYXJhY3Rlci5vbmx5ID0gVFJVRSkKICAgIH0gCiAgICBlbHNlIHsKICAgICAgcHJpbnQocGFzdGUwKCJQYWNrYWdlOiAiLHBhY2t1cywgIiBub3QgZm91bmQiKSkKICAgICAgaWYgKGluc3RhbGxfcGFja2FnZXMpIGluc3RhbGwucGFja2FnZXMocGFja3VzKQogICAgfQogIH0KfQoKbXlfcGFja2FnZXMocGFja2FnZXMgPSB1c2VkX3Bja2dzLCBpbnN0YWxsX3BhY2thZ2VzID0gVCkKZGV2dG9vbHM6OnNlc3Npb25faW5mbygpCmBgYA==

Antibiotics and food in the American press: A text mining study.

antoine.bridier-nahmias@inserm.fr