Frequency of Occurrence of values above a certain value across many columns? - r

I have a dataset with many columns and thousands of rows. I am trying to get another column, foo which has the frequency that a value above 100 occurs in a row.
structure(list(S026401.R1 = c(0L, 0L, 0L, 0L, 0L), S026404.R1 = c(0L,
0L, 0L, 0L, 0L), S026406.R1 = c(0L, 0L, 0L, 0L, 0L), S026409.R1 = c(0L,
0L, 0L, 0L, 0L), S026412.R1 = c(0L, 0L, 0L, 0L, 0L), S026413.R1 = c(0L,
0L, 0L, 0L, 0L), S026414.R1 = c(47L, 0L, 0L, 0L, 0L), S026415.R1 = c(0L,
0L, 0L, 0L, 0L), S026416.R1 = c(31L, 0L, 0L, 0L, 0L), S026419.R1 = c(0L,
0L, 0L, 0L, 0L), S026421.R1 = c(0L, 0L, 0L, 0L, 34L), S026422.R1 = c(0L,
0L, 0L, 0L, 0L), S026423.R1 = c(0L, 0L, 0L, 0L, 0L), S026427.R1 = c(0L,
0L, 0L, 0L, 0L), S026428.R1 = c(0L, 0L, 0L, 0L, 1049L), S026429.R1 = c(0L,
0L, 0L, 0L, 0L), S026430.R1 = c(0L, 0L, 0L, 0L, 0L), S026431.R1 = c(0L,
10L, 0L, 0L, 0L), S026432.R1 = c(0L, 0L, 0L, 0L, 0L), S026433.R1 = c(0L,
0L, 0L, 0L, 0L), S026434.R1 = c(0L, 0L, 0L, 0L, 0L), S026435.R1 = c(0L,
0L, 0L, 0L, 0L), S026438.R1 = c(0L, 0L, 0L, 0L, 0L), S026440.R1 = c(0L,
0L, 0L, 0L, 0L), S026444.R1 = c(0L, 0L, 0L, 0L, 0L), S026447.R1 = c(0L,
0L, 0L, 0L, 0L), S026450.R1 = c(0L, 0L, 0L, 0L, 0L), S026451.R1 = c(0L,
0L, 0L, 0L, 0L), S026453.R1 = c(0L, 0L, 53L, 0L, 0L), S026456.R1 = c(0L,
0L, 0L, 0L, 0L), S026457.R1 = c(0L, 0L, 0L, 0L, 0L), S026458.R1 = c(0L,
0L, 0L, 0L, 0L), S026461.R1 = c(0L, 0L, 0L, 0L, 0L), S026462.R1 = c(0L,
0L, 0L, 0L, 18L), S026463.R1 = c(153L, 0L, 0L, 0L, 0L), S026464.R1 = c(0L,
0L, 0L, 0L, 0L), S026466.R1 = c(0L, 0L, 0L, 0L, 0L), S026467.R1 = c(32L,
0L, 0L, 0L, 0L), S026469.R1 = c(0L, 0L, 0L, 0L, 0L), S026470.R1 = c(0L,
0L, 0L, 0L, 0L), S026471.R1 = c(0L, 0L, 0L, 0L, 0L), S026473.R1 = c(0L,
0L, 0L, 0L, 0L), S026474.R1 = c(0L, 0L, 0L, 0L, 0L), S026476.R1 = c(0L,
0L, 0L, 0L, 0L), S026477.R1 = c(780L, 0L, 0L, 0L, 0L), S026483.R1 = c(21L,
0L, 0L, 0L, 0L), S026484.R1 = c(0L, 0L, 0L, 0L, 0L), S026485.R1 = c(0L,
0L, 0L, 13L, 0L), S026488.R1 = c(0L, 0L, 0L, 0L, 0L), S026489.R1 = c(0L,
0L, 0L, 0L, 0L), S026490.R1 = c(60L, 0L, 0L, 0L, 0L), S026493.R1 = c(0L,
0L, 103L, 0L, 0L)), class = c("rowwise_df", "tbl_df", "tbl",
"data.frame"), row.names = c(NA, -5L), groups = structure(list(
.rows = structure(list(1L, 2L, 3L, 4L, 5L), ptype = integer(0), class = c("vctrs_list_of",
"vctrs_vctr", "list"))), row.names = c(NA, -5L), class = c("tbl_df",
"tbl", "data.frame")))
what i've been trying is:
df %>%
rowwise() %>%
mutate(foo = sum(c(8:52>100), na.rm = TRUE))
but this returns all 0s in the new column foo
when i change >100 to a lower number, it does provide a frequency. however, there are many values above 100.

As suggested, use c_across with a range (or collection) of columns.
library(dplyr)
df %>%
rowwise() %>%
mutate(foo = sum(c_across(X1:X8) > 15)) %>%
ungroup()
# # A tibble: 3 x 9
# X1 X2 X3 X4 X5 X6 X7 X8 foo
# <int> <int> <int> <int> <int> <int> <int> <int> <int>
# 1 17 10 24 7 23 2 22 12 4
# 2 5 4 15 20 14 19 6 11 2
# 3 1 18 8 9 21 3 16 13 3
Sample data:
set.seed(42)
df <- data.frame(matrix(sample(24), nrow=3))
df
# X1 X2 X3 X4 X5 X6 X7 X8
# 1 17 10 24 7 23 2 22 12
# 2 5 4 15 20 14 19 6 11
# 3 1 18 8 9 21 3 16 13

Related

Add new columns with defined values in R

I have a data.table named dmat. I want to add each character of missing_snps to dmat as new column and assign all rows as zero. The output remains in the same class as it was.
I would appreciate any suggestion.
dmat <- structure(list(`1:27950613:G:A` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27950883:CTA:C` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27952180:A:G` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27953106:A:G` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27953374:G:T` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27953514:T:TA` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27953608:T:C` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27954027:G:A` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27954415:T:C` = c(0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), `1:27962685:T:C` = c(0L, 0L, 0L, 0L, 0L, 1L, 0L,
0L, 0L, 0L)), row.names = c(NA, -10L), class = c("tbl_df", "tbl",
"data.frame"))
missing_snps <- c("1:169858888:G:A", "1:16985867657:T:A", "1:132862874:G:A")
dmat[,c("1:169858888:G:A", "1:16985867657:T:A", "1:132862874:G:A")] <- 0
or dmat[, missing_snps] <- 0
Using data.table,
dmat <- setDT(dmat)
missing_snps <- c("1:169858888:G:A", "1:16985867657:T:A", "1:132862874:G:A")
dmat[,(missing_snps ):=0]
Output
> dmat[,..missing_snps ]
1:169858888:G:A 1:16985867657:T:A 1:132862874:G:A
1: 0 0 0
2: 0 0 0
3: 0 0 0
4: 0 0 0
5: 0 0 0
6: 0 0 0
7: 0 0 0
8: 0 0 0
9: 0 0 0
10: 0 0 0
The columns you want to mutate has been added.

How to gather dataframe to make columns into a single column

I have this data:
structure(list(id = 1:6, arthritis = c(1L, 0L, 0L, 0L, 0L, 1L
), asthma = c(0L, 0L, 0L, 0L, 0L, 0L), cancer = c(0L, 0L, 0L,
0L, 0L, 0L), cerebvascdz = c(0L, 0L, 0L, 0L, 0L, 0L), chf = c(0L,
0L, 0L, 0L, 0L, 0L), crf = c(0L, 0L, 0L, 0L, 0L, 0L), copd = c(0L,
0L, 0L, 0L, 0L, 0L), depression = c(0L, 0L, 0L, 1L, 1L, 1L),
diabetes = c(0L, 0L, 0L, 0L, 0L, 0L), hyperlipid = c(1L,
0L, 1L, 0L, 1L, 0L), htn = c(1L, 0L, 1L, 1L, 0L, 1L), ihd = c(1L,
0L, 0L, 0L, 0L, 0L), obesity = c(0L, 0L, 0L, 0L, 0L, 0L),
osteoporosis = c(0L, 0L, 0L, 0L, 0L, 1L)), row.names = c(NA,
6L), class = "data.frame")
which contains an id for a patient. all the rest of the columns are comorbidities that the patient might have, designated as a boolean.
I'm trying to use the gather method to flip the table around, as shown like this. Every comorbidity that the patient has is supposed to be populated on the right with the patient id on the left.
I'm pretty sure I'm supposed to be using the gather function, but I can't seem to get this working. Does anyone have any insight into what I should be doing to have the frame switch to the required format?
Here is the proper code
pmh %>%
gather(diagnosis,num, arthritis:osteoporosis) %>%
arrange(id) %>%
filter(num == 1)
I'm new to R and I think I had misunderstood the first argument that gather takes.

How to select highest value of col in r

i have one data frame that has repetitive lines. I want to remove repetitive rows and select the row for each sample_id that is col with the highest value of each count. How can i do that?
Sample data (from the comments):
structure(list(gene_id = c("ENSG00000000003", "ENSG00000000003",
"ENSG00000000003", "ENSG00000000003", "G00000000003", "G00000000003",
"G00000000003", "G00000000003", "G00000000003", "G00000000003"
), DO221539 = c(681L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), DO221540 = c(148L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), DO221541 = c(650L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L), DO221542 = c(258L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L), DO221543 = c(57L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L), DO221544 = c(224L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L), DO221545 = c(60L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), DO221546 = c(161L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), DO224575 = c(15L, 0L, 0L,
0L, 0L, 949L, 0L, 0L, 0L, 0L)), class = "data.frame", row.names = c(NA,
-10L))
i want the out put to be
structure(list(gene_id = c("ENSG00000000003")
,DO221539 = 681L,DO221540 = 148L ,DO221541 = 650L, DO221542 = 258L
, DO221543 = 57L, DO221544 = 224L, DO221545 = 60L, DO221546 = 61L, DO224575 = 949L, class = "data.frame", row.names = c(NA,
-10L))
We can group by 'gene_id' and get the max of each column with summarise_all
library(tidyverse)
df1 %>%
group_by(gene_id) %>%
summarise_all(max)

prediction_regression_tree_ caret: Error in '[.data.frame'(m, labs) : undefined columns selected

Im trying to train a regression tree in using the train-function from caret. It worked with a linear model. But when I tried a regression tree the following error came: Error in '[.data.frame'(m, labs) : undefined columns selected
the data frame contains of 450+ dummy variables made from categorical variables using the fastDummies-package. Is it a problem that the data frame consists of that many dummies, where there could be few 1's and many zeroes in each variable?
I have tried to versions:
model_reg_tree <- train(
x = data_train[, names(data_train) != "Outcome"],
y = data_train$Outcome,
data = data_train,
method = 'rpart',
tuneLength = 10,
trControl = kontroller_cv)
and
model_reg_træ <- train(
Outcome ~ .,
data = data_train,
method = 'rpart',
tuneLength = 10,
trControl = kontroller_cv)
the controls:
kontroller_cv <- trainControl(
method = "cv",
number = 10 ,
summaryFunction = defaultSummary,
verboseIter = TRUE,
index = folds
)
data (only some of it, did not have space enough to all of it)
dput(head(data_train))
structure(list(Medlem_Køn = c(1L, 1L, 1L, 1L, 1L, 1L), Alder_ind = c(20,
20, 54, 36, 51, 51), Elev_ind = c(0L, 0L, 0L, 0L, 0L, 0L), Elev_ud = c(0L,
0L, 0L, 0L, 0L, 0L), Ledig_ind = c(1L, 1L, 1L, 1L, 1L, 1L), Outcome = c(492L,
1158L, 2161L, 7365L, 8522L, 5326L), PostNr_ud_87 = c(0L, 0L,
0L, 0L, 0L, 0L), PostNr_ud_47 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_98 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_74 = c(0L, 0L, 0L, 0L, 0L, 0L),
PostNr_ud_55 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_64 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_94 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_86 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_90 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_52 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_95 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_62 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_54 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_85 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_58 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_93 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_63 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_26 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_67 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_42 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_77 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_00 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_99 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_20 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_71 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_89 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_41 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_92 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_75 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_76 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_44 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_65 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_57 = c(0L,
0L, 0L, 0L, 1L, 0L), PostNr_ud_49 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_45 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_78 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_60 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_84 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_59 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_88 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_61 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_29 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_82 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_34 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_56 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_68 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_83 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_96 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_69 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_24 = c(0L, 1L, 0L, 0L, 0L, 0L), PostNr_ud_28 = c(0L,
0L, 1L, 0L, 0L, 0L), PostNr_ud_72 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_97 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_32 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_40 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_35 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_37 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_Odense = c(0L, 0L, 0L, 0L,
0L, 0L), PostNr_ud_33 = c(1L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_66 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_79 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_70 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_21 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_30 = c(0L, 0L, 0L, 0L, 0L,
1L), PostNr_ud_53 = c(0L, 0L, 0L, 1L, 0L, 0L), PostNr_ud_73 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_36 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_Frd_c = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_23 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_27 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_43 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_22 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_46 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_48 = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_80 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_25 = c(0L, 0L, 0L, 0L, 0L,
0L), PostNr_ud_Kbh_v = c(0L, 0L, 0L, 0L, 0L, 0L), PostNr_ud_31 = c(0L,
0L, 0L, 0L, 0L, 0L), PostNr_ud_Kbh_K = c(0L, 0L, 0L, 0L,
0L, 0L), `Sektor_ind_Pædagogisk Sektor` = c(1L, 0L, 0L, 0L,
0L, 0L), `Sektor_ind_Social- og Sundhedssektoren` = c(0L,
1L, 0L, 1L, 0L, 0L), `Sektor_ind_Teknik- og Servicesektoren` = c(0L,
0L, 0L, 0L, 0L, 0L), `Sektor_ind_Kost- og Servicesektoren` = c(0L,
0L, 1L, 0L, 0L, 1L), `Sektor_ind_Uden sektor` = c(0L, 0L,
0L, 0L, 1L, 0L), Stilling_ind_Dagplejer = c(0L, 0L, 0L, 0L,
0L, 0L), Stilling_ind_Sygehjælpere = c(0L, 0L, 0L, 1L, 0L,
0L), `Stilling_ind_Anden stilling` = c(0L, 0L, 1L, 0L, 1L,
1L), `Stilling_ind_Social og sundhedshjælper` = c(0L, 1L,
0L, 0L, 0L, 0L), `Stilling_ind_Social og sundhedsassistent` = c(0L,
0L, 0L, 0L, 0L, 0L), Stilling_ind_Pædagogmedhjælper = c(1L,
0L, 0L, 0L, 0L, 0L), Stilling_ind_Hjemmehjælper = c(0L, 0L,
0L, 0L, 0L, 0L), `Stilling_ind_Pædagog, Dag - Københavns Kommune` = c(0L,
0L, 0L, 0L, 0L, 0L), `Stilling_ind_Pædagogisk assistent - Dag-området` = c(0L,
0L, 0L, 0L, 0L, 0L), Leder_ud_Nej = c(1L, 1L, 1L, 1L, 1L,
1L), `Leder_ud_Praksisnær ledelse` = c(0L, 0L, 0L, 0L, 0L,
0L), `Leder_ud_Strategisk ledelse` = c(0L, 0L, 0L, 0L, 0L,
0L), `Afd_navn_ind_FOA Horsens` = c(0L, 0L, 0L, 0L, 0L, 0L
), `Afd_navn_ind_Næstved, Nedlagt` = c(0L, 0L, 0L, 0L, 0L,
0L), `Afd_navn_ind_FOA Vendsyssel` = c(0L, 0L, 0L, 0L, 0L,
0L), `Afd_navn_ind_FOA Herning` = c(0L, 0L, 0L, 0L, 0L, 0L
), `Afd_navn_ind_Ikke defineret konv.` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Sønderborg` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Nordjylland` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Silkeb-Skanderbo` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Odense` = c(0L, 0L, 0L,
1L, 0L, 0L), `Afd_navn_ind_FOA Randers` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Tønder,Nedlagt` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_PMF Djursland,Nedlag` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Sydfyn` = c(0L, 0L,
0L, 0L, 1L, 0L), `Afd_navn_ind_FOA Aabenraa,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), Afd_navn_ind_KLS = c(0L, 0L, 1L, 0L,
0L, 0L), `Afd_navn_ind_FOA Esbjerg` = c(0L, 0L, 0L, 0L, 0L,
0L), `Afd_navn_ind_FOA Slagelse,Nedlagt` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_FOA Thisted-Morsø` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Hillerød,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 1L), `Afd_navn_ind_FOA Viborg` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Frederikshavn` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA SOSU` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Mariagerfjord` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Vejle` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Århus` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_FOA Varde` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_PMF Sydøstjy,Nedlagt` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Brønderslev,Nedl` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Holstebro` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_Kalundborg,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Kolding` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Lolland` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_FOA Sjælland omr Hol` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF mellem broerne,N` = c(0L,
0L, 0L, 0L, 0L, 0L), Afd_navn_ind_LFS = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Vestlolland,Nedl` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Skive` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_FOA Sønderjylland` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Vojens,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Helsingør,Nedlag` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Nordsjælland` = c(0L,
1L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA 1` = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_FOA Frederikssund` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Fyn` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_FOA Bornholm` = c(0L, 0L, 0L, 0L,
0L, 0L), `Afd_navn_ind_Odsher-Svinn,Nedlagt` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Sjælland omr Nor` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Vendsyssel,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Lillebælt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Roskilde` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Fredericia,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Ringsted,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Middelfart,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Østlolland,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_TF,Nedlagt` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Morsø,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Køge` = c(0L, 0L,
0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Ringkøb,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Guldborgsund` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Ribe,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_Sydsjælland, Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Sjylland,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA/PMF Kbh. Syd` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Viborg amt,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_Møn, Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Himmerland,Nedla` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Århus,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Sydsjælland` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Kbh/frb,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF afdeling 4` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_FOA Sjælland omr Mid` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Frederiksborg,Ne` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF afdeling 1` = c(1L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_PMF Silkeborg,Nedlag` = c(0L,
0L, 0L, 0L, 0L, 0L), Afd_navn_ind_Afd.99 = c(0L, 0L, 0L,
0L, 0L, 0L), `Afd_navn_ind_PMF Bornholm,Nedlagt` = c(0L,
0L, 0L, 0L, 0L, 0L), `Afd_navn_ind_Tidl. PMF` = c(0L, 0L,
0L, 0L, 0L, 0L), MedlemstypeOmråde_ind_Erhvervsaktiv = c(1L,
1L, 1L, 1L, 1L, 1L), MedlemstypeOmråde_ind_Pensionist = c(0L,
0L, 0L, 0L, 0L, 0L), MedlemstypeOmråde_ind_Hvilende = c(0L,
0L, 0L, 0L, 0L, 0L), MedlemstypeOmråde_ind_Efterløn = c(0L,
0L, 0L, 0L, 0L, 0L), MedlemstypeOmråde_ud_Erhvervsaktiv = c(1L,
1L, 1L, 1L, 0L, 0L), MedlemstypeOmråde_ud_Efterløn = c(0L,
0L, 0L, 0L, 0L, 0L), MedlemstypeOmråde_ud_Pensionist = c(0L,
0L, 0L, 0L, 1L, 1L), MedlemstypeOmråde_ud_Hvilende = c(0L,
0L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Fuldtid o 30 år u/efbid` = c(0L,
0L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Fleksibel efterløn, fuldtid` = c(0L,
0L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Anden medlemstype` = c(0L,
0L, 0L, 1L, 0L, 0L), `Medlemstype_ud_Pensionist over 65 år` = c(0L,
0L, 0L, 0L, 1L, 1L), `Medlemstype_ud_Fuldtid o 60 år med efterlønsbevis` = c(0L,
0L, 1L, 0L, 0L, 0L), `Medlemstype_ud_Fuldtid m/efterlønsbidrag` = c(0L,
0L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Forbund, fuldtid` = c(1L,
1L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Pensionist under 65 år` = c(0L,
0L, 0L, 0L, 0L, 0L), `Medlemstype_ud_Fuldtid u 30 år u/efbid` = c(0L,
0L, 0L, 0L, 0L, 0L), `Sektor_ud_Pædagogisk Sektor` = c(1L,
0L, 0L, 0L, 0L, 0L), `Sektor_ud_Social- og Sundhedssektoren` = c(0L,
1L, 0L, 1L, 1L, 0L), `Sektor_ud_Teknik- og Servicesektoren` = c(0L,
0L, 0L, 0L, 0L, 0L), `Sektor_ud_Uden sektor` = c(0L, 0L,
0L, 0L, 0L, 0L), `Sektor_ud_Kost- og Servicesektoren` = c(0L,
0L, 1L, 0L, 0L, 1L), Fagruppe_ud_Dagplejere = c(0L, 0L, 0L,
0L, 0L, 0L), Fagruppe_ud_Sygehjælpere = c(0L, 0L, 0L, 1L,
0L, 0L), Fagruppe_ud_Plejere = c(0L, 0L, 0L, 0L, 0L, 0L),
`Fagruppe_ud_FOA RBR Rådhus, Biblioteks- og Regionsbetjente` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Uden sektortilhør` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Social-og sundhedshjælpere` = c(0L,
1L, 0L, 0L, 0L, 0L), Fagruppe_ud_Køkken = c(0L, 0L, 0L, 0L,
0L, 0L), Fagruppe_ud_Rengøring = c(0L, 0L, 0L, 0L, 0L, 1L
), `Fagruppe_ud_Social-og sundhedsassistenter` = c(0L, 0L,
0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Plejehjemstekniker` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Hjemmehjælpere = c(0L, 0L,
0L, 0L, 1L, 0L), `Fagruppe_ud_Dagplejepædagoger mv` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Pædagogmedhjælpere og pædagogiske assistenter` = c(1L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Portører = c(0L, 0L, 0L,
0L, 0L, 0L), `Fagruppe_ud_Personale ved højskoler og private kantiner mv` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Plejehjemsassistenter = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Formænd under Formandsoverenskomsten` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Brand og Redning` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Beskæftigelsesvejledere = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Værksstedsassistenter/-ledere` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Omsorgsmedhjælpere og pædagogiske assistenter` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Trafikservice` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Ledere og Mellemledere (Tidl. Hjemmehjælpsledere)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Serviceassistenter og -medarbejdere` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Ledende servicepersonale` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Øvrige indenfor social-og sundheds sektor` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Regionsansatte uden for FOA` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_LFS, dag` = c(0L, 0L, 0L,
0L, 0L, 0L), `Fagruppe_ud_FOA Teknisk Ledelse` = c(0L, 0L,
0L, 0L, 0L, 0L), Fagruppe_ud_Handicapledsagere = c(0L, 0L,
0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Søfart` = c(0L, 0L, 0L,
0L, 0L, 0L), `Fagruppe_ud_Øvrige indenfor teknik-og service sektoren` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Sport (Bade- og Idrætsassistenter)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Parkering` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Husmedhjælpere i staten` = c(0L,
0L, 1L, 0L, 0L, 0L), `Fagruppe_ud_Øvrige indenfor pædagogisk sektor` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Kantineledere = c(0L, 0L,
0L, 0L, 0L, 0L), `Fagruppe_ud_LFS, døgn` = c(0L, 0L, 0L,
0L, 0L, 0L), Fagruppe_ud_Handicaphjælpere = c(0L, 0L, 0L,
0L, 0L, 0L), `Fagruppe_ud_Servicechefer/-ledere og teamkoordinatorer` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Specialarbejdere = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Øvrige indenfor Kost-og service sektoren` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Bybuschauffører` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Håndværkere = c(0L, 0L,
0L, 0L, 0L, 0L), `Fagruppe_ud_Neurofysiologi assistenter` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Vaskeripersonale = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Teknik og Service (Skoler)` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Fodterapeuter = c(0L, 0L,
0L, 0L, 0L, 0L), `Fagruppe_ud_UDGÅET Idrætsassistenter` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Legepladsansatte = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_UDGÅET Arbejdsledere` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Rengøringsledere = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Pædagogiske konsulenter` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Piccoloer og Piccoliner` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Tilsynsførende assistenter` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Operationsteknikere = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Kedel-, maskin- og motorpassere` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_Pædagogiske pladsanvisere` = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_FOA Ambulance` = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Gymnastikpædagoger = c(0L,
0L, 0L, 0L, 0L, 0L), Fagruppe_ud_Miljøkontrollører = c(0L,
0L, 0L, 0L, 0L, 0L), `Fagruppe_ud_UDGÅET Skolebetjente/-pedeller og -medhjælpere` = c(0L,
0L, 0L, 0L, 0L, 0L), Stilling_ud_Dagplejere = c(0L, 0L, 0L,
0L, 0L, 0L), Stilling_ud_Sygehjælpere = c(0L, 0L, 0L, 1L,
0L, 0L), Stilling_ud_Anden_stilling = c(0L, 1L, 1L, 0L, 0L,
1L), `Stilling_ud_Social og sundhedshjælper` = c(0L, 0L,
0L, 0L, 0L, 0L), Stilling_ud_Husassistent = c(0L, 0L, 0L,
0L, 0L, 0L), `Stilling_ud_Social og sundhedsassistent` = c(0L,
0L, 0L, 0L, 0L, 0L), Stilling_ud_Hjemmehjælper = c(0L, 0L,
0L, 0L, 1L, 0L), Stilling_ud_Pædagogmedhjælper = c(1L, 0L,
0L, 0L, 0L, 0L), `Stilling_ud_Pædagogisk assistent - Dag-området` = c(0L,
0L, 0L, 0L, 0L, 0L), Stilling_ud_Pædagog = c(0L, 0L, 0L,
0L, 0L, 0L), `Overflyttet_fra_akasse_Det Faglige Hus - A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_BUPL-A-Børne- og ungdomspædagogernes A-k` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Ikke overflyttet` = c(1L,
1L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_HK Hovedstaden` = c(0L,
0L, 1L, 0L, 0L, 1L), `Overflyttet_fra_akasse_3F-Fælles faglig A-kasse` = c(0L,
0L, 0L, 1L, 0L, 0L), `Overflyttet_fra_akasse_Huslige arbejderes a-kasse` = c(0L,
0L, 0L, 0L, 1L, 0L), `Overflyttet_fra_akasse_Pædagogiske Medhjælperes Fælles A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Kvindelige Arbejderes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_KRIFA-Kristelig A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_bryggeriarb. a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_NNF-Fødevareforbundets A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Frisørfagets og keramikernes a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_DLF-A Lærernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_TL-Teknikernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Ledernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Træ-Industri-Bygs arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Business Danmarks A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Træindustriarb. arb.løsh.kas.` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Beklædnings- og Tekstilarbejder A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_DSA-Din Sundhedsfaglige A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_FTF-A Funktionærernes og Tjenestemænd.` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Metalarbejdernes Arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_FFA-Frie Funktionærers A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Grafisk Arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_kommunalarb. arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_DANA-A-kasse for selvstændige` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_RBF's Arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_FOA-Fag og Arbejdes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_hotel. og rest.pers. a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_ASE = c(0L, 0L,
0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Funktionærernes og Servicefagenes A-kas.` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_SL-Socialpædagogernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Min A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_A-kasse for Journalistik, Kommunikation` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Gastronomernes a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Forsvarets Arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_CA A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_BFA-Byggefagenes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_MA-Magistrenes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_AAK-Akademikernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Norge = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_EL-Fagets A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Færøerne = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Tjenerne, musik. og artis. a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Sverige = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Tyskland = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Akademikernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Murerfagets arb.løsh.kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Frisører, Artister og Maritim A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Bogb.- og kartonagearb. a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Island = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Storbritanien = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Bogtrykfagets a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Sø-restaurationens a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Prosa og Merkonomernes A-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Spanien = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Irland = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Jurist- og økonom. a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Journalisternes Arbejdsløshedskasse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Overflyttet_fra_akasse_Reprofagets a-kasse` = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Grækenland = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Holland = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_3.lande = c(0L,
0L, 0L, 0L, 0L, 0L), Overflyttet_fra_akasse_Østrig = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Ingen Hverv` = c(1L,
1L, 1L, 1L, 1L, 1L), `Hverv_FoaHvervTypeNavn_ud_Andre hverv` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Sektorbestyrelse = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Andre afdelingshverv` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Afd. sektorformand` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Afdelingsbestyrelse = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Bestyrelsesudvalg = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_SOSU-uddannelsesråd` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Afdelingsnæstformand = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Ungdomsansvarlig = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Ældreråd = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Fællesbest. SOSU` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_PGU uddannelsesråd` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Klubformand = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_HB-suppleant(amt)` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Amtselevkoordinator = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_AMU udd-udvalg` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_2. HB-suppl. (sekt)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Faglig sekretær` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Afd. daglige ledelse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Elevansvarlig(SOSU)` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Gæstelærer = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Fanebærer = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Faggrupperepræsentan = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_PGU udd-råd supplean` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Afdelingskassere = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Seniorklub = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Kritisk revisorsupp.` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Afdelingsformand = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_HB-medlem(amt)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_Kritisk revisor` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_AMU udd-udvalg suppl` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Ungdomsnetværket = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Landselevbestyrelse = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ud_Sektorformand = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_3. HB-suppl. (sekt)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ud_HB-medlem(sektor)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Ingen Hverv` = c(1L,
1L, 1L, 1L, 1L, 1L), `Hverv_FoaHvervTypeNavn_ind_Andre hverv` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Andre afdelingshverv` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Bestyrelsesudvalg = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Sektorbestyrelse = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Gæstelærer = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_2. HB-suppl. (sekt)` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Afdelingsbestyrelse = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Afd. daglige ledelse` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_SOSU-uddannelsesråd` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Afd. sektorformand` = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Fanebærer = c(0L,
0L, 0L, 0L, 0L, 0L), Hverv_FoaHvervTypeNavn_ind_Sektornæstformand = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Kritisk revisor` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_Fællesbest. SOSU` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_HB-medlem(sektor)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_FoaHvervTypeNavn_ind_1. HB-suppl. (sekt)` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_Tillidshverv_ind_MED SU/AMO nederste` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_Tillidshverv_ind_MED SU/AMO næst nederst` = c(0L,
0L, 0L, 0L, 0L, 0L), `Hverv_Tillidshverv_ind_Lokalt MED udvalg supp.` = c(0L,
0L, 0L, 0L, 0L, 0L)), row.names = c(NA, -6L), class = c("tbl_df", "tbl",
"data.frame"))
Problem
Your variable names are unclean. For instance, they include spaces.
Solution
To use the formula interface, you must first clean up the variable names. An easy alternative is to use the janitor package. For instance:
library(janitor)
data_train <- clean_names(data_train)
model_reg_tree <- train(
outcome ~ .,
data = data_train,
method = 'rpart',
tuneLength = 10,
trControl = kontroller_cv
)
Alternative solution
You can still use the x =, y= interface without cleaning the names, but then you should not provide the data argument. (However, I strongly suggest that you clean the variable names). For instance:
model_reg_tree <- train(
x = data_train[, names(data_train) != "Outcome"],
y = data_train$Outcome,
method = 'rpart',
tuneLength = 10,
trControl = kontroller_cv
)

Barplots with percentages of different variables

Given following example:
structure(list(jdgcbrbR = c(0L, 1L, 1L, 1L, 1L, 0L, 0L, 0L),
ctprpwrR = c(0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L), hrshsntaR = c(0L,
0L, 1L, 0L, 0L, 0L, 0L, 0L), dbctvrdR = c(0L, 0L, 1L, 1L,
0L, 0L, 0L, 0L), lwstrobR = c(0L, 0L, 1L, 0L, 0L, 0L, 0L,
0L), rgbrklwR = c(0L, 0L, 1L, 1L, 0L, 0L, 0L, 0L), ctinpltR = c(0L,
0L, 1L, 1L, 0L, 0L, 0L, 0L), stcbg2tR = c(0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L), tmprsR = c(NA, NA, NA, 0L, 0L, NA, NA, NA
), caplcstR = c(0L, 0L, 1L, 0L, 1L, 0L, 0L, 0L), widprsnR = c(0L,
0L, 1L, 0L, 0L, 0L, 0L, 0L), wevdctR = c(0L, 0L, 1L, 0L,
0L, 0L, 0L, 0L)), .Names = c("jdgcbrbR", "ctprpwrR", "hrshsntaR",
"dbctvrdR", "lwstrobR", "rgbrklwR", "ctinpltR", "stcbg2tR", "tmprsR",
"caplcstR", "widprsnR", "wevdctR"), row.names = 747:754, class = "data.frame")
How could I create a set of barplots, graphing the percentage of 1-values in each variable, thus giving a nice overview of the evolution of the percentage of 1's.
So far I tried creating the percentages (which failed because nrow is perceived as NULL):
pct_jdgcbrbR <- (sum(jdgcbrbR) / nrow(jdgcbrbR) * 100)
pct_jdgcbrbR
And I found the barplot function which could be usefull:
barplot(percentages, main="INR",
xlab="varnames")
The result should look something like this example I made in Excel:
The following works for me, assuming your data.frame is called "temp":
barplot((colSums(temp, na.rm=TRUE)/nrow(temp))*100)

Resources