rmflight · November 11, 2018 19:16 · rmflight · Nov 11, 2018
diff --git a/remove_duplicate_rows_columns.R b/remove_duplicate_rows_columns.R
 ex_data = data.frame(A = c("A", "C", "E", "F", "G", "H", "I"),
                     B = c("B", "D", "A", "E", "I", "J", "K"),
                     C = "C",
                     stringsAsFactors = FALSE)

 irow = 2
 consider_cols = c("A", "B")
 all_entries = unlist(ex_data[1, consider_cols], use.names = FALSE)
 while (irow <= nrow(ex_data)) {
  message(c(irow, nrow(ex_data)))
  new_entries = unlist(ex_data[irow, consider_cols], use.names = FALSE)
  if (any(new_entries %in% all_entries)) {
    ex_data = ex_data[-irow, ]
  } else {
    all_entries = c(all_entries, new_entries)
    irow = irow + 1
  }
 }

 print(ex_data)
	ex_data = data.frame(A = c("A", "C", "E", "F", "G", "H", "I"),
	B = c("B", "D", "A", "E", "I", "J", "K"),
	C = "C",
	stringsAsFactors = FALSE)

	irow = 2
	consider_cols = c("A", "B")
	all_entries = unlist(ex_data[1, consider_cols], use.names = FALSE)
	while (irow <= nrow(ex_data)) {
	message(c(irow, nrow(ex_data)))
	new_entries = unlist(ex_data[irow, consider_cols], use.names = FALSE)
	if (any(new_entries %in% all_entries)) {
	ex_data = ex_data[-irow, ]
	} else {
	all_entries = c(all_entries, new_entries)
	irow = irow + 1
	}
	}

	print(ex_data)
No results found