paulrougieux · October 3, 2021 06:29 · goodyonsen · Oct 3, 2021 · paulrougieux · Oct 3, 2021
diff --git a/scraplinks.R b/scraplinks.R
 #' Extract link texts and urls from a web page
 #' @param url character an url
 #' @return a data frame of link text and urls
 #' @examples
 #' \dontrun{
 #' scraplinks("http://localhost/")
 #' glinks <- scraplinks("http://google.com/")
 #' }
 #' @export
 scraplinks <- function(url){
    # Create an html document from the url
    webpage <- xml2::read_html(url)
    # Extract the URLs
    url_ <- webpage %>%
        rvest::html_nodes("a") %>%
        rvest::html_attr("href")
    # Extract the link text
    link_ <- webpage %>%
        rvest::html_nodes("a") %>%
        rvest::html_text()
    return(tibble(link = link_, url = url_))
 }
	#' Extract link texts and urls from a web page
	#' @param url character an url
	#' @return a data frame of link text and urls
	#' @examples
	#' \dontrun{
	#' scraplinks("http://localhost/")
	#' glinks <- scraplinks("http://google.com/")
	#' }
	#' @export
	scraplinks <- function(url){
	# Create an html document from the url
	webpage <- xml2::read_html(url)
	# Extract the URLs
	url_ <- webpage %>%
	rvest::html_nodes("a") %>%
	rvest::html_attr("href")
	# Extract the link text
	link_ <- webpage %>%
	rvest::html_nodes("a") %>%
	rvest::html_text()
	return(tibble(link = link_, url = url_))
	}
No results found