Skip to content

Instantly share code, notes, and snippets.

View sergiospagnuolo's full-sized avatar
🐕‍🦺

Sérgio Spagnuolo sergiospagnuolo

🐕‍🦺
View GitHub Profile
@sergiospagnuolo
sergiospagnuolo / data.R
Created October 9, 2024 16:25
starlink - apreensões - ibama
library(tidyverse)
library(readr)
#### OS DADOS PODEM SER ENCONTRADOS NO LINK
#### https://dadosabertos.ibama.gov.br/dataset/fiscalizacao-termo-de-apreensao
d <- read_delim("termo_apreensao.csv", delim = ";")
c <- read_delim("bem_apreendido.csv", delim = ";")
d <- d %>% select(SEQ_TAD, DAT_TAD, DES_TAD, NOM_MUNICIPIO, SIG_UF, NUM_LONGITUDE_TAD, NUM_LATITUDE_TAD)
@sergiospagnuolo
sergiospagnuolo / funcao_robots.R
Created October 29, 2024 16:09
Identifica presença de parâmetros de agentes de IA em arquivos robots.txt
library(httr)
library(stringr)
# Agentes de AI, mapeados do nytimes.com/robots.txt
ai_keywords <- c(
"GPTBot", "ChatGPT-User", "PerplexityBot", "Amazonbot", "ClaudeBot",
"Omgilibot", "FacebookBot", "Applebot", "Applebot-Extended", "anthropic-ai", "Bytespider",
"Claude-Web", "YouBot", "CCBot", "Google-Extended", "Quora-Bot", "Meta-ExternalAgent"
)