Skip to content

Instantly share code, notes, and snippets.

@ggteixeira
Last active August 12, 2020 16:28
Show Gist options
  • Save ggteixeira/06d412a0ecabdf025740707582639424 to your computer and use it in GitHub Desktop.
Save ggteixeira/06d412a0ecabdf025740707582639424 to your computer and use it in GitHub Desktop.
Encontrar padrões de synsets no corpus usando o egrep
  • T, como T: grep -o -E "[[:alnum:]]+ como [[:alnum:]]+" corpus_completo.txt >> matches.txt
  • T, tal(is) como T: grep -o -E "[[:alnum:]]+ (tal como|tais como) [[:alnum:]]+" corpus_completo.txt
  • tal(is) T como T: grep -o -E "(tal|tais) [[:alnum:]]+ como [[:alnum:]]+" corpus_completo.txt
  • T, incluindo T: grep -o -E "[[:alnum:]]+, incluindo [[:alnum:]]+" corpus_completo.txt
  • T especialmente T: grep -o -E "[[:alnum:]]+, especialmente [[:alnum:]]+" corpus_completo.txt
  • T principalmente T: grep -o -E "\w*, principalmente \w*" corpus_completo.txt
  • T particularmente T: grep -o -E "\w*, particularmente \w*" corpus_completo.txt
  • T, em especial, T: grep -E "\w*, em especial \w*" corpus_completo.txt
  • T, em particular, T: grep -E "\w*, em particular \w*" corpus_completo.txt
  • T, de maneira especial, T: grep -E "\w*, de maneira especial \w*" corpus_completo.txt
  • T, sobretudo, T: grep -E "\w*, sobretudo \w*" corpus_completo.txt

grep -o -E "[[:alnum:]]+ como [[:alnum:]]+" corpus_completo.txt > matches.txt && grep -o -E "[[:alnum:]]+ (tal como|tais como) [[:alnum:]]+" corpus_completo.txt >> matches.txt && grep -o -E "(tal|tais) [[:alnum:]]+ como [[:alnum:]]+" corpus_completo.txt >> matches.txt && grep -o -E "[[:alnum:]]+, incluindo [[:alnum:]]+" corpus_completo.txt >> matches.txt && grep -o -E "[[:alnum:]]+, especialmente [[:alnum:]]+" corpus_completo.txt >> matches.txt && grep -o -E "\w*, principalmente \w*" corpus_completo.txt >> matches.txt && grep -o -E "\w*, particularmente \w*" corpus_completo.txt >> matches.txt && grep -E "\w*, em especial \w*" corpus_completo.txt >> matches.txt && grep -E "\w*, de maneira especial \w*" corpus_completo.txt >> matches.txt && grep -E "\w*, sobretudo \w*" corpus_completo.txt >> matches.txt

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment