Created
June 6, 2020 18:30
-
-
Save arademaker/e10d43992287008ef044630d5ab12e9c to your computer and use it in GitHub Desktop.
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
ar@leme udp % awk '$3 ~ /^(irmã|irmão|pai|mãe|tio|tia|bisavô|bisavó|primo|prima|avô|avó|sobrinho|sobrinha|cunhado|cunhada|parente)$/ {print $2,$3}' *.conllu | sort | uniq -c | sort -nr | |
1622 pai pai | |
1283 irmão irmão | |
336 tio tio | |
336 irmãos irmão | |
315 Sobrinho sobrinho | |
277 avô avô | |
272 primo primo | |
256 mãe mãe | |
188 sobrinho sobrinho | |
172 parentes parente | |
131 irmã irmã | |
122 pais pai | |
85 cunhado cunhado | |
62 primos primo | |
37 bisavô bisavô | |
34 tios tio | |
30 sobrinhos sobrinho | |
29 parente parente | |
27 prima primo | |
24 sobrinha sobrinha | |
20 mães pai | |
19 avós avó | |
18 avó avó | |
16 tia tia | |
13 irmãs irmã | |
11 cunhada cunhada | |
11 Irmão irmão | |
10 Pai pai | |
9 Mãe mãe | |
8 prima prima | |
7 PAI pai | |
6 cunhados cunhado | |
5 irmãs irmão | |
4 irmã irmão | |
4 bisavó bisavó | |
4 Irmã irmã | |
2 tias tia | |
2 Prima prima | |
2 Parentes parente | |
1 primas primo | |
1 SOBRINHO sobrinho | |
1 Parente parente |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment