-
Star
(188)
You must be signed in to star a gist -
Fork
(53)
You must be signed in to fork a gist
-
-
Save alopes/5358189 to your computer and use it in GitHub Desktop.
| de | |
| a | |
| o | |
| que | |
| e | |
| do | |
| da | |
| em | |
| um | |
| para | |
| é | |
| com | |
| não | |
| uma | |
| os | |
| no | |
| se | |
| na | |
| por | |
| mais | |
| as | |
| dos | |
| como | |
| mas | |
| foi | |
| ao | |
| ele | |
| das | |
| tem | |
| à | |
| seu | |
| sua | |
| ou | |
| ser | |
| quando | |
| muito | |
| há | |
| nos | |
| já | |
| está | |
| eu | |
| também | |
| só | |
| pelo | |
| pela | |
| até | |
| isso | |
| ela | |
| entre | |
| era | |
| depois | |
| sem | |
| mesmo | |
| aos | |
| ter | |
| seus | |
| quem | |
| nas | |
| me | |
| esse | |
| eles | |
| estão | |
| você | |
| tinha | |
| foram | |
| essa | |
| num | |
| nem | |
| suas | |
| meu | |
| às | |
| minha | |
| têm | |
| numa | |
| pelos | |
| elas | |
| havia | |
| seja | |
| qual | |
| será | |
| nós | |
| tenho | |
| lhe | |
| deles | |
| essas | |
| esses | |
| pelas | |
| este | |
| fosse | |
| dele | |
| tu | |
| te | |
| vocês | |
| vos | |
| lhes | |
| meus | |
| minhas | |
| teu | |
| tua | |
| teus | |
| tuas | |
| nosso | |
| nossa | |
| nossos | |
| nossas | |
| dela | |
| delas | |
| esta | |
| estes | |
| estas | |
| aquele | |
| aquela | |
| aqueles | |
| aquelas | |
| isto | |
| aquilo | |
| estou | |
| está | |
| estamos | |
| estão | |
| estive | |
| esteve | |
| estivemos | |
| estiveram | |
| estava | |
| estávamos | |
| estavam | |
| estivera | |
| estivéramos | |
| esteja | |
| estejamos | |
| estejam | |
| estivesse | |
| estivéssemos | |
| estivessem | |
| estiver | |
| estivermos | |
| estiverem | |
| hei | |
| há | |
| havemos | |
| hão | |
| houve | |
| houvemos | |
| houveram | |
| houvera | |
| houvéramos | |
| haja | |
| hajamos | |
| hajam | |
| houvesse | |
| houvéssemos | |
| houvessem | |
| houver | |
| houvermos | |
| houverem | |
| houverei | |
| houverá | |
| houveremos | |
| houverão | |
| houveria | |
| houveríamos | |
| houveriam | |
| sou | |
| somos | |
| são | |
| era | |
| éramos | |
| eram | |
| fui | |
| foi | |
| fomos | |
| foram | |
| fora | |
| fôramos | |
| seja | |
| sejamos | |
| sejam | |
| fosse | |
| fôssemos | |
| fossem | |
| for | |
| formos | |
| forem | |
| serei | |
| será | |
| seremos | |
| serão | |
| seria | |
| seríamos | |
| seriam | |
| tenho | |
| tem | |
| temos | |
| tém | |
| tinha | |
| tínhamos | |
| tinham | |
| tive | |
| teve | |
| tivemos | |
| tiveram | |
| tivera | |
| tivéramos | |
| tenha | |
| tenhamos | |
| tenham | |
| tivesse | |
| tivéssemos | |
| tivessem | |
| tiver | |
| tivermos | |
| tiverem | |
| terei | |
| terá | |
| teremos | |
| terão | |
| teria | |
| teríamos | |
| teriam |
Obrigado!
Eu coloquei em formato de lista para facilitar :)
['de', 'a', 'o', 'que', 'e', 'do', 'da', 'em', 'um', 'para', 'é', 'com', 'não', 'uma', 'os', 'no', 'se', 'na', 'por', 'mais', 'as', 'dos', 'como', 'mas', 'foi', 'ao', 'ele', 'das', 'tem', 'à', 'seu', 'sua', 'ou', 'ser', 'quando', 'muito', 'há', 'nos', 'já', 'está', 'eu', 'também', 'só', 'pelo', 'pela', 'até', 'isso', 'ela', 'entre', 'era', 'depois', 'sem', 'mesmo', 'aos', 'ter', 'seus', 'quem', 'nas', 'me', 'esse', 'eles', 'estão', 'você', 'tinha', 'foram', 'essa', 'num', 'nem', 'suas', 'meu', 'às', 'minha', 'têm', 'numa', 'pelos', 'elas', 'havia', 'seja', 'qual', 'será', 'nós', 'tenho', 'lhe', 'deles', 'essas', 'esses', 'pelas', 'este', 'fosse', 'dele', 'tu', 'te', 'vocês', 'vos', 'lhes', 'meus', 'minhas', 'teu', 'tua', 'teus', 'tuas', 'nosso', 'nossa', 'nossos', 'nossas', 'dela', 'delas', 'esta', 'estes', 'estas', 'aquele', 'aquela', 'aqueles', 'aquelas', 'isto', 'aquilo', 'estou', 'está', 'estamos', 'estão', 'estive', 'esteve', 'estivemos', 'estiveram', 'estava', 'estávamos', 'estavam', 'estivera', 'estivéramos', 'esteja', 'estejamos', 'estejam', 'estivesse', 'estivéssemos', 'estivessem', 'estiver', 'estivermos', 'estiverem', 'hei', 'há', 'havemos', 'hão', 'houve', 'houvemos', 'houveram', 'houvera', 'houvéramos', 'haja', 'hajamos', 'hajam', 'houvesse', 'houvéssemos', 'houvessem', 'houver', 'houvermos', 'houverem', 'houverei', 'houverá', 'houveremos', 'houverão', 'houveria', 'houveríamos', 'houveriam', 'sou', 'somos', 'são', 'era', 'éramos', 'eram', 'fui', 'foi', 'fomos', 'foram', 'fora', 'fôramos', 'seja', 'sejamos', 'sejam', 'fosse', 'fôssemos', 'fossem', 'for', 'formos', 'forem', 'serei', 'será', 'seremos', 'serão', 'seria', 'seríamos', 'seriam', 'tenho', 'tem', 'temos', 'tém', 'tinha', 'tínhamos', 'tinham', 'tive', 'teve', 'tivemos', 'tiveram', 'tivera', 'tivéramos', 'tenha', 'tenhamos', 'tenham', 'tivesse', 'tivéssemos', 'tivessem', 'tiver', 'tivermos', 'tiverem', 'terei', 'terá', 'teremos', 'terão', 'teria', 'teríamos', 'teriam']
Para deixar de contribuição: 😄
Você pode importar uma lista de stop_words em português do módulo ntlk. e.g:
Instalação 🔧
pip install nltkUso 💪
>>> from nltk.corpus import stopwords
>>> pt_stp_words = stopwords.words('portuguese')
>>> pt_stp_words[:10]
['a', 'ao', 'aos', 'aquela', 'aquelas', 'aquele', 'aqueles', 'aquilo', 'as', 'até']Referências 🤓
Muito obrigada, ajudou muito.
Muito bom! obrigado pela dica 👍
Sem acentuação:
['de','a','o','que','e','do','da','em','um','para','e','com','nao','uma','os','no','se','na','por','mais','as','dos','como','mas','foi','ao','ele','das','tem','a','seu','sua','ou','ser','quando','muito','ha','nos','ja','esta','eu','tambem','so','pelo','pela','ate','isso','ela','entre','era','depois','sem','mesmo','aos','ter','seus','quem','nas','me','esse','eles','estao','voce','tinha','foram','essa','num','nem','suas','meu','as','minha','tem','numa','pelos','elas','havia','seja','qual','sera','nos','tenho','lhe','deles','essas','esses','pelas','este','fosse','dele','tu','te','voces','vos','lhes','meus','minhas','teu','tua','teus','tuas','nosso','nossa','nossos','nossas','dela','delas','esta','estes','estas','aquele','aquela','aqueles','aquelas','isto','aquilo','estou','esta','estamos','estao','estive','esteve','estivemos','estiveram','estava','estavamos','estavam','estivera','estiveramos','esteja','estejamos','estejam','estivesse','estivessemos','estivessem','estiver','estivermos','estiverem','hei','ha','havemos','hao','houve','houvemos','houveram','houvera','houveramos','haja','hajamos','hajam','houvesse','houvessemos','houvessem','houver','houvermos','houverem','houverei','houvera','houveremos','houverao','houveria','houveriamos','houveriam','sou','somos','sao','era','eramos','eram','fui','foi','fomos','foram','fora','foramos','seja','sejamos','sejam','fosse','fossemos','fossem','for','formos','forem','serei','sera','seremos','serao','seria','seriamos','seriam','tenho','tem','temos','tem','tinha','tinhamos','tinham','tive','teve','tivemos','tiveram','tivera','tiveramos','tenha','tenhamos','tenham','tivesse','tivessemos','tivessem','tiver','tivermos','tiverem','terei','tera','teremos','terao','teria','teriamos','teriam']
Valeu!
@AugustoBarros tem um typo na linha from ntlk.corpus import stopwords
nltk ao invés de ntlk.
Eu tentei aqui várias vezes e dando erro. hehe
Mas valeu pela força
Segue um pacote mais completo:
const words = [ 'a', 'à', 'adeus', 'agora', 'aí', 'ainda', 'além', 'algo', 'alguém', 'algum', 'alguma', 'algumas', 'alguns', 'ali', 'ampla', 'amplas', 'amplo', 'amplos', 'ano', 'anos', 'ante', 'antes', 'ao', 'aos', 'apenas', 'apoio', 'após', 'aquela', 'aquelas', 'aquele', 'aqueles', 'aqui', 'aquilo', 'área', 'as', 'às', 'assim', 'até', 'atrás', 'através', 'baixo', 'bastante', 'bem', 'boa', 'boas', 'bom', 'bons', 'breve', 'cá', 'cada', 'catorze', 'cedo', 'cento', 'certamente', 'certeza', 'cima', 'cinco', 'coisa', 'coisas', 'com', 'como', 'conselho', 'contra', 'contudo', 'custa', 'da', 'dá', 'dão', 'daquela', 'daquelas', 'daquele', 'daqueles', 'dar', 'das', 'de', 'debaixo', 'dela', 'delas', 'dele', 'deles', 'demais', 'dentro', 'depois', 'desde', 'dessa', 'dessas', 'desse', 'desses', 'desta', 'destas', 'deste', 'destes', 'deve', 'devem', 'devendo', 'dever', 'deverá', 'deverão', 'deveria', 'deveriam', 'devia', 'deviam', 'dez', 'dezanove', 'dezasseis', 'dezassete', 'dezoito', 'dia', 'diante', 'disse', 'disso', 'disto', 'dito', 'diz', 'dizem', 'dizer', 'do', 'dois', 'dos', 'doze', 'duas', 'dúvida', 'e', 'é', 'ela', 'elas', 'ele', 'eles', 'em', 'embora', 'enquanto', 'entre', 'era', 'eram', 'éramos', 'és', 'essa', 'essas', 'esse', 'esses', 'esta', 'está', 'estamos', 'estão', 'estar', 'estas', 'estás', 'estava', 'estavam', 'estávamos', 'este', 'esteja', 'estejam', 'estejamos', 'estes', 'esteve', 'estive', 'estivemos', 'estiver', 'estivera', 'estiveram', 'estivéramos', 'estiverem', 'estivermos', 'estivesse', 'estivessem', 'estivéssemos', 'estiveste', 'estivestes', 'estou', 'etc', 'eu', 'exemplo', 'faço', 'falta', 'favor', 'faz', 'fazeis', 'fazem', 'fazemos', 'fazendo', 'fazer', 'fazes', 'feita', 'feitas', 'feito', 'feitos', 'fez', 'fim', 'final', 'foi', 'fomos', 'for', 'fora', 'foram', 'fôramos', 'forem', 'forma', 'formos', 'fosse', 'fossem', 'fôssemos', 'foste', 'fostes', 'fui', 'geral', 'grande', 'grandes', 'grupo', 'há', 'haja', 'hajam', 'hajamos', 'hão', 'havemos', 'havia', 'hei', 'hoje', 'hora', 'horas', 'houve', 'houvemos', 'houver', 'houvera', 'houverá', 'houveram', 'houvéramos', 'houverão', 'houverei', 'houverem', 'houveremos', 'houveria', 'houveriam', 'houveríamos', 'houvermos', 'houvesse', 'houvessem', 'houvéssemos', 'isso', 'isto', 'já', 'la', 'lá', 'lado', 'lhe', 'lhes', 'lo', 'local', 'logo', 'longe', 'lugar', 'maior', 'maioria', 'mais', 'mal', 'mas', 'máximo', 'me', 'meio', 'menor', 'menos', 'mês', 'meses', 'mesma', 'mesmas', 'mesmo', 'mesmos', 'meu', 'meus', 'mil', 'minha', 'minhas', 'momento', 'muita', 'muitas', 'muito', 'muitos', 'na', 'nada', 'não', 'naquela', 'naquelas', 'naquele', 'naqueles', 'nas', 'nem', 'nenhum', 'nenhuma', 'nessa', 'nessas', 'nesse', 'nesses', 'nesta', 'nestas', 'neste', 'nestes', 'ninguém', 'nível', 'no', 'noite', 'nome', 'nos', 'nós', 'nossa', 'nossas', 'nosso', 'nossos', 'nova', 'novas', 'nove', 'novo', 'novos', 'num', 'numa', 'número', 'nunca', 'o', 'obra', 'obrigada', 'obrigado', 'oitava', 'oitavo', 'oito', 'onde', 'ontem', 'onze', 'os', 'ou', 'outra', 'outras', 'outro', 'outros', 'para', 'parece', 'parte', 'partir', 'paucas', 'pela', 'pelas', 'pelo', 'pelos', 'pequena', 'pequenas', 'pequeno', 'pequenos', 'per', 'perante', 'perto', 'pode', 'pude', 'pôde', 'podem', 'podendo', 'poder', 'poderia', 'poderiam', 'podia', 'podiam', 'põe', 'põem', 'pois', 'ponto', 'pontos', 'por', 'porém', 'porque', 'porquê', 'posição', 'possível', 'possivelmente', 'posso', 'pouca', 'poucas', 'pouco', 'poucos', 'primeira', 'primeiras', 'primeiro', 'primeiros', 'própria', 'próprias', 'próprio', 'próprios', 'próxima', 'próximas', 'próximo', 'próximos', 'pude', 'puderam', 'quais', 'quáis', 'qual', 'quando', 'quanto', 'quantos', 'quarta', 'quarto', 'quatro', 'que', 'quê', 'quem', 'quer', 'quereis', 'querem', 'queremas', 'queres', 'quero', 'questão', 'quinta', 'quinto', 'quinze', 'relação', 'sabe', 'sabem', 'são', 'se', 'segunda', 'segundo', 'sei', 'seis', 'seja', 'sejam', 'sejamos', 'sem', 'sempre', 'sendo', 'ser', 'será', 'serão', 'serei', 'seremos', 'seria', 'seriam', 'seríamos', 'sete', 'sétima', 'sétimo', 'seu', 'seus', 'sexta', 'sexto', 'si', 'sido', 'sim', 'sistema', 'só', 'sob', 'sobre', 'sois', 'somos', 'sou', 'sua', 'suas', 'tal', 'talvez', 'também', 'tampouco', 'tanta', 'tantas', 'tanto', 'tão', 'tarde', 'te', 'tem', 'tém', 'têm', 'temos', 'tendes', 'tendo', 'tenha', 'tenham', 'tenhamos', 'tenho', 'tens', 'ter', 'terá', 'terão', 'terceira', 'terceiro', 'terei', 'teremos', 'teria', 'teriam', 'teríamos', 'teu', 'teus', 'teve', 'ti', 'tido', 'tinha', 'tinham', 'tínhamos', 'tive', 'tivemos', 'tiver', 'tivera', 'tiveram', 'tivéramos', 'tiverem', 'tivermos', 'tivesse', 'tivessem', 'tivéssemos', 'tiveste', 'tivestes', 'toda', 'todas', 'todavia', 'todo', 'todos', 'trabalho', 'três', 'treze', 'tu', 'tua', 'tuas', 'tudo', 'última', 'últimas', 'último', 'últimos', 'um', 'uma', 'umas', 'uns', 'vai', 'vais', 'vão', 'vários', 'vem', 'vêm', 'vendo', 'vens', 'ver', 'vez', 'vezes', 'viagem', 'vindo', 'vinte', 'vir', 'você', 'vocês', 'vos', 'vós', 'vossa', 'vossas', 'vosso', 'vossos', 'zero', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '_' ]
Atenção porque muitas das palavras listadas não existem em português. Exemplos: houveremos, houverei, houverem, houvera, houveria, houveriam, queremas e muitas estão escritas erradas, como quáis...
Excelente. Muito obrigada!
Uhuu!!!
❤️
Valeu!
Muito bom!
Obrigado! Muito bom
Como não amar essa comunidade? Obrigado demais!!
obrigado amigo, você é um amigo kkk 🥉
Boa
Show de bola!
Obrigada!
Oskey, obrigueido!
Agradeço a todos que colaboram.
Passando para deixar um generoso abraço à todos os contribuintes desse BELO gist <3
Muito obrigado por este trabalho, salvou demais!!!
Bom trabalho!
Mas vale apontar que "tém", "houverei", "houverão", "houveriam" e "houvéramos" não existem na língua portuguesa. Além disso, muitas das palavras listadas têm uma frequência baixíssima (fôramos, tivéramos, hajamos) enquanto os pronomes oblíquos (-lo, -la, -los, -las) e outros termos de alta frequência não foram incluídos.
MarianaGCosta partilha a tua lista
Excelente trabalho, pessoal!
Obrigada por essa lista, estou com problema nos tartamentos de dados os quais já retirei acentuações e na lisat de stopwords estão listados com acentos.
Muito útil, obrigado!!