dchaplinsky · May 7, 2023 19:06
diff --git a/inflector.py b/inflector.py
 # pip install pymorphy3
 # pip install pymorphy3-dicts-uk

 import pymorphy3
 from collections import defaultdict
 from itertools import product
 from typing import List, List


 morph = pymorphy3.MorphAnalyzer(lang="uk")


 def inflect_ngram(ngram: str) -> List[str]:
    parses = []
    for w in ngram.split(" "):
        parses.append(morph.parse(w))

    result = defaultdict(list)
    for case in (
        "nomn",
        "gent",
        "datv",
        "accs",
        "ablt",
        "loct",
        "voct",
        "gen2",
        "acc2",
        "loc2",
    ):
        for gender in ("masc", "femn", "neut", "plur"):
            for parsed in parses:
                inflections = set()
                for word in parsed:
                    inflected = word.inflect({case, gender})
                    if inflected is not None:
                        inflections.add(inflected.word)

                result[(case, gender)].append(inflections)

    flattened = set()
    for k, ngram in result.items():
        if all(ngram):
            for chunks in product(*ngram):
                flattened.add(" ".join(chunks))

    return flattened


 print(inflect_ngram("спортивна ходьба"))
 print(inflect_ngram("капуста білоголова"))
 print(inflect_ngram("великий рудий кіт"))
	# pip install pymorphy3
	# pip install pymorphy3-dicts-uk

	import pymorphy3
	from collections import defaultdict
	from itertools import product
	from typing import List, List


	morph = pymorphy3.MorphAnalyzer(lang="uk")


	def inflect_ngram(ngram: str) -> List[str]:
	parses = []
	for w in ngram.split(" "):
	parses.append(morph.parse(w))

	result = defaultdict(list)
	for case in (
	"nomn",
	"gent",
	"datv",
	"accs",
	"ablt",
	"loct",
	"voct",
	"gen2",
	"acc2",
	"loc2",
	):
	for gender in ("masc", "femn", "neut", "plur"):
	for parsed in parses:
	inflections = set()
	for word in parsed:
	inflected = word.inflect({case, gender})
	if inflected is not None:
	inflections.add(inflected.word)

	result[(case, gender)].append(inflections)

	flattened = set()
	for k, ngram in result.items():
	if all(ngram):
	for chunks in product(*ngram):
	flattened.add(" ".join(chunks))

	return flattened


	print(inflect_ngram("спортивна ходьба"))
	print(inflect_ngram("капуста білоголова"))
	print(inflect_ngram("великий рудий кіт"))
No results found