kanazux · August 15, 2018 21:34
diff --git a/generate_fuzzy.py b/generate_fuzzy.py
 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-
 """
 Create a defultdict from pofile

 Translate strings from google nltk and put po data with translted strings
 on a new po file.
 """


 import re
 import sys
 from collections import defaultdict
 from google.cloud import translate


 class po_data():

    def __init__(self, _file, _fuzzy=False):
        self.data = list(filter(None, open(_file, 'r', encoding='utf-8').read().split("\n")))
        self.head = []
        self.msgs = defaultdict(lambda: False)
        self.fuzzy = _fuzzy
        if self.fuzzy:
            self.msgid = "#~ msgid"
            self.msgstr = "#~ msgstr"
        else:
            self.msgid = "msgid"
            self.msgstr = "msgstr"

    def get_head(self):
        for line in self.data:
            if bool(re.match(r"^#[:|~]", line)):
                break
            else:
                self.head.append(line.strip())
        return self.head

    def get_msgs(self):
        _data = self.data[len(self.get_head()):]
        for idx, line in enumerate(_data):
            if line.startswith(self.msgid):
                _msgid = []
                _msgid.append(re.split(r"^{}".format(self.msgid),
                                       line)[-1].strip())
                _cont = 1
                while True:
                    if _data[idx + _cont].startswith(self.msgstr):
                        break
                    else:
                        _msgid.append(_data[idx + _cont])
                        _cont += 1
                _msgid = "|\n|".join([l for l in _msgid])
                self.msgs[_msgid] = defaultdict(lambda: False)
                self.msgs[_msgid]['lines'] = []
                if not self.fuzzy:
                    _cont = 1
                    while True:
                        _lines = _data[idx - _cont]
                        if not _lines.startswith('#:'):
                            break
                        else:
                            self.msgs[_msgid]['lines'].append(_lines)
                        _cont += 1
                self.msgs[_msgid]['msgstr'] = []
            if line.startswith(self.msgstr):
                self.msgs[_msgid]['msgstr'].append(
                    re.split(r"^{}".format(self.msgstr), line)[-1].strip())
                _cont = 1
                while True:
                    try:
                        _msgstr = _data[idx + _cont]
                        if _msgstr.startswith("#") or _msgstr.startswith(
                                self.msgid):
                            break
                        else:
                            self.msgs[_msgid]['msgstr'].append(_msgstr)
                        _cont += 1
                    except IndexError:
                        break
        return self.msgs


 def convert_strings():
    
    client = translate.Client()
    pofile = podata(sys.argv[1]).get_msgs()
    with open('newpofile.po', 'a') as np:
        cont = 0
        for text in pofile:
            try:
                trans = client.translate(text, target_language='pt_br')
                for line in pofile[text]['lines']:
                    np.write(line + "\n")
                    np.write("msgid {}".format(text) + "\n")
                    np.write("msgstr {}".format(trans['translatedText'].replace("&quot;", '"')) + "\n\n")
                    cont = cont + 1
                    print("Translated number: {}".format(cont))
            except Exception as error:
                print(error)
	#!/usr/bin/env python3
	# -- coding: utf-8 --
	"""
	Create a defultdict from pofile

	Translate strings from google nltk and put po data with translted strings
	on a new po file.
	"""


	import re
	import sys
	from collections import defaultdict
	from google.cloud import translate


	class po_data():

	def __init__(self, _file, _fuzzy=False):
	self.data = list(filter(None, open(_file, 'r', encoding='utf-8').read().split("\n")))
	self.head = []
	self.msgs = defaultdict(lambda: False)
	self.fuzzy = _fuzzy
	if self.fuzzy:
	self.msgid = "#~ msgid"
	self.msgstr = "#~ msgstr"
	else:
	self.msgid = "msgid"
	self.msgstr = "msgstr"

	def get_head(self):
	for line in self.data:
	if bool(re.match(r"^#[:\|~]", line)):
	break
	else:
	self.head.append(line.strip())
	return self.head

	def get_msgs(self):
	_data = self.data[len(self.get_head()):]
	for idx, line in enumerate(_data):
	if line.startswith(self.msgid):
	_msgid = []
	_msgid.append(re.split(r"^{}".format(self.msgid),
	line)[-1].strip())
	_cont = 1
	while True:
	if _data[idx + _cont].startswith(self.msgstr):
	break
	else:
	_msgid.append(_data[idx + _cont])
	_cont += 1
	_msgid = "\|\n\|".join([l for l in _msgid])
	self.msgs[_msgid] = defaultdict(lambda: False)
	self.msgs[_msgid]['lines'] = []
	if not self.fuzzy:
	_cont = 1
	while True:
	_lines = _data[idx - _cont]
	if not _lines.startswith('#:'):
	break
	else:
	self.msgs[_msgid]['lines'].append(_lines)
	_cont += 1
	self.msgs[_msgid]['msgstr'] = []
	if line.startswith(self.msgstr):
	self.msgs[_msgid]['msgstr'].append(
	re.split(r"^{}".format(self.msgstr), line)[-1].strip())
	_cont = 1
	while True:
	try:
	_msgstr = _data[idx + _cont]
	if _msgstr.startswith("#") or _msgstr.startswith(
	self.msgid):
	break
	else:
	self.msgs[_msgid]['msgstr'].append(_msgstr)
	_cont += 1
	except IndexError:
	break
	return self.msgs


	def convert_strings():

	client = translate.Client()
	pofile = podata(sys.argv[1]).get_msgs()
	with open('newpofile.po', 'a') as np:
	cont = 0
	for text in pofile:
	try:
	trans = client.translate(text, target_language='pt_br')
	for line in pofile[text]['lines']:
	np.write(line + "\n")
	np.write("msgid {}".format(text) + "\n")
	np.write("msgstr {}".format(trans['translatedText'].replace(""", '"')) + "\n\n")
	cont = cont + 1
	print("Translated number: {}".format(cont))
	except Exception as error:
	print(error)