Bishwas-py · March 3, 2022 16:39 · Bishwas-py · Mar 3, 2022 · Bishwas-py · Mar 3, 2022
diff --git a/wm.py b/wm.py
 def get_set_data(link, mp_data):
    try:
        articles = Article() # gets article information
        article_data = {
            'url': article.url,
            'summary': article.summary,
            'content': article.text,
            'keywords': article.keywords,
            'tags': article.tags
        }

        article_words = article.text.split(' ')
        article_paragraphs = article.text.splitlines()
        if len(article_paragraphs) <= 0:
            word_paragraph_ratio = 0
        else:
            word_paragraph_ratio = len(article_words) / len(article_paragraphs)

        article_data['word_paragraph_ratio'] = word_paragraph_ratio
        article_data['paragraph_count'] = len(article_paragraphs)
        article_data['word_count'] = len(article_words)
        # Article High Quality Detection
        if len(article_words) >= 250:
            if word_paragraph_ratio >= 6:
                mp_data['site_info']['hq_pages_num'].value += 1
                article_data['hq'] = True
            else:
                article_data['hq'] = False

        mp_data['articles'].append(article_data) # appender...

        mp_data['site_info']['pages_num'].value += 1
    except ArticleException:
        pass
	def get_set_data(link, mp_data):
	try:
	articles = Article() # gets article information
	article_data = {
	'url': article.url,
	'summary': article.summary,
	'content': article.text,
	'keywords': article.keywords,
	'tags': article.tags
	}

	article_words = article.text.split(' ')
	article_paragraphs = article.text.splitlines()
	if len(article_paragraphs) <= 0:
	word_paragraph_ratio = 0
	else:
	word_paragraph_ratio = len(article_words) / len(article_paragraphs)

	article_data['word_paragraph_ratio'] = word_paragraph_ratio
	article_data['paragraph_count'] = len(article_paragraphs)
	article_data['word_count'] = len(article_words)
	# Article High Quality Detection
	if len(article_words) >= 250:
	if word_paragraph_ratio >= 6:
	mp_data['site_info']['hq_pages_num'].value += 1
	article_data['hq'] = True
	else:
	article_data['hq'] = False

	mp_data['articles'].append(article_data) # appender...

	mp_data['site_info']['pages_num'].value += 1
	except ArticleException:
	pass