vikeshsingh37 · April 5, 2020 14:39 · Apr 5, 2020
diff --git a/snorkel_classifier.py b/snorkel_classifier.py
@@ -0,0 +1,8 @@
+from sklearn.feature_extraction.text import CountVectorizer
+from sklearn.linear_model import LogisticRegression
+
+train_text = df_train_augmented.text.tolist()
+X_train = CountVectorizer(ngram_range=(1, 2)).fit_transform(train_text)
+
+clf = LogisticRegression(solver="lbfgs")
+clf.fit(X=X_train, y=df_train_augmented.label.values)