Skip to content

Instantly share code, notes, and snippets.

View vanangamudi's full-sized avatar

Pa Mu Selvakumar vanangamudi

View GitHub Profile
Matched Expected Mismatch
கடி குல் கடி
கழி குழை கழி
கலி குறை கலி
கலை சிலை கலை
கா குறி கா
கோடு குரு கோடு
குல் சிறை சேர்
சேர் குடி சரி
சரி குடை கை
@vanangamudi
vanangamudi / ta_re.org
Last active April 9, 2022 15:58
proper regular expression engine for Tamil text

Proper regex engine for Tamil

There are still some corner cases to be ironed out as in anchors and special sequences cases. But this implementation is is useful enough for basic text processing.

vanangamudi@karunthulai:~/agam/projects/code/tamilnlp/tamil-regex
$ python3 ta_re.py
தமிழ், தமிழ் == தமிழ்
தமிழ், உயர்தனிச்செம்மொழி தமிழ் == தமிழ்
த*மிழ், தததததததமிழ் == தததததததமிழ்
@vanangamudi
vanangamudi / conver-data-to-csv.ipynb
Created January 3, 2024 06:28
ModuleNotFoundError: No module named 'pandas'. where as shell command within cells can import it
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.