nirlanka · April 24, 2020 03:31 · nirlanka · Apr 23, 2020
diff --git a/simple-html-tokeniser.js b/simple-html-tokeniser.js
 `<div>
  Some text here
  <div>
    <h3>Lorem <a href="./abc/def.html">ipsum</a></h3>
    <p>Dolor sit</p>
    <p>amet</p>
 </div>`
  .split(/([<>\s="\/]{1})/g)
  .map(s=>s.trim())
  .filter(Boolean)

 /*
 Result:
 ["<", "div", ">", "Some", "text", "here", "<", "div", ">", "<", 
  "h3", ">", "Lorem", "<", "a", "href", "=", """, ".", "/", "abc",  
  "/", "def.html", """, ">", "ipsum", "<", "/", "a", ">", "<", "/",  
  "h3", ">", "<", "p", ">", "Dolor", "sit", "<", "/", "p", ">", "<",  
  "p", ">", "amet", "<", "/", "p", ">", "<", "/", "div", ">"]
 */
diff --git a/simple-lang-tokenizer.js b/simple-lang-tokenizer.js
 `pkg bar {
  func foo() {
    a = 1;
    d = false; #lorem ipsum#
    e = {
      x: 1.35, #dolor sit#
      y: 2.2,
      f: "\"to\""
    }
  };
  b = "abc";
  c = foo();
 }`
  .split(/([\s\(\)\{\}=;"\.\,#]{1})/g)
  .map(s=>s.trim())
  .filter(Boolean);

 /*
 Result:
 ["pkg", "bar", "{", "func", "foo", "(", ")", "{", 
  "a", "=", "1", ";", "d", "=", "false", ";", "#",  
  "lorem", "ipsum", "#", "e", "=", "{", "x:", "1",  
  ".", "35", ",", "#", "dolor", "sit", "#", "y:",  
  "2", ".", "2", ",", "f:", """, "\", """, "to",  
  "\", """, """, "}", "}", ";", "b", "=", """,  
  "abc", """, ";", "c", "=", "foo", "(", ")", ";",  
  "}"]
 */
	`<div>
	Some text here
	<div>
	<h3>Lorem <a href="./abc/def.html">ipsum</a></h3>
	<p>Dolor sit</p>
	<p>amet</p>
	</div>`
	.split(/([<>\s="\/]{1})/g)
	.map(s=>s.trim())
	.filter(Boolean)

	/*
	Result:
	["<", "div", ">", "Some", "text", "here", "<", "div", ">", "<",
	"h3", ">", "Lorem", "<", "a", "href", "=", """, ".", "/", "abc",
	"/", "def.html", """, ">", "ipsum", "<", "/", "a", ">", "<", "/",
	"h3", ">", "<", "p", ">", "Dolor", "sit", "<", "/", "p", ">", "<",
	"p", ">", "amet", "<", "/", "p", ">", "<", "/", "div", ">"]
	*/
No results found