README

tokenizer-next

iterator based tokenizer for writing parsers

🔧 Install · 🧩 Example · 📜 API docs · 🔥 Releases · 💪🏼 Contribute · 🖐️ Help

Install

$ npm i tokenizer-next

What is this?

A tokenizer for writing parsers based on RegExp's named groups as returned, for example, by String.prototype.matchAll().

For a more advanced version of this, check out lexer-next which includes methods for writing Recursive descent parsers.

Example

See TokenizerFactory.

createTokenizer

src/index.ts:19-37

Create a TokenizerFactory for the given RegExps.

To capture, RegExps must use a named group.

const tokenize = createTokenizer(
  /(?<ident>[a-z]+)/, // named groups determine token `group`
  /(?<number>[0-9]+)/
)

Parameters

regexps ...Array<RegExp> RegExps to match.

TokenizerFactory

src/index.ts:67-67

Create a TokenizerCallableIterable for given input string.

// using next()
const next = tokenize('hello 123')
console.log(next()) // => {group: 'ident', value: 'hello', index: 0}
console.log(next()) // => {group: 'number', value: '123', index: 6}
console.log(next()) // => undefined

// using for of
for (const token of tokenize('hello 123')) {
  console.log(token)
  // => {group: 'ident', value: 'hello', index: 0}
  // => {group: 'number', value: '123', index: 6}
}

// using spread
const tokens = [...tokenize('hello 123')]
console.log(tokens)
// => [
//   {group: 'ident', value: 'hello', index: 0},
//   {group: 'number', value: '123', index: 6}
// ]

Type: function (input: string): TokenizerCallableIterable

Parameters

input The string to tokenize.

TokenizerCallableIterable

src/index.ts:74-74

Can be called to return next Token or can be used as an Iterable on for-of and spread operations.

Type: any

Contribute

Fork or edit and submit a PR.

All contributions are welcome!

tokenizer-next

Usage no npm install needed!

README

tokenizer-next

Install

What is this?

Example

API

Table of Contents

createTokenizer

Parameters

TokenizerFactory

Parameters

TokenizerCallableIterable

Contribute

License