pysummarization.tokenizabledoc package¶

Submodules¶

class pysummarization.tokenizabledoc.mecab_tokenizer.MeCabTokenizer[source]¶

Tokenize string.

Japanese morphological analysis with MeCab.

tokenize(sentence_str)[source]¶

Tokenize str.

Parameters:	sentence_str – tokenized string.
Returns:	[token, token, token, …]

class pysummarization.tokenizabledoc.simple_tokenizer.SimpleTokenizer[source]¶

Tokenize delimited sentence with a blank.

tokenize(sentence_str)[source]¶

Tokenize str.

Parameters:	sentence_str – tokenized string.
Returns:	[token, token, token, …]