mozillazg -

Unicode 文本的 ASCII 转换形式

go-unidecode - Unicode 文本的.ASCII字母

相关的项目 - 更多比较

36 585 43

G Go efficient text segmentation; support english, chinese, japanese and other. Go 语言分词
 
4.1 6.3
  前天
41 758 61

G go-freeling 是Golang 自然语言处理器。 特性: 文字符号化 拆分句子 形态分析 后缀处理,附着词素代词的标记化 灵活的多字识别 收缩裂缝 未登录词类别的概率预测 命名实体检测 词性标注 基于图表的浅层分析 命名实体
 
3.5 0.0
  1年前
28 644 51

L LexVec 是 Go 实现的自然语言处理,类似 Google 的 Word2vec。是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。
 
3.3000000000000003 3.2
  4天前