主流中文分词技术方案(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)对比

   日期:2024-12-30     作者:0j8mg       评论:0    移动:http://qyn41e.riyuangf.com/mobile/news/7842.html
核心提示:熊猫关键词工具旗下的中文分词工具(https://www.5guanjianci.com/tools/fenci/)上线以来获得了不少用户的认可。会有很多朋友想

熊猫关键词工具旗下的中文分词工具(https://www.5guanjianci.com/tools/fenci/)上线以来获得了不少用户的认可。

主流中文分词技术方案(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)对比

会有很多朋友想知道当前主流的分词技术方案有哪些,本文将带您了解主流技术(Jieba, SnowNLP, PkuSeg, THULAC, HanLP)

各维度的对比。


Github:https://github.com/fxsjy/jieba

结巴分词是国内最广泛使用的分词技术,该项目可以完全满足中文分词的需要。

结巴分词有如下功能特点:


Github:https://github.com/isnowfy/snownlp

该项目功能齐全,有如下功能特点:


Github:https://github.com/lancopku/pkuseg-python

pkuseg 是基于论文[Luo et. al, 2019]的工具包。其简单易用,支持细分领域分词,有效提升了分词准确度。


Github:https://github.com/thunlp/THULAC-Python

THULAC(THU Lexical Analyzer for Chinese)由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包,具有中文分词和词性标注功能。

THULAC具有如下几个特点:


Github:https://github.com/hankcs/pyhanlp

功能特点:

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号