跳转至

自然语言处理

1. 框架

  •   TextBlob


    TextBlob


      🔖

  •   FastText


    FastText 已经很少更新了,建议选用其他模型框架。


      🔖

  •   Stanza


    Stanza 是一个用于对多种人类语言进行语言分析的准确且高效的工具集合,,提供了丰富的功能,如分词、词性标注、命名实体识别、句法分析等功能。


    7.2k   🔖

2. 分词

  •   Pkuseg2019


    Pkuseg 提供了中文分词、词性标注等功能,支持多种常见的中文处理任务。


    6.5k  

  •   Jieba2019


    Jieba 分词


    33k  

3. 文本摘要

  •   Sumy2024


    Sumy 用于从长文本中提取出摘要,使得用户可以快速了解文本的主要内容。


    3.5k   🔖