来源 | 大邓和他的Python
Python库大全
大邓将Python库整理为8部分,对每个库稍加自己的理解和评价,对Python感兴趣的同学可以收藏起来
•网络爬虫•数据库•数据分析•机器学习•可视化•文本分析•GUI窗体软件开发•自动化办公
网络爬虫
•requests[1] 最好用、最简单的网络爬虫访问库•BeautifulSoup[2] 最简单的网页解析库•pyquery[3] 最简洁网页解析库•scrapy[4] 最流行的爬虫框架•pyspider[5] 国人开发的爬虫框架•selenium[6] 浏览器自动化框架,可以用于爬虫反爬•scylla[7] 智能IP代理池,用于反爬•shreport[8] 上海证券交易所上市公司定期报告下载•newspaper[9] 新闻爬虫库,根据提供的url可以抽取出新闻标题、作者、关键词、总结,部分功能支持中文
数据库
•PyMySQL[10]•Sqlite3[11] 轻量级sql数据库(python内置库)•pymongo[12] 非关系型MongoDB库•redis 缓存数据库
数据分析
•pandas[13] 必须Python数据分析库,读取文件、预处理数据、分析、存储•modin[14] pandas加速库,接口语法与pandas高度一致•dask[15] pandas加速库,接口语法与pandas高度一致•plydata[16] pandas管道语法库•networkx[17] 社交网络分析库
机器学习
•scikit-learn[18] 机器学习必学库,支持有监督、无监督多种算法,含文本分析功能•Orange3[19] 点击操作的机器学习分析软件, 可文本分析•doccano[20] 文本数据标注工具•label-studio[21] 最牛掰的文本数据标注工具
可视化
•matplotlib[22] Python中最万能绘图库,很少有ta画不出来的图;但语法较难、静态图•seaborn[23] 基于matplotlib开发的简化版可视化库, 一般的图可以用ta绘制;高度定制仍需要结合matplotlib进行样式定制;静态图•plotnine[24] ggplot2语法的Python可视化库, 可与plydata[25] 库结合使用•pyecharts[26] 国人开发并封装的动态可视化图绘制库; 中文文档•plotly[27] 动态可视化图绘制库•bokeh[28] 动态可视化图绘制库•SciencePlots[29] 科研论文绘图,基于matplotlib•datapane[30] 数据分析报告生成•superset[31] 开源商务智能分析可视化库
文本分析
•nltk[32] 自然语言分析套件,对中文不友好•spacy[33] 工业级自然语言模型库,支持中文•pattern[34] 自然语言处理、网络分析、可视化库•jieba[35] 中文文本分词库•snownlp[36] 中文情感分析库•gensim[37] 最好用、最全的话题模型•cnsenti[38] 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析、情感分析。•label-studio[39] 最牛掰的文本数据标注工具•doccano[40] 文本数据标注工具•textstat[41] 文本可读性计算包(算法全,但仅支持英文)•texthero[42] 文本预处理、展示、可视化库,仅支持英文
GUI窗体软件开发
•tkinter[43] Python内置的gui库•PySimpleGUI[44] 最简单的gui开发库•pyqt5、pyside[45] 最牛掰的gui软件开发库
自动化办公
•zmail[46] 自动化收发邮件管理库•pywinauto[47] Windows电脑自动化Python库•WeasyPrint[48] 自动化生产pdf报告•selenium[49] 浏览器自动化框架,可以自动化点击浏览器,完成某些工作•mkdocx[50]•python-docx[51] 创建、修改docx文件库•python-ppt[52] 创建、修改ppt文件库•openpyxl[53] xlsx文件库
References
[1]
requests: https://github.com/psf/requests[2]
BeautifulSoup: https://www.crummy.com/software/BeautifulSoup/bs4/doc/[3]
pyquery: https://github.com/gawel/pyquery[4]
scrapy: https://github.com/scrapy/scrapy[5]
pyspider: https://github.com/binux/pyspider[6]
selenium: https://github.com/SeleniumHQ/selenium/[7]
scylla: https://github.com/imWildCat/scylla[8]
shreport: https://github.com/thunderhit/shreport[9]
newspaper: https://github.com/codelucas/newspaper[10]
PyMySQL: https://github.com/PyMySQL/PyMySQL[11]
Sqlite3: https://docs.python.org/3/library/sqlite3.html[12]
pymongo: https://github.com/mongodb/mongo-python-driver[13]
pandas: https://github.com/pandas-dev/pandas[14]
modin: https://github.com/modin-project/modin[15]
dask: https://github.com/dask/dask[16]
plydata: https://github.com/has2k1/plydata][17]
networkx: https://github.com/networkx/networkx[18]
scikit-learn: https://github.com/scikit-learn/scikit-learn[19]
Orange3: https://github.com/biolab/orange3[20]
doccano: https://github.com/doccano/doccano[21]
label-studio: https://github.com/heartexlabs/label-studio[22]
matplotlib: https://github.com/matplotlib/matplotlib[23]
seaborn: https://github.com/mwaskom/seaborn[24]
plotnine: https://github.com/has2k1/plotnine[25]
plydata: https://github.com/has2k1/plydata][26]
pyecharts: https://github.com/pyecharts/pyecharts[27]
plotly: https://github.com/plotly/plotly.py[28]
bokeh: https://github.com/bokeh/bokeh[29]
SciencePlots: https://github.com/garrettj403/SciencePlots[30]
datapane: https://github.com/datapane/datapane[31]
superset: https://github.com/apache/superset[32]
nltk: https://github.com/nltk/nltk[33]
spacy: https://github.com/explosion/spaCy[34]
pattern: https://github.com/clips/pattern[35]
jieba: https://github.com/fxsjy/jieba[36]
snownlp: https://github.com/isnowfy/snownlp[37]
gensim: https://github.com/RaRe-Technologies/gensim[38]
cnsenti: https://github.com/thunderhit/cnsenti[39]
label-studio: https://github.com/heartexlabs/label-studio[40]
doccano: https://github.com/doccano/doccano[41]
textstat: https://github.com/shivam5992/textstat[42]
texthero: https://github.com/jbesomi/texthero[43]
tkinter: https://wiki.python.org/moin/TkInter[44]
PySimpleGUI: https://github.com/PySimpleGUI/PySimpleGUI[45]
pyqt5、pyside: https://doc.qt.io/qt.html#qtforpython[46]
zmail: https://github.com/zhangyunhao116/zmail[47]
pywinauto: https://github.com/pywinauto/pywinauto[48]
WeasyPrint: https://github.com/Kozea/WeasyPrint[49]
selenium: https://github.com/SeleniumHQ/selenium/[50]
mkdocx: https://github.com/mkdocs/mkdocs/[51]
python-docx: https://github.com/python-openxml/python-docx[52]
python-ppt: https://github.com/scanny/python-pptx[53]
openpyxl: https://openpyxl.readthedocs.io/en/stable/
更多优质文章,点击关注猪哥
???
文章评论