1.機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)
Crab:靈活、快速的推薦引擎
gensim:人性化的話題建模庫(kù)
hebel:GPU加速的深度學(xué)習(xí)庫(kù)
NuPIC:智能計(jì)算Numenta平臺(tái)
pattern:Python網(wǎng)絡(luò)挖掘模塊
PyBrain:另一個(gè)Python機(jī)器學(xué)習(xí)庫(kù)
Pylearn2:一個(gè)基于Theano的機(jī)器學(xué)習(xí)庫(kù)
python-recsys:一個(gè)用來(lái)實(shí)現(xiàn)推薦系統(tǒng)的Python庫(kù)
scikit-learn:基于SciPy構(gòu)建的機(jī)器學(xué)習(xí)Python模塊
pydeep:Python深度學(xué)習(xí)庫(kù)
vowpalporpoise:輕量級(jí)VowpalWabbit的Python封裝
skflow:一個(gè)TensorFlow的簡(jiǎn)化接口(模仿scikit-learn)
Caffe:一個(gè)Caffe的python接口
OpenCV:開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù)
pyocr:Tesseract和Cuneiform的包裝庫(kù)
pytesseract:GoogleTesseractOCR的另一包裝庫(kù)
SimpleCV:一個(gè)用來(lái)創(chuàng)建計(jì)算機(jī)視覺(jué)應(yīng)用的開(kāi)源框架
2.數(shù)據(jù)分析
blaze:NumPy和Pandas的大數(shù)據(jù)接口
cclib:一個(gè)用來(lái)解析和解釋計(jì)算化學(xué)軟件包輸出結(jié)果的庫(kù)
NetworkX:一個(gè)為復(fù)雜網(wǎng)絡(luò)設(shè)計(jì)的高性能軟件
Neupy:執(zhí)行和測(cè)試各種不同的人工神經(jīng)網(wǎng)絡(luò)算法
Numba:PythonJIT(justintime)編譯器,針對(duì)科學(xué)用的Python,由Cython和NumPy的開(kāi)發(fā)者開(kāi)發(fā)
NumPy:使用Python進(jìn)行科學(xué)計(jì)算的基礎(chǔ)包
OpenBabel:一個(gè)化學(xué)工具箱,用來(lái)描述多種化學(xué)數(shù)據(jù)
OpenMining:使用Python挖掘商業(yè)情報(bào)(BI)(Pandasweb接口)
orange:通過(guò)可視化編程或Python腳本進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)可視化,分析和機(jī)器學(xué)習(xí)
Pandas:提供高性能,易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具
PyDy:PyDy是PythonDynamics的縮寫,用來(lái)為動(dòng)力學(xué)運(yùn)動(dòng)建模工作流程提供幫助,基于NumPy,SciPy,IPython和matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學(xué)信息學(xué)和機(jī)器學(xué)習(xí)軟件
SciPy:由一些基于Python,用于數(shù)學(xué),科學(xué)和工程的開(kāi)源軟件構(gòu)成的生態(tài)系統(tǒng)
statsmodels:統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)
SymPy:一個(gè)用于符號(hào)數(shù)學(xué)的Python庫(kù)
cclib:一個(gè)用來(lái)解析和解釋計(jì)算化學(xué)軟件包輸出結(jié)果的庫(kù)
NetworkX:一個(gè)為復(fù)雜網(wǎng)絡(luò)設(shè)計(jì)的高性能軟件
Neupy:執(zhí)行和測(cè)試各種不同的人工神經(jīng)網(wǎng)絡(luò)算法
Numba:PythonJIT(justintime)編譯器,針對(duì)科學(xué)用的Python,由Cython和NumPy的開(kāi)發(fā)者開(kāi)發(fā)
NumPy:使用Python進(jìn)行科學(xué)計(jì)算的基礎(chǔ)包
OpenBabel:一個(gè)化學(xué)工具箱,用來(lái)描述多種化學(xué)數(shù)據(jù)
OpenMining:使用Python挖掘商業(yè)情報(bào)(BI)(Pandasweb接口)
orange:通過(guò)可視化編程或Python腳本進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)可視化,分析和機(jī)器學(xué)習(xí)
Pandas:提供高性能,易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具
PyDy:PyDy是PythonDynamics的縮寫,用來(lái)為動(dòng)力學(xué)運(yùn)動(dòng)建模工作流程提供幫助,基于NumPy,SciPy,IPython和matplotlib
PyMC:馬爾科夫鏈蒙特卡洛采樣工具
RDKit:化學(xué)信息學(xué)和機(jī)器學(xué)習(xí)軟件
SciPy:由一些基于Python,用于數(shù)學(xué),科學(xué)和工程的開(kāi)源軟件構(gòu)成的生態(tài)系統(tǒng)
statsmodels:統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)
SymPy:一個(gè)用于符號(hào)數(shù)學(xué)的Python庫(kù)
3.數(shù)據(jù)可視化
matplotlib:一個(gè)Python2D繪圖庫(kù)
bokeh:用Python進(jìn)行交互式web繪圖
ggplot:ggplot2給R提供的API的Python版本
plotly:協(xié)同Python和matplotlib工作的web繪圖庫(kù)
pyecharts:基于百度Echarts的數(shù)據(jù)可視化庫(kù)
pygal:一個(gè)PythonSVG圖表創(chuàng)建工具
pygraphviz:Graphviz的Python接口
PyQtGraph:交互式實(shí)時(shí)2D/3D/圖像繪制及科學(xué)/工程學(xué)組件
SnakeViz:一個(gè)基于瀏覽器的Python'scProfile模塊輸出結(jié)果查看工具
vincent:把Python轉(zhuǎn)換為Vega語(yǔ)法的轉(zhuǎn)換工具
VisPy:基于OpenGL的高性能科學(xué)可視化工具
4.數(shù)據(jù)API構(gòu)建及服務(wù)
·Django
django-rest-framework:一個(gè)強(qiáng)大靈活的工具,用來(lái)構(gòu)建webAPI
django-tastypie:為Django應(yīng)用開(kāi)發(fā)API
django-formapi:為Django的表單驗(yàn)證,創(chuàng)建JSONAPIs
·Flask
flask-api:為flask開(kāi)發(fā)的,可瀏覽WebAPIs
flask-restful:為flask快速創(chuàng)建RESTAPIs
flask-restless:為SQLAlchemy定義的數(shù)據(jù)庫(kù)模型創(chuàng)建RESTfulAPIs
flask-api-utils:為Flask處理API表示和驗(yàn)證
eve:RESTAPI框架,由Flask,MongoDB等驅(qū)動(dòng)
·Pyramid
cornice:一個(gè)Pyramid的REST框架
·與框架無(wú)關(guān)的
falcon:一個(gè)用來(lái)建立云API和webapp后端的高性能框架
sandman:為現(xiàn)存的數(shù)據(jù)庫(kù)驅(qū)動(dòng)系統(tǒng)自動(dòng)創(chuàng)建RESTAPIs
restless:框架無(wú)關(guān)的REST框架,基于從Tastypie學(xué)到的知識(shí)
ripozo:快速創(chuàng)建REST/HATEOAS/HypermediaAPIs
5.爬蟲及網(wǎng)頁(yè)處理
Scrapy:一個(gè)快速高級(jí)的屏幕爬取及網(wǎng)頁(yè)采集框架
cola:一個(gè)分布式爬蟲框架
Demiurge:基于PyQuery的爬蟲微型框架
feedparser:通用feed解析器
Grab:站點(diǎn)爬取框架
MechanicalSoup:用于自動(dòng)和網(wǎng)絡(luò)站點(diǎn)交互的Python庫(kù)
portia:Scrapy可視化爬取
pyspider:一個(gè)強(qiáng)大的爬蟲系統(tǒng)
RoboBrowser:一個(gè)簡(jiǎn)單的,Python風(fēng)格的庫(kù),用來(lái)瀏覽網(wǎng)站,而不需要一個(gè)獨(dú)立安裝的瀏覽器
BeautifulSoup:以Python風(fēng)格的方式來(lái)對(duì)HTML或XML進(jìn)行迭代,搜索和修改
bleach:一個(gè)基于白名單的HTML清理和文本鏈接庫(kù)
cssutils:一個(gè)Python的CSS庫(kù)
html5lib:一個(gè)兼容標(biāo)準(zhǔn)的HTML文檔和片段解析及序列化庫(kù)
lxml:一個(gè)非??焖?,簡(jiǎn)單易用,功能齊全的庫(kù),用來(lái)處理HTML和XML
MarkupSafe:為Python實(shí)現(xiàn)XML/HTML/XHTML標(biāo)記安全字符串
pyquery:一個(gè)解析HTML的庫(kù),類似jQuery
untangle:將XML文檔轉(zhuǎn)換為Python對(duì)象,使其可以方便的訪問(wèn)
xhtml2pdf:HTML/CSS轉(zhuǎn)PDF工具
xmltodict:像處理JSON一樣處理XML
6.算法和設(shè)計(jì)模式
·Python實(shí)現(xiàn)的算法和設(shè)計(jì)模式。
algorithms:一個(gè)Python算法模塊
python-patterns:Python設(shè)計(jì)模式的集合
sortedcontainers:快速,純Python實(shí)現(xiàn)的SortedList,SortedDict和SortedSet類型
以上內(nèi)容為大家介紹了Python數(shù)據(jù)分析相關(guān)的技術(shù),希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://m.fengjieshuijing.cn/