六、人工智能与机器学习
NLTK(natural language toolkit) # 是python的自然语言处理工具包。2001年推出,包括了大量的词料库,以及自然语言处理方面的算法实现: 分词, 词根计算, 分类, 语义分析等;
Pattern # 数据挖掘模块,包括自然语言处理,机器学习工具,等等;
textblob # 提供API为自然语言处理、分解NLP任务。基于NLTK和Pattern模块;
jieba # 结巴,中文分词工具。snownlp,用于处理中文文本库;
loso # 中文分词函数库
genius # 中文CRF基础库,条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列Gensim,一个相当专业的主题模型Python工具包,无论是代码还是文档,可用于如何计算两个文档的相似度LIBSVM,是台湾大学林智仁(Lin Chih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它[操作系统]上应用;
scikits.learn # 构建在SciPy之上用于机器学习的 Python 模块。它包括简单而高效的工具,可用于数据挖掘和数据分析;
PyMC # 主要用来做Bayesian分析。Orange,基于组件的数据挖掘和机器学习软件套装python破解wifi代码,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能;
Milk # 机器学习工具箱,其重点是提供监督分类法与几种有效的分类分析:SVMs(基于libsvm),K-NN,随机森林经济和决策树。
PyMVPA(Multivariate Pattern Analysis in Python) # 是为大数据集提供统计学习分析的Python工具包,它提供了一个灵活可扩展的框架。它提供的功能有分类、回归、特征选择、数据导入导出、可视化等NuPIC,开源人工智能平台;
hebel # GPU加速,[深度学习]Python库;
gensim # 机器学习库
pybrain # 机器学习模块,它的目标是为机器学习任务提供灵活、易应、强大的机器学习算法;
pybrain # 包括神经网络、强化学习(及二者结合)、无监督学习、进化算法。以神经网络为核心,所有的训练方法都以神经网络为一个实例Mahout,是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序;
Mahout # 包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中;
Crab # 灵活的,快速的推荐引擎。python-recsys,娱乐系统分析,推荐系统。vowpal_porpoise,Vowpal Wabbit轻量级Python封装;
Theano # 用来定义、优化和模拟数学表达式计算,用于高效的解决多维数组的计算问题的python软件包。它使得写深度学习模型更加容易,同时也给出了一些关于在GPU上训练它们的选项;
七 、系统与命令行
threading # Python标准线程库,更高级别的线程接口;
envoy # 特使,Python子线程的函数库;
sh # 成熟的子线程替换函数库
sarge # 封装线程
subprocess # 调用shell命令的神器
argparse # 写命令行脚本必备,强大的命令行差数解析工具;
timeit # 计算代码运行的时间等等
unp # 命令行工具,解压文件;
eventlet # 开销很少的多线程模块,使用的是 green threads 概念,例如,pool = eventlet.GreenPool(10000) 这样一条语句便创建了一个可以处理 10000 个客户端连接的线程池,类似Gevent线程库;
Gevent # 多线程模块
pytools # 著名的python通用函数、工具包
SendKeys # 键盘鼠标操作模块, 模拟键盘鼠标模拟操作;
pyHook # 基于Python的“钩子”库,主要用于监听当前电脑上鼠标和键盘的事件。 这个库依赖于另一个Python库PyWin32,如同名字所显示的,PyWin32只能运行在Windows平台,所以PyHook也只能运行在Windows平台;
pstuil # 跨平台地很方便获取和控制系统的进程,以及读取系统的CPU占用内存占用等信息;
cement # 一个轻量级的、功能齐全的命令行工具;
click # 简单优雅的的命令行接口
clint # Python命令行工具
cliff # 创造多层次指令的命令行程序框架
Clime # 可以转换任何模块为多的CLI命令程序,无任何配置;
docopt # Python命令行参数分析器
pycli # 命令行应用程序,支持的标准命令行解析,测井,单元[测试]和功能测试;
Gooey # 打开命令行程序,作为为一个完整的GUI应用程序;
cookiecutter # 命令行工具,从cookiecutters(项目模板)创建项目;
percol # 为UNIX传统管道pipe命令,添加交互式选择风格;
rainbowstream # 聪明和漂亮的推特客户终端
Django Models # Django的一部分
SQLAlchemy # Python SQL工具包和对象关系映射
peewee # 小型的ORM解析器。
PonyORM # 为ORM提供了一种面向SQL的接口
MongoEngine # Python对象文件映射,使用[MongoDB]
Django MongoDB引擎MongoDB # Django后台
django-mongodb-engine # Django后台
redisco # 一个简单的模型和容器库,使用[Redis]flywheel,Amazon DynamoDB对象映射;
butterdb # 谷歌电子表格的ORM,Python版;
celery # 芹菜,异步任务队列/工作,基于分布式消息队列;
huey # 休伊,轻量级,多线程任务队列;
mrq # 队列先生,分布式任务队列,使用redis & Gevent;
rq # 简单的工作队列
Queue # Queue模块可以用来实现多线程间通讯,让各个线程共享数据,生产者把货物放到Queue中,供消费者(线程)去使用;
simpleq # 简单的,可扩展的队列
Amazon SQS # 基础队列
Psyco # 超强的python性能优化工具,psyco 的神奇在于它只需要在代码的入口处调用短短两行代码,性能就能提升 40% 或更多,真可谓是立竿见影!如果你的客户觉得你的程序有点慢,敬请不要急着去优化代码,psyco 或许能让他立即改变看法;
psyco # 堪称 Python 的 jit
fn.py # Python函数编程:缺失的功能享受FP的实现;
funcy # 函数编程工具
Toolz # 函数编程工具:迭代器、函数,字典;
CyToolz # Toolz的Cython实现,高性能的函数编程工具;
Ansible # 安塞波,极为简单的自动化平台;
SaltStack # 基础设施的自动化管理系统
Fabric # 织物,一个简单,远程执行和部署的语言工具;
Fabtools # Fabric的工具函数
cuisine # 热门的Fabric的工具函数
psutil # 跨平台的过程和系统工具模块
pexpect # 控制互动节目
provy # 易于使用的配置系统的Python
honcho # Foreman的Python接口,用于管理procfile应用工具;
gunnery # 多任务执行工具,与网络接口的分布式系统;
fig # 快速/独立的开发环境中使用泊坞窗
APScheduler # 轻量级、但功能强大的在线任务调度程序;
django-schedule # Django日程应用程序。doit,任务流道/生成工具;
Joblib # Python提供的轻量级的流水线工具函数
Plan # 简易生成crontab文件
Spiff # 纯Python实现的,功能强大的工作流引擎;
schedule # Python作业调度
TaskFlow # 有助于使任务执行简单
ctypes # Python标准库,速度更快,Python调用C代码的外部函数接口;
cffi # Python调用C代码外部函数接口,类似于ctypes直接在python程序中调用c程序,但是比ctypes更方便不要求编译成so再调用;
Cytoolz # python 加速库SWIG,简化封装和接口生成器;
Cython # Python优化静态编译器
PyPy # Python解释器的 Python实现
Stackless Python # 一个增强版本的Pythonpython破解wifi代码,它使程序员从基于线程的编程方式中获得好处,并避免传统线程所带来的性能与复杂度问题;
# Stackless为 Python带来的微线程扩展,是一种低开销、轻量级的便利工具Pyston,使用LLVM和现代JIT技术,对python进行性能优化;
pythonlibs #非官方的Windows(32 / 64位)的Python扩展包scapy,优秀的数据包处理库;
ino # Arduino命令行工具
Pyro # Python的机器人工具包
pluginbase # 一个简单而灵活的Python的插件系统
itsdangerous # 数据安全传输工具
blinker # 快速Python中的信号/事件调度系统
pychievements # 用于创建和跟踪成果框架
python-patterns # Python中的设计模式
pefileWindows PE文件解析器SIP # 自动为C和C++库生成Python扩展模块的工具
八、数据库
MySQLdb # 成熟的[MySQL]数据库模块
Baresql # SQL数据库包ZODB,Python本地对象数据库,一个K-V对象图数据库;
pickledb # 简单和轻量级的K-V键值存储
TinyDB # 轻量级,面向文档的数据库;
mysql-python # MySQL的Python工具库
mysqlclient # mysql-python分支,支持Python 3
PyMySQL # 纯Python写的 MySQL驱动程序,兼容mysql-python;
mysql-connector-python # MySQL连接器,来自[Oracle],纯Python编写;
oursql # MySQL连接器,提供本地话指令语句和BLOBs支持;
psycopg2 # 最流行的Python PostgreSQL适配器
txpostgres # 于Twisted的异步驱动,用于PostgreSQL;
queries # psycopg2函数库,用于PostgreSQL;
dataset # 存储Python字典数据,用于SQLite,MySQL和PostgreSQL;
cassandra-python-driver # 开源分布式NoSQL数据库系统Apache Cassandra系统的Python驱动
pycassa # 简化的cassandra数据库Python驱动
HappyBase # 友好的Apache [Hbase]的函数库
PyMongo # MongoDB官方客户端
Plyvel # LevelDB快速和功能丰富的Python接口
redis-py # redis客户端
py2neo # Python客户端(基于Neo4j的RESTful接口)
telephus # 基于Twisted的cassandra客户端
txRedis # 基于Twisted的Redis客户端
九、网络
Curl # Pycurl包是一个libcurl的Python接口,它是由C语言编写的,与urllib相比,它的速度要快很多;
Libcurl # 一个支持FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 和 LDAP的客户端URL传输库.libcurl也支持HTTPS认证,HTTP POST,HTTP PUT,FTP上传,代理,Cookies,基本身份验证,FTP文件断点继传,HTTP代理通道等等。
Requests # 用Python语言编写,基于 urllib的开源 HTTP 库,它比 urllib 更加方便;
httpie # 命令行HTTP客户端,用户友好的cURL的替换工具;
s3cmd # 命令行工具,用于管理Amazon S3和CloudFront;
youtube-dl # 命令行程序,从YouTube下载视频;
you-get # Python3写的视频下载工具,可用于YouTube/Youku优酷/Niconico视频下载;
Coursera # 从下载视频,可重新命名文件wikiteam,wiki下载工具;
subliminal # 命令行工具,搜索和下载字幕的函数库;
requests # HTTP函数库,更加人性化;
grequests # 异步HTTP请求+ Gevent(高性能高并发函数库);
urllib3 # 一个线程安全的HTTP连接池,支持文件post;
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,一年会员只需98元,全站资源免费下载 点击查看详情
站 长 微 信: muyang-0410