您当前的位置:首页 > 新闻中心 > 科技资讯

2017年十大最受欢迎机器学习Python库

时间:2017-12-29 16:28:25  

  6.PyFlux

  Python中有许多库用于研究数据科学和ML,但是当你的数据是随着时间的推移而变化的度量(例如股票价格,仪器的测量值等等)时,这对于大部分库来说是一个比较棘手的问题。

  PyFlux是一个专门为时间序列而开发的Python开源库。时间序列研究是统计学和计量经济学的一个子领域,目标可以描述时间序列如何表现(以潜在的因素或兴趣的特征来表示),也可以借此预测未来的行为。

  PyFlux允许使用时间序列建模,并且已经实现了像GARCH这样的现代时间序列模型。

  7.Fire

  通常情况下,你需要为你的项目制作命令行界面(CLI)。除了传统的argparse,Python还有一些这样的工具,Clik和docopt。Fire是今年谷歌发布的软件库,在解决这个的问题上采用了不同的方法。

  Fire是一个开源的库,可以为任何Python项目自动生成一个CLI,关键是自动,你几乎不需要编写任何代码或文档来构建你的CLI!你只需要调用一个Fire方法并把它所需要构建的传递给CLI。

  如果你想对此有所深入了解,请阅读指南,因为这个库可以为你节省很多时间。

  8.Imbalanced-learn

  在理想的情况下,我们会有完美平衡的数据集,但不幸的是,现实世界并不是这样的,某些任务拥有非常不平衡的数据。例如,在预测信用卡交易中的欺诈行为时,你预计绝大多数交易(99.9%)是合法的。天真地训练ML算法会导致令人失望的性能,所以在处理这些类型的数据集时需要特别小心。

  幸运的是,Imbalanced-learn是一个Python包,它提供了一些解决这类问题的方法,并提供一些技术的实现,它与scikit-learn兼容,是scikit-learn-contrib项目的一部分。

  9.FlashText

  如果你需要搜索某些文本并将其替换为其他内容(如大多数数据清理流程中),则通常会转为正则表达式。通常情况下,正则表达式考研完美的解决问题。但是有时会发生这样的情况:你需要搜索的术语数量是成千上万,然后,正则表达式可能变得非常缓慢。这时FlashText是一个更好的选择,它使整个操作的运行时间大大提高了(从5天到15分钟)。FlashText的优点在于无论搜索条件有多少,运行时都是一样的,而正则表达式中运行时将随着条件数几乎呈线性增长。

  FlashText证明了算法和数据结构设计的重要性,即使对于简单的问题,更好的算法也可以轻松超越最快的CPU。

  10.Luminoth

  现实生活中图像无处不在,理解其内容对于多个应用程序来说是至关重要的。值得庆幸的是,由于DL的发展,图像处理技术已经进步很多。

  Luminoth是一个使用TensorFlow和Sonnet构建的用于计算机视觉的开源Python工具包。目前,它可以支持被称为FasterR-CNN的模型的形式进行对象检测。

  并且Luminoth不仅是一个特定模型的实现,而是建立在模块化和可扩展的基础上的,所以定制现有的部分或用新的模型来扩展它来处理不同的问题,就可以能多地重用代码。它提供了用于轻松完成构建DL模型所需的工程工作如:将你的数据转换为用于提供数据管道(TensorFlow的记录)的格式,执行数据增强,在多个GPU训练,运行评估指标,在TensorBoard中可视化,并用简单的API或浏览器界面部署训练有素的模型,以便人们使用。

  其他优秀的Python库:

  1.PyVips

  你可能从来没有听说过libvips库,首先它是一个图像处理库,如Pillow或ImageMagick,并支持多种格式。但是,与其他库相比,libvips速度更快,占用的内存也更少。PyVips是最近发布的用于libvips的Python绑定包,它与Python2.7-3.6(甚至PyPy)兼容,易于使用pip。如果在你的应用程序中需要进行某种形式的图像处理,可以考虑一下它。

  2.Requestium

  有时,你需要自动化网络中的某些操作,如抓取网站,进行应用程序测试,填写网页表单,要想在不暴露API的网站中执行操作,自动化是必需的。Python有很好的请求库,可以让你执行一些这样的操作,但不幸的是请求获取的HTML代码可能没有表单,你可能会尝试查找表单来填充自动化任务。解决这个问题的方法是对JavaScript代码所做的请求进行反向工程,这将意味着需要花费很多时间来调试。另一个选择是转向使用Selenium这样的库,它允许你以编程方式与Web浏览器交互并运行Javascript代码。有了这个,问题就可以解决了。

来顶一下
返回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
油坊店:毛竹“打一针” “多子”又“壮孙”
油坊店:毛竹“打一针
相关文章
    无相关信息
栏目更新
栏目热门