AI学习纯干货:值得保藏的16 套机器学习和深度学习速查表

在机器学习和深度学习研讨中,优异的参阅资料和手册一般能够使咱们的学习事半功倍!今日我给我们引荐值得保藏的16 个机器学习和深度学习速查表。

NumPy

Numpy是Python科学核算的中心库之一,能够创立高性能的多维数组目标数组,并供给处理数组的东西。

Pandas

Pandas是一个根据Numpy的数据剖析库,为Python编程言语供给数据结构和数据剖析东西。

SciPy

Scipy也是一个根据Numpy的扩展包,包括Python言语中的一些数学算法和便当方程,是科学核算的中心库之一。

Matplotlib

Matplotlib是Python的2D绘图库,能够生成各种硬拷贝格局和跨渠道交互式环境的发布质量级图形。

SciPy-Linear Algebra

运用SciPy履行各种线性代数核算方法。

Scikit-Learn

Scikit-Learn(sketarn)是一个用Python完成的机器学习算法库。Sklearn能够完成常见的机器学习算法,例如数据预处理,分类,回归,降维和模型挑选。

TensorFlow

TensorFlow是Google今日开发的最抢手的深度学习结构之一。

Keras

Keras是一个高档神经网络API,Keras是用纯Python编写的,根据Tensorflow,Theano和CNTK后端。

Neural Network Cells

由Asimov Institute出品的神经网络结构。更多信息参阅以下网址:

Neural Network Zoo Prequel: Cells and Layers

Neural Network Graphs

Neural Networks Family

PySpark

Apache Spark是现在处理和运用大数据的最广泛运用的结构之一,Python是数据剖析,机器学习等最广泛运用的编程言语之一。那么,为什么纷歧起运用它们呢?这就是Spark与python也被称为PySpark的原因。

Apache Spark开发人员每年的均匀年薪为110,000美元。毫无疑问,Spark在这个职业中现已被广泛运用。因为其丰厚的库集,Python今日被大多数数据科学家和剖析专家运用。

将Python与Spark集成是开源社区的首要礼物。 Spark是用Scala言语开发的,与Java十分相似。它将程序代码编译为用于Spark大数据处理的JVM的字节码。为了支撑Spark和Python,Apache Spark社区发布了PySpark。

R Studio(dplyr和tidyr)

R是一个用于核算核算和核算制图的优异东西,比照SPSS和SAS等付费软件,R具有跨渠道、自在、免费、源代码敞开、绘图体现和核算才能杰出等一系列长处,受到了越来越多的数据剖析作业者的喜爱。

RStudio是一款R言语的IDE,R自带的环境操作起来或许不是便利,而Rstudio很好地处理了这个问题,而且它还具有调试、可视化等功能,支撑纯R脚本、Rmarkdown (脚本文档混排)、Bookdown (脚本文档混排成书)、Shiny (交互式网络运用)等。

dplyr包是Hadley Wickham的新作,首要用于数据清洗和收拾,该包专心dataframe数据格局,然后大幅提高了数据处理速度,而且供给了与其它数据库的接口;

tidyr包的作者也是Hadley Wickham, 该包用于“tidy”你的数据,这个包常跟dplyr结合运用。

Hadley Wickham是RStudio 的首席科学家,决议称得上是R界的男神,许多人都对Hadley的R包重度依靠,其个人主页为http://hadley.nz/. 里边有许多十分有价值的文章和代码,有爱好能够去看一下。

ggplot2

ggplot2包是根据Hadley Wickham在《Grammar of Graphics》一书中所提出的图形语法的具体完成, 这套图形语法把绘图进程概括为data, transformation, scale, coordinates, elements, guides, display等一系列独立的过程, 经过将这些过程调配组合, 来完成个性化的核算绘图。所以, 得益于该图形语法, Hadley Wickham所开发的ggplot2是如此人性化, 不同于R根底绘图和从前的lattice那样参数满天飞, 而是抛弃了许多繁琐细节, 并以人的思想进行高质量作图。在ggplot2包中, 加号的引进革命性的, 这个奇特的符号完成了一系列图形语法叠加, 也是这个符号, 让许多人喜爱上了用R来进行核算绘图。

Jupyter Notebook

Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支撑运转 40 多种编程言语,能够用于编写编写美丽的交互式文档的人来说是一个强壮东西。Jupyter Notebook 的实质是一个 Web 运用程序,便于创立和同享文学化程序文档,支撑实时代码,数学方程,可视化和 markdown。

DASK

Dask是一款用于剖析核算的灵敏并行核算库。

Dask由两部分组成:

针对核算优化的动态使命调度。这与Airflow,Luigi,Celery或Make相似,但针对交互式核算作业负载进行了优化。

“大数据”调集, 像并行数组,数据框和列表相同,它们将通用接口(如NumPy,Pandas或Python迭代器)扩展到大于内存或分布式环境。 这些并行调集运转在动态使命调度器之上。

在Dask官网文档能够检查愈加具体的信息。