回顾 2018 :最 6 的 6 个机器学习开源项目

6 年前

头条

Dao Wei

特色图像


By 超神经

过去的 2018 年,人工智能和机器学习都得到了蓬勃发展,在医疗保健、金融业、语音识别、增强现实等领域, 都能看到机器学习在其中「大展拳脚」。本文将回顾了去年最实用的六个机器学习项目,文中会附上他们的 GitHub 地址,方便大家观摩参阅。

fastai 

GitHub 地址 :https://github.com/fastai/fastai

这是 Fast.ai 发布的一个免费开源 Pytorch 库,最初是为 Fast.ai 课程的学生创建的,于 18 年 10 月正式向大众发布。

它的核心是用高效的方法,去训练高速精准的神经网络。目前已经为重要的深度学习应用程序和数据类型提供了一致的 API 。

除了高效,由于设计时考虑了从业者的程序构建思路,在简洁易用的层面上,也是相当友好。

Detetron

GitHub 地址:https://github.com/facebookresearch/Detectron

Detectron 是 Facebook AI 的成果,基于 Python 和  Caffe2 而构建,于 18 年 1 月正式开源。它是用于物体检测和实例分割研究的平台,具有多种目标检测算法,包括:

1)Mask R-CNN:使用更快的 R-CNN 结构实现目标检测和实例分割。

2)RetinaNet:基于功能金字塔的网络,使用独特的 Focal Loss 来处理问题。

3)Faster R-CNN:最常见的目标检测网络结构。

这些目标检测网络主要使用的卷积网络构架是:

  • ResNeXt {50,101,152}
  • RESNET {50,101,152}
  • Feature Pyramid Networks(with ResNet / ResNeXt)
  • VGG16

此外,而 Detectron 包含了这些算法和架构的基线结果和已训练模型,而且对 COCO 数据集支持良好。

FastText

GitHub 地址:https://github.com/facebookresearch/fastText

它也是来自于 Facebook  AI 的资料库,于 16 年开源。 FastText 库是专为文本表示和分类而设计的平台。

它支持多种语言,配备有训练过的 150 多种语言的单词向量模型。这些单词向量有多种用途,包括文本分类,摘要和翻译。

另外相比于深度模型,fastText 能将训练时间由数天缩短到几秒钟。

AutoKeras

GitHub 地址:https://github.com/jhfjhfj1/autokeras

Auto-Keras 是一个用于自动机器学习(AutoML)的开源软件库。它由德州 A&M 大学的 DATA Lab 和社区贡献者开发而来,使用的方法是高效神经构架搜索(ENAS)。

AutoML 的终极目的,是提供无门槛的访问工具,让没有数据科学或机器学习背景的人,能轻松的访问和使用 ML 。 Auto-Keras 则在这个方面迈出了一步,它能提供自动搜索深度学习模型和超参数的功能。

Dopamine

GitHub 地址:https://github.com/google/dopamine

Dopamine 是 Google 基于 TensorFlow 开发的产品,它是一款强化学习算法快速原型设计的研究框架。灵活易用,能实现标准的 RL 算法,指标和基准。

根据 Dopamine 的文档,看到设计的原则是:

  • 操作简单:帮助新用户运行基准实验
  • 开发灵活:促进新用户创造出新的理念
  • 紧凑可靠:为以前的新流行的算法提供保障
  • 克重复性:确保结果可重复

vid2vid

Vid2vid 项目是 Nvidia 的研究成果,关注的是视频到视频的合成问题。 Vid2vid 算法的目标是学习从输入源视频到输出照片拟真视频的映射函数。最终输出视频精确地描绘了源视频的内容。

GitHub 地址:https://github.com/NVIDIA/vid2vid

这个库的优点在于:它提供了几个不同的 vid2vid 应用程序,包括自动驾驶/城市场景,人脸和人体姿势。还附带有丰富的指令和功能,包括数据集加载,任务评估,培训功能和 多 GPU 等。