2018 年を振り返る: 機械学習オープンソース プロジェクト トップ 6

6 年前

見出し

Dao Wei

特色图像


超神経質で

過去 2018 年には、人工知能と機械学習の両方が精力的に発展し、医療、金融、音声認識、拡張現実などの分野で機械学習が「その力を発揮している」ことがわかりました。この記事では、昨年最も実用的な 6 つの機械学習プロジェクトをレビューします。便宜上、その GitHub アドレスを記事に添付します。

ファスタイ 

GitHub アドレス:https://github.com/fastai/fastai

これは、Fast.ai によってリリースされた無料のオープンソースの Pytorch ライブラリであり、元々は Fast.ai コースの学生向けに作成され、2018 年 10 月に正式に一般公開されました。

その核心は、効率的な方法を使用して高速かつ正確なニューラル ネットワークをトレーニングすることです。重要な深層学習アプリケーションとデータ型に対して一貫した API が提供されるようになりました。

効率的であることに加えて、実践者のプログラム構築のアイデアを念頭に置いて設計されているため、シンプルさと使いやすさの点で非常にユーザーフレンドリーです。

デテトロン

GitHub アドレス:https://github.com/facebookresearch/Detectron

Detectron は Facebook AI の成果であり、Python と Caffe2 に基づいて構築され、2018 年 1 月に正式にオープンソース化されました。これは、オブジェクト検出とインスタンス セグメンテーション研究のためのプラットフォームであり、次のようなさまざまなターゲット検出アルゴリズムを備えています。

1) R-CNN のマスク: より高速な R-CNN 構造を使用して、ターゲットの検出とインスタンスのセグメンテーションを実現します。

2) RetinaNet: 機能ピラミッドに基づいたネットワークで、独自の焦点損失を使用して問題を処理します。

3) より高速な R-CNN: 最も一般的なターゲット検出ネットワーク構造。

これらのターゲット検出ネットワークで使用される主な畳み込みネットワーク アーキテクチャは次のとおりです。

  • レスネクスト {50, 101, 152}
  • レスネット {50、101、152}
  • 機能ピラミッド ネットワーク (ResNet/ResNeXt を使用)
  • VGG16

さらに、Detectron には、これらのアルゴリズムとアーキテクチャのベースライン結果とトレーニング済みモデルが含まれており、COCO データ セットを適切にサポートしています。

ファストテキスト

GitHub アドレス:https://github.com/facebookresearch/fastText

これも Facebook AI データベースからのもので、2016 年にオープンソース化されました。 FastText ライブラリは、テキストの表現と分類のために設計されたプラットフォームです。

複数の言語をサポートし、150 を超える言語のトレーニング済みワード ベクトル モデルを備えています。これらの単語ベクトルは、テキストの分類、要約、翻訳など、さまざまな目的に使用されます。

さらに、ディープ モデルと比較して、fastText はトレーニング時間を数日から数秒に短縮できます。

AutoKeras

GitHub アドレス: https://github.com/jhfjhfj1/autokeras

Auto-Keras は、自動機械学習 (AutoML) 用のオープンソース ソフトウェア ライブラリです。これは、テキサス A&M 大学の DATA Lab とコミュニティの貢献者によって、Efficient Neural Architecture Search (ENAS) を使用して開発されました。

AutoML の最終的な目標は、データ サイエンスや機械学習の背景がない人でも簡単に ML にアクセスして使用できるように、バリアフリーのアクセス ツールを提供することです。 Auto-Keras は、深層学習モデルとハイパーパラメーターの自動検索を提供することで、この点で一歩前進しています。

ドーパミン

GitHub アドレス:https://github.com/google/dopamine

Dopmine は、TensorFlow に基づいて Google によって開発された製品であり、強化学習アルゴリズムのラピッド プロトタイピングのための研究フレームワークです。柔軟で使いやすく、標準的な RL アルゴリズム、インジケーター、ベンチマークを実装できます。

Dopmine のドキュメントによると、設計原則は次のとおりです。

  • 使いやすい: 新規ユーザーがベンチマーク実験を実行するのに役立ちます
  • 開発の柔軟性: 新しいユーザーが新しいアイデアを生み出すのを促進します。
  • コンパクトで信頼性: 新しいアルゴリズムと過去の人気のあるアルゴリズムを保護します。
  • 再現性: 結果が再現可能であることを確認します。

vid2vid

Vid2vid プロジェクトは Nvidia の研究の成果であり、ビデオ間の合成に重点を置いています。 Vid2vid アルゴリズムの目標は、入力ソース ビデオから出力フォトリアリスティック ビデオへのマッピング関数を学習することです。最終的な出力ビデオは、ソース ビデオのコンテンツを正確に表します。

GitHub アドレス:https://github.com/NVIDIA/vid2vid

このライブラリの優れている点は、自動運転/都市シーン、顔、人間のポーズなど、いくつかの異なる vid2vid アプリケーションを提供していることです。また、データセットのロード、タスク評価、トレーニング機能、マルチ GPU などを含む豊富な命令と機能も付属しています。