HyperAI超神経

データサイエンスデータサイエンス

データ サイエンス (DS) は、大規模なデータから貴重な情報、洞察、知識を抽出することを目的としています。これは、数学、統計、人工知能、コンピューター工学などの分野の原則と実践を組み合わせて大量のデータを分析する学際的なアプローチです。これらの分析は、データ サイエンティストが、何が起こったのか、なぜ起こったのか、何が起こるのか、その結果何ができるのかなどの質問と答えを行うのに役立ちます。

データサイエンスの歴史

データ サイエンスという用語は新しいものではありませんが、その意味と含意は時間の経過とともに変化してきました。この用語は、統計の別名として 1960 年代に初めて登場しました。コンピューター サイエンスの専門家がこの用語を正式なものとし、データ設計、データ収集、データ分析の 3 つの側面を含む独立した分野とみなしたのは 1990 年代後半になってからです。データサイエンスという用語が学界の外で使用されるようになるまでには、さらに 10 年かかりました。 

データサイエンスの未来

人工知能 (AI) と機械学習 (ML) のイノベーションにより、データ処理がより高速かつ効率的に行われます。業界の需要により、データ サイエンスの分野でコース、学位、仕事のエコシステムが生まれました。データ サイエンスは、部門横断的なスキルと経験の需要により、今後数十年間にわたって力強い成長が続くと予想されるトレンドを代表しています。データ サイエンスの多くの部分は HPC の範囲外ですが、他の多くの部分は HPC の強力なコンピューティング能力に依存して、さまざまなデータ分析タスクを実行します。これは、調査対象のデータ サイエンスのワークロードに応じて、MPI または高度な並列性になります。

参考文献

【1】https://aws.amazon.com/cn/what-is/data-science/