mdxとは

 データを最大限に利活用するためには、複数の分野、複数のセクタでの連携が重要です。従来は分野ごとにデータを共有・活用するプラットフォームを構築することが多く、分野を超えたデータ活用につなげるのは困難でした。

 mdxは、分野共通のプラットフォームであり、分野ごとの知見や文化に加えて、分野を超えたデータ科学や情報科学の知見、様々なデータやソフトウエアなどを迅速かつ効率的に連携させたデータ活用の実現を目的として導入されました。

 mdxは、高性能な計算機と大容量のストレージを備え、国立情報学研究所が運用するSINETと連携することで、広域からのデータ収集機能と、データ集積・処理機能を企業や自治体との共同研究も含めた全国の大学・公的研究機関が関与する様々なデータ活用の取り組みに提供し、さらにはデータ活用のコミュニティを形成して分野・セクタを横断した連携を触媒するハブとなることを目指します。

mdxの紹介、研究論文はこちら

mdxの特徴

データ活用社会創成プラットフォーム

「データ活用社会創成プラットフォームmdx」は、研究環境を用途に合わせてオンデマンドで短時間に構築・拡張・融合できる、データ収集・集積・解析のためのプラットフォームを提供しています。

1. SINETを活かし、リアルタイムに収集・集積したデータを、mdxのセキュアな環境で解析することを可能にします。

2. 高性能計算環境を整備することでデータ科学、計算科学の手法を融合し、さらに国内最高の計算環境を用いて他に無い高精度の予測をおこなえるようにします。

3. 様々な分野のデータ保持者、解析者、利用者のコミュニティーを形成し、新たな価値創造につなげます。

 

mdxの構成

mdxでは、仮想化技術を用いてプロジェクトごとに分離された、プライベート環境(仮想プラットフォーム)を提供します。 プライベート環境はプロジェクトごとに柔軟に環境構築・設定が可能で、各プロジェクトに必要なソフトウェアスタックを導入できます。

また、mdx上で、分野データプラットフォームサービスなど、連続稼働が必要なサービスを運用することが可能です。 共通データやオープンデータのmdx上への整備や、有償データの一括契約などを促進し、機械学習やデータマイニングが即座に行える環境を継続的に構築します。

SINET6、モバイルSINET

mdxは、SINET L2VPN/VPLSとの連携することで、公共のネットワークを通らずに遠隔の計算機と接続することが可能です。 また、モバイルSINET (SINET広域データ収集基盤)との連携で、遠隔の観測機器、モバイルデバイスとmdxをインターネットを介さずに接続することが可能です。

mdx 高性能計算環境

mdxは、データ処理、機械学習、シミュレーションなどでの大規模計算を可能にします。 さらに、ABCIを始めとする高性能計算機とも連携し、国内トップクラスの計算環境を利用可能にします。 仮想化、ネットワークスイッチでのトラフィックの分離などを併用して、システム及びプロジェクトを多重に保護します。

想定する利用方法

データレポジトリとして利用
  • 高性能計算環境は用いず、分野データプラットフォームや、共通データを閲覧、検索、ダウンロードする。
大規模データ処理・高性能計算機として利用
  • 分野データプラットフォームが提供するデータ、共通データ、自分で持ち込んだデータを高性能計算環境を用いて処理し、データマイニング、機械学習、シミュレーションなどを行う。大規模データセットを用いた機械学習や多数のデータセットを連携したデータ処理を促進する。
プラットフォームホスティング環境として利用
  • 分野データ整備やそのためのデータプラットフォーム構築をmdx上で行う。分野データプラットフォームの将来に渡る継続性とスケーラビリティを確保する、複数のデータを連携させた処理を促進する。