大気環境デジタルツインで人為起源の温室効果ガス放出量を導き出す
── 温室効果ガスの日々の変動を調べることで、どのようなことが分かるのですか。
八代:気候変動を抑制するための国際的な取り決めであるパリ協定では、各国がCO2やメタンなどの温室効果ガスを人為的にどれくらい排出したのかを報告することになっています。その報告が正しいのかどうか確かめるには、温室効果ガスの観測データから、森林や海など自然界で放出・吸収された分を差し引いて、人為起源の放出量を導き出さなければなりません。
ただし、ある場所の森林や海がどれくらいCO2を放出・吸収しているのかを正確に推定することは容易ではありません。例えば森林ならば、植物の光合成で吸収されるCO2量や、植物の呼吸や微生物による土壌有機物の分解で放出されるCO2量は、日射量や気温などさまざまな条件によって時々刻々変動するからです。地球全体を対象に、精度良くCO2の日々の変動を追跡することで自然界の放出・吸収量の把握(逆推定)につなげることができます。それにより、人為起源の放出量推定の誤差を減らすことができるのです。
── どのようなシステムを構築しているのですか。
八代:「大気環境デジタルツイン」です。それは、観測データとシミュレーション、それらを数学的な手法で融合するデータ同化技術を駆使することによって、現実とそっくりの大気環境の変動を再現する双子(ツイン)を計算機の中につくることです。私たちNIESと環境省、JAXA(宇宙航空研究開発機構)が共同で打ち上げた人工衛星「いぶき」シリーズの温室効果ガスの観測データや、世界中の観測点から集まってくる気象データなどを収集しつつ、「NICAM(ニッカム)」という全球大気モデルでシミュレーションを行い、データ同化によってそれらを組み合わせた結果を可視化する、というシステム全体をmdx上に構築しました。温室効果ガスだけでなく、PM2.5など大気汚染物質も対象にしています図1。
図1 大気環境デジタルツインシステムのプロトタイプ
データ収集・前処理から解析、情報公開までを日々行うシステム全体をmdx上に構築することができました
── 八代 尚 氏
研究所全体の計算環境を仮想化基盤で構築することを検討
── なぜmdxを選択したのですか。
八代:NICAMは全球雲解像モデルともいわれ、スーパーコンピュータ「京」や「富岳」で超高解像度のシミュレーションを行い、温暖化した地球でどのような台風が出現するのか、といったことを明らかにしてきました。NICAMを用いて、CO2など温室効果ガスの動きもシミュレーションすることができます。
ただし私たちの大気環境デジタルツインは、シミュレーションとデータ同化だけでなく、データ収集・前処理から結果の公開までを含むシステムを毎日稼働させるものです。NIESにもスーパーコンピュータがありシミュレーションだけなら可能ですが、データ収集・前処理や情報公開のためのサーバーを新たに用意する必要がありました。
これまでは、それぞれの研究グループが物理マシンを購入して環境設定を行い、メンテナンスやセキュリティー管理を行い、5年ほどで物理マシンを更新して、設定をし直していました。
もうそんな時代ではありません。mdxの仮想マシンで環境を構築すれば、ハードウエアに縛られず、マシン環境そのものを別の環境に移して使うこともできます。mdxで構築したマシン環境を、民間のクラウド上で動かすことも可能です。そのような可搬性を重視して、NIESでは研究所全体の将来の計算・データプラットフォームをmdxとよく似た仮想化基盤で構築することを検討しています。それぞれの研究グループが物理マシンを購入して環境設定するのではなく、所内共有の仮想化基盤上で仮想マシンを使ってもらうのです。それによりセキュリティーやメンテナンスも一元管理できます。これに先駆けた取り組みとして、mdxを利用して大気環境デジタルツインの構築を進めています。
気軽に試せる環境は非常に重要
── 実際にmdxを使ってみた感想をお聞かせください。
照井:mdxの仮想マシン環境を構築する実務は、私一人で行っています。大気環境デジタルツインを民間クラウド上に構築することも可能ですが、mdxに比べてコストが10倍以上かかってしまうでしょう。mdxは利用コスト
※1
が低いだけでなく、事務局が東京大学 情報基盤センターでもあるため、利用料金の支払い方法が公的研究機関の会計ルールに適合的です。
民間クラウドは機能が充実している分、機能を理解するために膨大なドキュメントを読み込む必要があり、研究機関だけで全ての機能を使いこなすのは難しい面があります。用語もクラウドサービスごとに異なり、一度、特定のクラウドを使い始めると、そのエコシステムに組み込まれてしまいます。
一方mdxで提供されるサービスは特定の機能に絞り込まれているので、比較的容易に機能を理解してシステムの設計・構築を始めることができました。ドキュメントだけでなく、Slackで運用側に相談することもできます。
mdxの最大の長所は、試行錯誤しながらシステムを設計・構築しやすいことだと感じました。例えば私は、NICAMの計算をさまざまなCPU数とノード数の組み合わせで実行してみました。このような試行錯誤は物理マシンでは事実上不可能ですし、民間クラウドだと高コストになってしまいます。mdxの仮想マシンならば簡単です。
そのNICAMベンチマークの結果が図2です。棒グラフ(左軸)が計算時間で、折れ線グラフ(右軸)が1回の計算で消費されるポイントを示します。ノード数が多くなるほど(グラフの右側にいくほど)並列化されていくため計算時間は短くなりますが、ノード数の増大により仮想マシンのストレージ消費も増えるため、全体の利用コストも増えていきます。16ノードを超えても計算時間はそれほど短くならないことが分かり、実際の計算ジョブでは16CPUと10ノードの組み合わせを採用しました
図2 NICAMベンチマークの結果
棒グラフは計算時間(秒・左軸)。折れ線グラフはNICAMベンチマークを動かした際に消費されるmdxポイント(1ポイント=1円・右軸)。
図3がシステムの概要図です。システム全体で309個のCPUと21TBのストレージを利用しています。仮想環境の中に、複数ユーザーによる利用を前提とした認証やファイル共有、仮想マシンのホスト名を解決するDNSや、仮想マシンのステータスをモニタリングする機能、コンテンツを公開するためのWebサーバーを配置しています。計算ジョブはMPIコントローラーからMPIメンバーへ投入されます。
このシステムを24時間稼働させた場合のmdxのコストは2,000円程度で、年間で73万円(2,000円×365日)になりました。仮想マシンを必要なときだけ起動したり、最適化することで、コストを下げられる余地があります。
図3 mdxに構築されたシステム概要図
VMはmdx内に構築された仮想マシンを示す。各VM下部に示されたテキストが各VMの役割を示す。ユーザーは限定されたNIES IP AddressからGlobal IP Addressにアクセスすると、Login Serverにログインすることができる。各機能はシステム内部で完結しており、研究に必要な計算環境を閉鎖環境内部で自由に設計・構築できる。
作図はdraw.io(https://app.diagrams.net/)を使用
※2
。
試行錯誤しながらシステムを設計・構築しやすいmdxは研究機関に適しています
── 照井健志 氏
mdxは試行錯誤して得たノウハウを利用者間で蓄積・共有できる
── mdxの改善点はどこでしょうか。
八代:商用クラウドを利用する場合、専属のSEや外注業者に委託すれば問題なく使えますが、システム設計・構築や運用上のノウハウは、外注業者やシステムの担当部署に囲い込まれてしまうことが多いでしょう。一方mdxでは、Slackで運用側やほかの利用者とオープンにコミュニケーションができます。質問したり不具合を報告したりしてノウハウを利用者コミュニティーで蓄積・共有し、試行錯誤しながら使いやすい環境を構築していくことができるのです。ここがmdxの大きな長所だと思いますが、まだmdxの利用者コミュニティーは未成熟です。そこが改善点だと思います。
照井:私はmdxのSlackで積極的に発言するようにしていますが、ほかに発言する人がとても少ないのが現状です。mdxの利用を検討している皆さんに「まずmdxの利用を試しに始めてみましょう。そしてぜひSlackで発言してください」と言いたいですね。私たちもほかの利用者のノウハウに学びたいのです。
── 最後に、mdxの今後の利用計画についてお教えください。
八代:現在の大気環境デジタルツインは、まだ低解像度で可視化した予測結果の公開もNIES内部に限っています。今後は高解像度化を進めてさらに予測精度を高め、一般の方々に結果を公開していくつもりです。先述のように、NIES全体の計算・データプラットフォームをmdxライクな環境に移行できた暁には、mdxとのシステム間連携についても積極的に検討していきたいと思っています。
取材・構成:立山 晃/フォトンクリエイト
撮影:吉田 号/STUDIO CAC