デジタルツインに最先端のAI技術を活用する

デジタルツインの成功には効果的なAI活用が欠かせない。制御、シナリオ分析、予兆保全、ロジスティクス最適化等において、AIを用いて製品・サービスの付加価値を向上し業務を効率化することが期待されている。

AI活用の必要性は謳われているものの、デジタルツインの構築における最先端のAI技術の使い方についての具体的な知見はそれほど共有されていない。数年前からAI活用を進めている企業では、顧客や業務のデータが蓄積され、画像やテキスト、ログから特徴を抽出するAIが実用化され始めている。そのような先進的な企業においても、AIに使われている技術はパターン認識等の基本的なものが中心であり、深層学習の特徴である潜在表現を生かしたものや、因果関係まで踏み込んだもの、人の能力をAIに取り込んだものを活用した例はほとんどない。

本記事では、デジタルツインの主要な要件について整理し、その実現のために役立つ最先端のAI技術について説明する。幅広いAI技術について取り扱うことで、デジタルツイン構築やDX推進を検討する方々のアイディアの助けとなれば幸いである。本記事で紹介する各技術の詳細については、今後別の記事で説明したい。

デジタルツインの主な要件

デジタルツインでは、現実世界をデジタル世界で再現し、その中でシナリオ分析や未来予測、コラボレーションを実現することができる。前回の記事では、デジタルツイン構築の原則とベストプラクティスについて紹介した。本記事ではそこからもう一歩踏み込んだ要件の検討を実施する。デジタル世界とエージェントに絞って解説するが、その他にも非機能面の要件はもちろん、メタバースのような世界観を目指す場合には経済モデルや社会モデルを必要とする場合もあるだろう。

デジタル世界

デジタル世界の構築はデジタルツインの最も基本的な要件である。現実世界をデジタル世界に再現することで、計算機上で様々な応用を実現することができる。現実の物体を精巧にスキャンした厳密なデジタル世界を再現することもあれば、抽象的な構造のみを抽出する場合もある。いずれの場合においても、現実世界とデジタル世界が何らかの条件においてリンクしている必要がある。

一般的には、デジタル世界は3Dや2Dモデルによって作成される。3Dや2Dモデルを作成し描画する技術は既に成熟しており、一定の能力があれば容易に作成することができる。最近では既製品のモジュールを組み合わせることで、個人でも大規模なモデルを作成し、全世界に向けて公開することができる。

一方で、デジタル世界と現実世界を高精度にリンクさせるのは難しい。デジタル世界を精密に再現するためには、高価なスキャナーやセンサーを使ってデータを収集し、専用のソフトウェアを使ってモデルを作成する必要がある。もちろん、現実世界に何らかの変更がある場合には再測定しなければならず、モデル作成と維持に多大な労力を必要とする。

また、実用においては限られた観測からデジタル世界を再現しなければならない場合が多い。たとえば、工場の製造ラインのすべてをリアルタイムでトラッキングするのは非常にコストがかかるため、実用上は工作機械やライン上の主要なポイントに対して局所的にセンサーを配置し、効率よくデータを収集することを目指す。最初から最適な配置を考え出すことは難しいため、継続的な改善によって効率を高めていくことを前提とする。

さらに、複雑な物理現象が介在する場合には計算コストの大きい専門的なソフトウェアを必要とする。リアルタイム性を要件とする場合には物理計算がボトルネックになりやすい。

以上のように、デジタル世界の構築にはさまざまな技術的課題が存在するが、最新のAI技術を用いることでこれらを解決できる可能性がある。

エージェント

デジタルツインのメリットの一つは、現実世界とリンクしたエージェントをデジタル世界で活動させられる点である。人や工作機械、商品、車両等、アプリケーションによってさまざまなエージェントが存在する。

エージェントは基本的に現実世界の対象と1対1で紐づいており、その対象や対象の属する組織のためにデジタル空間上で活動する。エージェントの活動はデジタル空間上で完結する場合もあれば、現実世界の対象に働きかけることで実世界に影響を与える場合もある。

エージェントは、与えられた目的に対して自身の持つリソースや知能、外部から与えられる権利や制約を用いて活動を行う。単純な手続きをこなすだけの場合もあれば、不確実性の大きい複雑なタスクを要求されることもある。

また、物事の構造を適切に把握したい場合には、因果構造を考えられるエージェントを構築する必要がある。たとえば、工場の改善の効果検証を行うためには作業員と機械の関係等を考慮する必要がある。このような場合には、データ量や計算能力だけでなく、解析の前提やデータの生成過程等に至るまで詳細に検討しなければならない。

上に挙げたような場合には、従来型のAI技術では不十分であり、効果的な機能を構築するためには最先端のAI技術を必要とする。

AIでデジタル世界を構築する

本節では、デジタル世界を構築するうえで役に立つ最先端のAI技術について紹介する。

ニューラルフィールド

ブラウン大が発表したレビュー論文では、以下のようにニューラルフィールドが定義されている。

Definition1 A field is a quantity defined for all spatial and/or temporal coordinates.

Definition2 A neural field is a field that is parameterized fully or in part by a neural network.

日本語に訳すと「定義1:フィールドとはすべての時間および・または空間座標に定義される量である」、「定義2:ニューラルフィールドとはニューラルネットワークによって完全にまたは部分的にパラメーター化されたフィールドである。」となる。この定義より、ニューラルフィールドを用いることで時間空間座標上における何らかの量を取り扱うことが期待できる。

NeRF (Neural Radiance Fields) と呼ばれる技術では、ある物体を周囲様々な位置から撮影した画像から色や密度の分布を学習しボリュームレンダリングを行い、その物体の3次元形状を復元することができる。このとき学習するのがNeRFと呼ばれるものであり、2020年に最も注目されたAI技術の一つである。

NeRFのメリットとしては、2Dの画像から3D表現を獲得できる点や、従来とは異なり連続的な3D表現を獲得できることが挙げられる。デメリットとしては、シーン毎にニューラルフィールドを学習しなければならず汎用的に用いることができない点が挙げられる。動的なシーンを学習する方法Transformerを用いて未知のシーンを生成する方法が提案されており、近い将来には汎用的なシーン生成器として活用できる可能性がある。

効果的にシーンを生成できるニューラルフィールを構築することができれば、さまざまなデジタルツインの応用に活用できるだろう。たとえば、Preferred NetworksではNeRFを用いて3D映像を構築したデモを公開している。

サロゲートモデル

自動車や航空機の性能評価では、物理シミュレーションによって構造や熱効率の解析を実施する。これらを含むデジタルツインのさまざまな応用において、物理シミュレーションが必要とされる。

近年ではマルチフィジックス解析等の複雑な解析の需要も増えており、物理シミュレーションの実行コストがますます高まっている。たとえば、地球規模の天気をシミュレーションするためにはスーパーコンピューターレベルの計算機が必要となる。しかしながら、一般企業がそのような計算資源を継続的に確保することは非現実的である。

そこで、最近注目されているのがサロゲートモデルと呼ばれる技術である。たとえば、RANS(Reynolds-Averaged Navier-Stokes)と呼ばれる乱流モデルはOpenFOAM等のツールを用いて計算するのが一般的であるが、複雑な解析を実行するためには長時間の実行時間を要する。一方で、Deep-Flow-Predictionと呼ばれるフレームワークを使ってサロゲートモデルを作成すると短時間で計算を実行できる。

Experiment results of Deep-Flow-Prediction (Thuerey 2020)

サロゲートモデルとは、従来型の物理モデルの代わりに計算実行を行うAIモデルのことである。物理モデルと同等の精度は出せないものの、条件を限定し丁寧にチューニングすれば非常に高い性能を発揮できる。サロゲートモデルを学習させるのは容易ではないが、上記のようなオープンなフレームワークやベンダーが提供するツールを用いることで、専門的な知見を持たない企業でも活用することができる。

AIエージェントを実現する

本節では、AIエージェントを構築するうえで役に立つ最先端のAI技術について紹介する。

世界モデル

世界モデルは2018年にDavid Haによって提案されたモデルベース強化学習の技術である。世界モデルを用いると、強化学習を行う環境の潜在的な表現を学習し、エージェントの学習に役立てることができる。また、世界モデルではシミレーションによって生成した潜在空間上でエージェントを効率よく学習させることができる。

Flow diagram of an agent model (Ha 2018)

国内では松尾研究室が世界モデルに関する講座を開いていたり、JSAIの全国大会でもセッションが組まれていたりしており、注目を集めている技術である。Preferred Networksの岡野原氏は、World Modelの発表があったNIPS2018の直後に日経Roboticsに関連記事を掲載している。強化学習固有の問題やそれに対するWorld Modelの位置付け等が詳細に説明されており、非常に有意義な解説となっている。未読の場合には是非一読されたい。

世界モデルはモデルベース強化学習の一つであり、環境をモデル化する部分に特徴がある。モデル化によって必ずしも性能が向上するとは限らず、Atariと呼ばれるベンチマークでは長らくモデルを使わないモデルフリーの方法が優位となっていた。しかし、2020年にGoogle AIが発表したDreamer V2論文では、世界モデルベースの方法によってモデルフリーの性能を上回った。それ以降は、Transformerの適用や、さらに意欲的な方法を用いたDecision Transformerの出現、ロボット制御の汎用的な特徴を学習したとされるRT-1の発表等、モデルベースの強化学習手法が大きな成果を挙げている。

筆者の知る限り、世界モデルを容易に構築できる定番ツールは存在しない。世界モデルのコンセプトはデジタルツインにおけるエージェントの制御に大いに役立つものであり、適切なツールが整備され構築ノウハウが蓄積されると爆発的に広がる可能性があるだろう。

因果推論

デジタルツインを活用する中で、興味深い現象のメカニズムを知りたい場面や、あるプロセスで起きた問題根本的な原因を探りたい場面に出くわすことがあるかもしれない。適切な調査と分析を実施することで、潜在的な付加価値の創出や、長らく会社を悩ませてきた大きな課題の解決に繋がる可能性がある。

数年前にはビッグデータやデータマイニングという言葉がトレンドとなっていた。これらに関係する技術の多くは、データ間の相関関係を解析し、興味深いつながりを見出すことを目的としていた。Lassoや決定木といった方法はさまざまなアプリケーションと相性がよく、それらに関連したアルゴリズムは今でも多くのシステムで活用されている。

一方で、上記の技術ではデータ間の因果関係を適切に評価するには不十分であることが知られている。データから因果関係を推定しようとする技術は因果推論と呼ばれ、経済学や疫学を中心に広く活用されている。最近ではITや製造業においても因果推論の活用が検討され始めており、NEC等の大手ITベンダーも専用のサービスの提供を始めている。

Microsoftが開発し現在はオープンソースコミュニティーに移管されたDoWhyと呼ばれるフレームワークでは、因果効果の推定や推定結果の頑健性評価を実施するための一連のプロセスが実装されており、Pythonを扱えるデータサイエンティストであれば簡単に因果推論を実行できる。また、同じくMicrosoftが開発した機械学習ベースの因果推論ライブラリであるEconMLとの連携も容易にでき、複雑なモデルを取り扱うことができる。

因果推論を適切に実施するためには、ツールの使い方だけではなく背景の理論を知っておく必要がある。本記事では割愛するが、RubinPearlが発展させてきた方法を体系的に学ぶことで、因果推論の考え方や理論について理解を深めることができるだろう。デジタルツインで因果推論を活用するためには、基本的な数理や統計の素養を持った人材に十分な学習機会を用意することが欠かせない。

知能の獲得を加速する仕組み

微分可能シミュレーター

意思決定やロジスティックの計画では、顧客や企業の利益に基づいて設計された目的関数に応じて最適化を実施する。最適化はロケットの制御やタクシーの配車、経営における意思決定に至るまで様々なアプリケーションに活用されている。

TensorFlowやPyTorch等の深層学習フレームワークには自動微分と呼ばれる機能が実装されており、ニューラルネットワークのパラメーターを最適化するための勾配を計算するために用いられている。この自動微分機能を用いて、ニューラルネットワークを含む様々なものの勾配を計算し、最適化する試みがなされている。最近では自動微分ライブラリとしてJAXの人気が向上しており、アカデミアや先進的なIT企業を中心に導入が進んでいる。

現在では、様々な研究機関や企業から微分可能シミュレーターが提供され始めている。DiffTaichiは微分可能な物理シミュレーションを実行できる技術であり、当該論文中では弾性物体のシミュレーション等が実証されている。BraxはGoogleが開発したJAXベースのロボティクスシミュレーターであり、この上で高速化つ大規模な強化学習ロボットの訓練を実施できる。NVIDIAからはIsaac Simとしてロボティクスシミュレーターが製品化されている。NVIDIAはメタバースアプリケーションの作成、運用プラットフォームであるOmniverseの提供も進めており、当該分野における高い存在感を示している。

Examples of environments in Brax (Freeman 2021)

今はまだ決定版の製品やツール等はないものの、今後さらに技術が発展することで、デジタルツイン構築にも役立てることができるようになるだろう。もちろん、今からでも上記のシミュレーターやJAX等の自動微分ツールを用いて開発することは可能であるので、意欲的な企業には積極的に挑戦してもらいたい。

Human-in-the-loop AI

AIを人間社会に適合させるためには、AIの学習や運用において人間を介在させる必要がある。このような考え方でAIを作ることをHuman-in-the-loop AIと呼び、AIの性能向上とともにその必要性が高まっている。

AIによる差別やその他不適切な出力は社会問題となっており、チャットボットやローン審査、マーケティング等の様々なアプリケーションにおいて問題が指摘されている。最近では、テキストから画像を出力するジェネレーティブAIにおいても、センシティブな画像を出力し社会に悪影響を与える可能性について議論されている。

OpenAIでは、言語モデルの構築においてhuman-in-the-loopの技術を活用している。InstructGPTではラベル作成を実施する人間が、プロンプトと言語モデルの出力の適切な組み合わせを選択し、モデルの学習にフィードバックを行っている。この方法は世界的なトレンドを巻き起こしているChatGPTにも使われており、その効果の高さが伺える。OpenAIではAlignment researchとしてOpenAIのミッションに直結した研究活動を推進しており、今後もさらなる発展が期待される。

デジタルツインを構築する場合には、アプリケーションに応じた人間の介在方法を検討する必要がある。OpenAIのようにラベリングやモデルの学習において人間を活用する場合もあれば、MercariのようにAIを使ったサービス運用のプロセスに人間を配置しサービスとAIの両方の品質を高めるような使い方もある。自社に合った最適な活用方法を設計することで、human-in-the-loopによる効果を最大限享受することができるだろう。

まとめ

デジタルツインを効率よくかつ効果的に構築するためには、最先端のAI技術の活用が欠かせない。AI技術はかつてない速度で発展しており、ここで紹介した技術が枯れる日も遠くない。高速に進化するAI技術から果実を得るためには、自社のデジタルツインに合う技術を絶えず探し続け、野心的に挑戦し、継続的に構築、展開していくことが重要である。

本記事で取り扱わなかった技術にFoundation modelやGenerative AI、Large Language Modelがある。これらは、現在AI界で最も大きなトレンドであり、今後の技術革新を語るうえで欠かせないものである。機会があれば、製造業やエネルギー・インフラ産業、運輸業におけるこれら技術の活用についてまとめた記事を書いてみたい。

筆者の紹介

製造業やエネルギー・インフラ産業、運輸業等に向けてDX支援、AI導入支援・開発等を行っています。また、RLHFやAI Alignmentを実現するためのプロダクトの開発も行っています。

仕事のご依頼やご相談についてはLinkedInTwitterからご連絡ください。自己紹介や簡単な経歴についても掲載しております。

--

--