材料インフォマティクス(Materials Informatics)
4つのインフォマティクスのうち、「材料インフォマティクス」について概説する。
参考ドキュメント
- マテリアルズインフォマティクス(MI)とは? | MATLANTIS https://matlantis.com/ja/resources/blog/what-is-materials-informatics/
- 吉田、マテリアルズインフォマティクス概説(2021) https://www.ism.ac.jp/editsec/toukei/pdf/69-1-005.pdf
1. 材料インフォマティクスとは何か
材料インフォマティクス(Materials Informatics, MI)は、材料の組成・構造・プロセス条件と、物性・性能・信頼性などの出力をつなぐ「データ駆動型の材料設計・探索」の枠組みである。
従来の「経験+試行錯誤」や「理論計算+勘」に加えて、
- データベース
- 機械学習・統計モデル
- 最適化・ベイズ最適化 などを活用し、
- 欲しい特性を満たす候補材料を効率よく見つける
- 潜在的な有望材料の“探索空間”全体を俯瞰する
ことを目指す。
この wiki では、材料インフォマティクスを「材料そのもの(組成・構造)」にフォーカスしたデータ駆動設計 として整理し、計測インフォマティクス(実験データ処理)、 プロセスインフォマティクス(プロセス条件設計)、物理インフォマティクス(物理モデル+データ)とは役割を分けて記述する。
2. 対象とスコープ
材料インフォマティクスが直接扱う主な対象は:
材料の「組成」
- 元素組成(例:Fe–Co–Ir の原子%、ドープ量、添加元素)
- 相構成(フェライト+オーステナイト、アモルファス+ナノ結晶など)
材料の「構造」
- 結晶構造(空間群、格子定数、局所配位)
- ミクロ・メゾ構造(粒径、析出物分布、磁区構造など)
- ディスクリプタとして表現された構造特徴(局所環境指標、グラフ表現)
材料の「機能・特性」
- 電子物性:バンドギャップ、DOS、スピン分極など
- 機械特性:強度・靭性・ヤング率など
- 磁気特性:飽和磁化、保磁力、損失、磁歪など
- 熱・輸送特性:熱伝導率、イオン伝導度など
プロセス条件(温度履歴、圧力、冷却速度など)や計測レシピは
- 主に「プロセスインフォマティクス」「計測インフォマティクス」の範囲とし、
ここでは「材料そのものの表現」と「特性予測・設計」を中心に扱う。
3. 材料データと特徴量
材料インフォマティクスの中心的な作業は、
- 材料を「数値ベクトル」として表現する(特徴量化)
- そのベクトルから物性・性能を予測するモデルを構築する
ことである。
3.1 組成ベースの特徴量
元素組成から直接構成するディスクリプタ
- 原子番号、電気陰性度、イオン半径、価電子数などの元素特性の
- 加重平均
- 分散・最大値・最小値
- 合金系では「組成空間上の位置」として表現できる。
- 原子番号、電気陰性度、イオン半径、価電子数などの元素特性の
例:
- 平均電気陰性度、電気陰性度の分散
- 平均原子半径、不整合度(平均からの偏差)
- d 電子数の平均、磁性をもたらす元素の割合 など
3.2 構造・結晶ベースの特徴量
結晶構造情報から抽出するディスクリプタ
- 空間群、対称性に関連する指標
- 原子間距離分布(RDF)、局所配位数
- サイト別の Wyckoff 位置、占有率
グラフベースの表現
- 原子をノード、結合・近接をエッジとみなすグラフ構造
- グラフニューラルネットワーク(GNN)で直接扱う場合、 「手で特徴量を作る」ステップを省略できる。
3.3 マルチモーダル情報
- 計測データ(XRD/XAFS/XMCD など)やシミュレーションデータ(DFT, MD)と組み合わせ、
- 材料インフォマティクス側では「組成+構造」を、
- 計測インフォマティクス側では「スペクトル・画像」を、
それぞれ特徴量として扱い、後段で統合する、
といった分担も考えられる。
4. モデル・手法
ここでは「材料の組成・構造 → 特性」を扱う代表的手法に絞る。
4.1 教師あり学習
回帰モデル
- 目的:特定の物性値(磁化、熱伝導率など)を予測する。
- モデル例:
- 線形回帰、リッジ・LASSO
- ランダムフォレスト、勾配ブースティング
- ニューラルネットワーク(MLP, GNN など)
分類モデル
- 目的:特性のクラス(超伝導 / 非超伝導、高損失 / 低損失など)を判別する。
- モデル例:
- ロジスティック回帰、SVM、ランダムフォレスト、
- グラフニューラルネットワークによる物性クラス分類
4.2 教師なし学習・クラスタリング
目的:
- 新材料探索の前段階として、「似た性質の材料群」をグループ化する。
- 潜在的に興味深いクラスター(異常クラス)を見つける。
手法:
- PCA, t-SNE, UMAP による低次元可視化
- k-means, GMM, HDBSCAN などによるクラスタリング
4.3 ベイズ最適化・探索
材料空間(組成・構造)の探索に使う手法。
- 目的:少ないサンプル数で「特性が最大(あるいは特定の条件を満たす)」材料を見つける。
- ガウス過程回帰やベイズニューラルネットワークを用い、 「予測値+不確かさ」を活用して次の候補点を選ぶ。
実験・DFT 計算と組み合わせることで、
- 貴重なビームタイムや計算資源を「情報量の高い候補」に集中させることができる。
5. 実行ワークフロー
材料インフォマティクスの標準的なフローを材料の組成・構造に限定して整理
目的設定
- 例:
「飽和磁化 Ms ≥ X, 鉄損 P ≤ Y を満たす Fe 系軟磁性材料を探索」
「室温でバンドギャップ 1–2 eV の磁性半導体を探索」など。
- 例:
データ収集
- 公開データベース(Materials Project, OQMD など)からの構造・物性データ。
- 自前の DFT 計算・実験データ(測定条件は別ページで管理)。
- データ品質のチェック(欠損値、外れ値、重複など)。
特徴量設計
- 組成・結晶構造からのディスクリプタ生成。
- グラフ表現・局所環境指標など、物理的に意味のある特徴量を考案。
モデル構築
- 教師あり学習による物性予測モデルの構築(回帰・分類)。
- クロスバリデーションによる汎化性能の評価。
探索・最適化
- ベイズ最適化やランダム探索で、未評価の候補材料を提案。
- 有望候補を DFT/実験に回す(ここで計測・プロセス側と連携)。
フィードバック
- 新たに得た物性結果をデータベースに追加し、モデルをアップデート。
- 「学習→提案→検証→更新」のループを回す。
6. 応用例
高エントロピー合金の組成探索
- 多元系の膨大な組み合わせ空間
- 硬さ・靭性・耐食性を最適化する候補を提案
電池・触媒材料
- Li イオン伝導度、酸素還元活性などをデータ駆動で評価
- 組成空間(ドープ量・置換)をベイズ最適化で効率的にスキャン
磁性材料・スピントロニクス材料
- 飽和磁化、磁歪、磁気異方性の組成依存性をモデル化
- 目標値を満たす組成範囲を探索。
熱電材料・熱機能材料
- 複雑な組成・構造を持つ化合物
- 高い ZT を達成しうる候補を絞り込む
7. 注意点・限界
データ品質
- 測定条件・試料状態が違うデータを無造作に混ぜると、 ノイズに支配されたモデルになりやすい。
- データの整合性・再現性の評価が重要(計測インフォマティクスとも連携)。
外挿の危険
- 観測されていない組成・構造領域へ外挿するとき、 予測は大きく外れる可能性がある。
- 不確かさ推定(信頼区間)を導入して、「危険な予測」を識別することが望ましい。
物理的妥当性
- 単に精度の高いブラックボックスモデルを作るだけでは、 「なぜその材料が良いのか」が分からない。
- 物理量に基づく特徴量設計や、物理インフォマティクス(物理モデル+データ)の導入により、 解釈性と汎用性を高めていく必要がある。
8. まとめ
- 本ページ「材料インフォマティクス」では、材料の組成・構造に関するデータを中心に、特性予測・設計のためのデータ駆動アプローチを整理した。
- ここで扱った内容は主に「材料そのものの表現(組成・構造)」と「その特性を予測・最適化するモデリング」にフォーカスしている。