会員登録について

ワーキングペーパー

科学のためのデータとAI:重要な考慮事項

本稿では、人工知能(AI)向けの科学データを準備する際に考慮すべき技術的、倫理的、環境的要因の概要と、これらの要因が「オープンサイエンス」運動とどのように整合しているかについて解説します。本稿で提示される情報は、研究者、データ実務家、科学団体、そして科学政策立案者にとって重要です。

この論文は、AI のさまざまな技術的側面とそれが科学に与える影響を探る 3 部構成の入門書シリーズの一部です。

  1. 科学におけるAIの種類
  2. 科学におけるAIの環境影響に関する考察
  3. 科学におけるAIのためのデータ

最初のセクション 基本的な概念を紹介し、科学データを AI 対応にすることの利点と課題について説明します。

XNUMX番目のセクション AIのためのデータ準備、そして逆にAIによるデータキュレーションにおける重要な考慮事項を検証します。データ標準を基盤に、機械可読性やバイアス軽減といったAI特有の考慮事項を議論するとともに、科学分野におけるAIのためのデータ準備に関する倫理的・環境的考慮事項にも焦点を当てます。

XNUMX番目のセクション オープンサイエンスの枠組み内でのデータの準備状況について説明し、オープンサイエンスの実践が科学研究における AI の準備状況をどのようにサポートできるかを示す 2 つのケース スタディを紹介します。

クライアントの声

  • 既存のデータフレームワークと標準への収束FAIR-R や Croissant などのデータは、科学者やデータ管理者が使用する必要があります。
  • データガバナンス構造 公平性、コンピューティング リソースへのアクセス、および能力構築を促進するために、技術標準を超える必要があります。
  • データインフラとスキル開発への投資 科学における AI の効率的かつ競争力のある使用の前提条件です。
  • の認識 データ管理のキャリア 科学における人材育成と、こうしたスキルを奨励するためのインセンティブは、上記の投資を実施する上で基礎となる道筋です。

科学のためのデータとAI:重要な考慮事項

2025年9月

DOI:10.24948 / 2025.11


本研究は、カナダのオタワにある国際開発研究センター(IDRC)の助成金を受けて実施されました。本研究で表明された見解は、必ずしもIDRCまたはその理事会の見解を代表するものではありません。