ユーザー登録

サイロ化されたデータから共有された知識へ: WorldFAIR が研究の未来を形作る方法

科学者は、一貫性のない用語、構造化されていない形式、詳細の欠落などにより、研究データへのアクセスや使用において課題に直面することがよくあります。WorldFAIR プロジェクトは、FAIR (検索可能、アクセス可能、相互運用可能、再利用可能) 原則を推進してこれらの問題に対処し、データのアクセシビリティを向上させ、分野を超えたコラボレーションを促進します。プロジェクトの中核となるのは、幅広い科学分野とグローバル コミュニティを網羅する 11 のケース スタディです。

デジタルツールは、地球規模の課題に取り組む共同科学の機会をますます増やしていますが、その作業に必要な貴重なデータが研究者の手の届かないところにあることが多々あります。

データは、検索不可能なコレクションの中に埋もれていたり、特異な用語でエンコードされていたり、他のデータと簡単に連携できないような形で保存されていたり、科学者がデータの出所や使用条件など、データ自体の詳細を確認できないためにすぐに使用できない場合もあります。

「これは実は科学そのものと同じくらい古い問題なのです」と説明する。 サイモンホドソンのエグゼクティブディレクターである データ委員会(CODATA) データの可用性と使いやすさの向上に取り組む国際科学会議 (ISC) の組織。

これらのデータの問題は研究の機会を制限し、時間とお金を無駄にする可能性がある。 研究 欧州委員会が2018年に発表した報告書によると、質の悪いデータをクリーンアップして使えるようにすることは、平均的なデータ分析プロジェクトでは最も時間のかかる作業であり、総作業量の80%に達することもあります。

この ワールドフェア CODATAと国際科学会議(ISC)の共同プロジェクトは、この問題に取り組みました。このプロジェクトは、データの活用を促進することで、 FAIR (検索可能、アクセス可能、相互運用可能、再利用可能) データの原則に基づいて、機械支援分析によってサポートされるより優れたデータ管理と研究を促進します。 

プロジェクトが終了した今、CODATAは、この取り組みを継続し、拡大することを目指しています。 ワールドフェア+これには、2年間のWorldFAIRプロジェクトで学んだ教訓を実践する新しいパートナーと国際的なケーススタディが含まれます。 

新しいフェーズはプロジェクトの「連合」として構成され、科学者が技術的専門知識を共有し、互いの研究を基盤として構築できるコラボレーションの枠組みを提供します。CODATA は、潜在的なパートナーにケーススタディの提案と参加を呼びかけています。

データ相互運用性のケーススタディ

WorldFAIRの基礎となったCODATAによる最初の作業は、ISCの支援と 中国科学技術協会この形成的作業には、感染症、都市計画、災害リスク軽減という特定の分野におけるデータの使用に焦点を当てた3つのケーススタディの開発につながるワークショップが含まれていました。プロジェクトの初期段階で、CODATAはデータドキュメンテーションイニシアチブ(DDI).

これらの努力を基に、CODATAは 欧州委員会からの資金援助 WorldFAIR向け。このプロジェクトは、文化遺産、ナノマテリアル、海洋科学など、幅広い分野でのデータ利用を調査する11のケーススタディを支援しました。ケーススタディは、ブラジル、ケニア、ニュージーランド、米国を含む13か国に及びました。

このプロジェクトから得られた教訓は、11の 政策提言 科学のためのデータの利用と利用可能性を向上させるために、 クロスドメイン相互運用性フレームワーク (CDIF)は、さまざまな科学分野のデータの相互運用性を高めることを目的としています。 

同時に、CODATAは新しい 研究データ管理の用語は、この分野で使用されている用語の明確な定義を提供し、それらの用語は現在、機械可読な「FAIR語彙」と題され、人間がより読みやすい形式でオンラインですぐに利用できるようになる予定です。 

11のケーススタディはそれぞれ独自の 報告書とガイダンス データの使用については、科学のさまざまな領域にわたって適切な推奨事項を作成することを目指しています。 

ケーススタディの1つでは、 農業生物多様性受粉に焦点を当てたこの研究は、データの記述と分類のモデルがまだ定義されていない分野です。世界中の同僚からのデータと意見を基に、ブラジル、ケニア、アルゼンチン、米国、英国、オランダの6か国の研究者が、 包括的なガイドとツールセット 植物と花粉媒介者がどのように相互作用するかに関するデータ。 

これは極めて特殊なトピックですが、ほぼあらゆる場所、さまざまな分野の科学者に関係するものです。科学者は、統一された標準的な方法でデータにアプローチできるようになり、同僚の研究を基にして自分の研究を加速することが容易になります。 

「多様なアプローチとサイロ化された取り組みから、科学者や意思決定者向けに広く利用可能なFAIR植物受粉相互作用データに移行することで、種の生物学、行動、生態学、フェノロジー、進化に関する理解を深める統合研究の開発が可能になります」 ケーススタディに取り組んだ研究者を書く

別のケーススタディでは、研究者らは 災​​害リスク軽減「気候変動と人口増加により災害の深刻度と頻度がともに増加する可能性が高いため、対応策を通知する信頼できるデータの必要性がこれまで以上に重要になる」と研究者らは書いている。 

災害リスクに取り組む科学者や国内外の機関は、過去に目を向けて将来起こりうる出来事の影響を予測し、その後の被害軽減や復旧方法を理解している。また、公的機関や民間機関が運営する地上や衛星のセンサーから絶えず生み出されるデータも活用している。

しかし、このケーススタディでは、関連データの多くが FAIR データ原則に適合していないため、研究者は正確な評価を行うために必要な種類の情報を入手するのが難しいことがわかりました。災害で負傷した人の数や、災害がどれだけ急速に展開したかなど、重要な情報が欠落していることがよくあります。また、国の当局が独自の方法で主要なデータ ポイントを計算し、その作業結果を公表しないため、他者が比較することが困難になっているケースもあります。

ケーススタディチームは、広範囲にわたる調査に基づき、ますます緊急性が増すこの分野で証拠に基づく政策決定をより容易に行えるようにするための実践方法について、一連の勧告を行った。これは「より安全で、より回復力のあるコミュニティや国家を築くための基本的なステップ」であるとチームは書いている。 

国際純正応用化学連合(IUPAC)は、化学物質に関連するデータと用語を人間と機械の両方にとってより使いやすくする方法を検討するケーススタディに取り組みました。 

IUPACは 1世紀以上の経験 化学者を集めて、この分野の科学者が化学物質を扱い、化学物質について話す方法を定義し、標準化すること。しかし、デジタルツール、そしてますますAIや関連技術が新しい作業方法を提供するにつれて、IUPACのケーススタディでは、これらの標準をより効率的にし、他の科学者が化学データを再利用しやすくする方法を検討しました。 

ケーススタディの製品の一つは「料理本これは、学生、教師、働く専門家を含む科学者が化学データの取り扱い方や、自分のデータを他の人がアクセスしやすくする方法を理解するのに役立つガイドラインのオープン リソースです。 

このプロジェクトでは、世界中のさまざまな化学データベースを統合し、科学者が単一のクエリでデータを検索してアクセスできるようにする、また同様に、自分のデータが機械で読み取り可能かどうかを確認することができる、野心的な新しいオープンデジタルプロトコルについても説明しました。 

科学データのための共通言語の構築

科学者を集めて彼らが生み出すデータについて話し合い、他の人が自分のデータをどのように扱っているかを理解しようとすることは、目を見張る経験だったとホドソン氏は説明する。 

また、明確な基準と定義を設定することで、科学者は現在の研究を支援するだけでなく、次の世代がその研究を基に研究を進めることも容易になる。おそらく、元の著者が決して考えなかったような方法で研究を進めることになるだろう、と彼は付け加えた。 

「WorldFAIR でわかったことは、こうした会話を交わすこと、すべてのケーススタディを一堂に集めて、データについて、何をしているか、どのように機能しているか、どのように説明しているかについて話してもらうこと、そして場合によっては、必ずしも事前に想像していなかったつながりを特定することがいかに魅力的で有益であるかということでした」と彼は言います。 


あなたも興味があるかもしれません

blog
2018年7月19日5分読み取り

WorldFAIR: フォローアッププロジェクトで複雑な課題に取り組むためにデータを変換し続ける

もっと詳しく WorldFAIR の詳細: フォローアップ プロジェクトで複雑な課題に取り組むためにデータを変換し続ける
データサイエンス blog
2018年6月18日11分読み取り

FAIRデータ原則の実装–頭字語の背後にあるものは何ですか?

もっと詳しく FAIR データ原則の実装について詳しく学びましょう – 頭字語の背後にあるものは何ですか?

による画像 テイラーヴィック on Unsplash.


免責事項
ゲストブログで紹介されている情報、意見、推奨事項は、個々の寄稿者のものであり、必ずしも国際科学会議の価値観や信念を反映するものではありません。


このフォームに入力するには、ブラウザーで JavaScript を有効にしてください。

ニュースレターの最新情報を入手してください