研究データのライフサイクル:収集
収集(データ収集)とは?
収集(データ収集)とは、実験機器や他の方法(アンケートや観察など)を用いて、情報を収集するプロセスです。データの収集方法は、分野や研究対象によって異なりますが、データの品質を確保することが重要です。
また、既存のデータをプロジェクトに再利用することもできます。自身が以前に収集したデータセットや、公開されている研究データのカタログサイトから、他者のデータセットを発見することができます。
詳しくは「再利用」のページをご覧ください。
なぜデータ収集が重要なのか?
データ収集の段階は、研究成果を構築するための情報源になるだけではなく、データとその文書の両方の品質の基礎が築かれます。品質対策に関する決定が実行され、収集手順が適切に記録されることが重要です。
データ収集では何を考慮すべきか?
適切なツールや統合環境を使えば、データ収集中のデータ管理や文書化に役立ちます。データ収集時のデータ管理や文書化に適したツールとしては、電子実験ノート(ELN、Electronic Lab Note)、電子データ収集システム(EDC、 Electronic Data Capture)、実験室情報管理システム(LIMS、Laboratory Information Management System)などがあります。
さらに、共同研究用のためのオンラインプラットフォームやファイル共有サービスも、ELNやデータ管理システムとして利用することができます。
使用するツールにかかわらず、データを収集する際には、以下の点を考慮してください。
- データの由来 - サンプル、研究者、機器など
- データ品質の確保 - データは自分で作成することも、他の専門家のインフラや施設で作成することもできる
- 新しいデータを作成する代わりに、データを再利用する
- 実験計画 - 事前に収集計画(反復作業、収集手順、ランダムサンプリングなど)を含める
- 実験機器の調整(キャリブレーション)
- 機密性の高いデータを扱う場合は、データ保護方法やセキュリティに注意する
- 人間に関わるデータを扱う場合は、許可や本人の同意について検討する
- データの保存方法
- データの保存場所
- 適切なメタデータ規格
詳細はこちら
タスク
-
データ整理
Best practices to name and organise research data. -
データ品質
Ensure high quality research data. -
データストレージ
How to find appropriate storage solutions. -
文書化とメタデータ
How to document and describe your data. -
既存データ
How to find and reuse existing data. -
識別子
How to use identifiers for research data. -
センシティブデータ
How to identify different research data types.
Contributors