Science News

デジタルデータを利用した研究での個人情報保護の重要性

現代社会においては、様々な場所に大量の個人情報が集約(保管)されています。例を挙げれば、医療機関、電話・通信会社、IT関係企業、あるいは政府や地方公共団体が収集した様々な人々に関するデジタルデータなどがそうです。そのような集約データを容易に収集できる時代になったため、現在では医学の他、人々に関する傾向や昨今の動向を調査する研究などが、容易にできるようになりました。他方で、そういったデジタルデータから個人情報が特定されてしまい、思わぬ人権侵害の要因になることが強く懸念されています。

個人に関するデジタルデータを利用した研究

ゲノム医療などの研究で、患者らを含む個人についてのデジタルデータがしばしば利用されるのは言うまでもありませんが、その他の分野についても同様の事が言えます。例えば、電話・通信会社などには、当事者らの通信記録が残ります。その通信記録を詳細に調べる事により、当事者らがいつどこで対話を交わしたか、などといった事を突き止めることも出来、災害時などの消息確認や、犯罪や事故などの状況証拠として活用する事も可能です。

さらにスケールの大きな研究では、ある国における他国難民の動向を、匿名化された数百万人の通話記録を調べる事で推定し、その国での有益な政策の検討に役立つかどうかを明らかにする研究もなされていました。しかし、その研究においては、解析に使われたその数百万人の人々に対し、ほぼ無断で個人的データを利用していたという点も指摘されています。このように、デジタルデータというものは、大規模に第三者の手で無断使用されてしまう事が多いのが現状なのです。

無断使用されたデジタルデータから個人の特定まで可能

基本的に、個人情報を含むデータは関与するその個人が特定できないように、匿名化された状態で開示されるものです。しかしながら、データによっては、例え匿名の状態で開示されたとしても、その後の詳細な調査などによって、個人名などの情報が再特定されてしまう場合が多いのです。特に、研究でそういった匿名の個人情報を含むデータセットを大量に入手すると、それらのデータが全く別な方面に悪用され、特定の思想や信条を持った個人、あるいは特定の宗教などを信仰する個人らに対し、悪意を持った人間や団体などからの攻撃が発生してしまう事も懸念されます。そのような事例を防ぐためにも、匿名化された個人情報というものの安全性について、再検討する事が必要となってきます。

個人情報を含むデータを利用する側の課題

個人情報を含むデータというものから、いつどういった形で個人の特定が生じるかは様々です。中には、データ管理者(管理会社の社員など)が自らの手で、保管された個人情報そのものを第三者に横流しするなどといった事例も見られ、ニュースで報道されたりもしています。その場合は、事件として立件され刑事処分の対象になる事が多いですが、問題は、データを受け取った側の人間が、その後に独自で関連する個人を特定してしまう場合についてです。

我が国では、個人情報保護法が改定され、個人情報の匿名化はもちろんの事、研究に個人情報を含むデータを提供する際の当事者間の合意、いわゆるインフォームド・コンセントの手続きの見直しなどが盛り込まれ、データ使用者側で違反があった場合の罰則なども定められています。しかしながら、これで個人情報に対する保護が完全であると言うには、まだまだほど遠いのが現状なのです。実際に最近の研究で、匿名化されたデータセットから、個人そのものが再特定できてしまう可能性が非常に高いという事が指摘されています。結局のところ、匿名化された個人情報データなどを扱う研究者には、それらのデータに関して、ルールを良く守って良い研究に活かすか、あるいは悪用してしまうかの重大な判断が委ねられます。

預かったデータを悪用して個人への攻撃や誹謗中傷などに利用してしまうという行為は、我が国だけでなく世界を代表する存在ともいえる研究者にとって恥ずべき行為であり、決して行うべきものではないという事を強く認識するべきです。

参考文献

Nature ダイジェスト Vol. 16 No. 11(2019) 「デジタルデータを活用した研究に必要な同意とは」

L. Rocher et al. Nature Commun. 10, 3069; 2019: Estimating the success of re-identifications in incomplete datasets using generative models

  • 英文校正
  • 英訳
  • 和訳
※価格は税抜き表記になります