Skip to content
インタ―システムズ製品やソリューション、キャリアの機会などについて、検索してご覧ください。

非構造化データを構造化することで、医療情報活用の幅と可能性を広げる

熊本大学 宇宿教授インタビュー

熊本大学 宇宿教授インタビュー: 非構造化データを構造化することで、医療情報活用の幅と可能性が広がる

インターシステムズは「iKnow」と呼ばれる自然言語解析技術の日本語対応版を発表しました。これは、例えば電子カルテであれば医師の自由入力欄等に記されたテキストデータから二次利用に必要な情報を抽出することができる最新テクノロジーです。日本では 2017 年 1 月、同技術を用いた DWH が熊本大学医学部附属病院で稼働を予定しています。「iKnow」の臨床における期待について、同院の宇宿功市郎氏に聞いたインタビュー内容をご紹介しています。

非構造化データとは?

非構造化データとは、名前の通り、特定の形式や構造が定義されていないデータを指します。これに対して、構造化データは、データベースのテーブルのように、行や列といった明確な形式に整理されているデータを指します。構造化データは、検索や整理が容易であり、データベース管理システムを用いて効率的に操作することができます。一方で、非構造化データはその柔軟性ゆえに、情報を検索したり、整理したりすることが難しいという特性があります。

医療分野においても非構造化データは広く存在しています。例えば、電子カルテには医師が備考欄や自由入力欄に自由にテキストを記述することが多々あります。これらのデータは、特定の形式に従っていないため、従来の技術でも、特定の単語やデータを見つけ出すことはある程度可能ですが、その単語が医療従事者が期待した文脈で使われているかどうかを調べるには、相当の時間と労力がかかります。

非構造化データ活用の重要性

近年、よく耳にする「ビッグデータ」とは、構造化データと非構造化データのことを指します。多くの人は、データの大部分がデータベースのテーブルのように整理された構造化データだと考えがちですが、実際にはそうではありません。一般的に、構造化データと非構造化データの割合は2対8と言われており、非構造化データが圧倒的に多いのです。つまり、ビッグデータの活用とは、主に非構造化データを活用することを意味します。

医療分野においても、非構造化データの重要性が特に高まっています。前述の通り、電子カルテに記載されたテキストだけでなく、診療メモ、画像データ、患者のフィードバックなど、多くの情報が非構造化データとして存在します。これらのデータを効果的に分析することで、より正確な診断や治療法の開発が可能となり、患者のケアを向上させることができます。非構造化データの活用は、医療の質を高めるための鍵となるのです。

非構造化データを構造化する方法

非構造化データを構造化する方法として代表的な3つの技術と、インターシステムズの独自技術である「iKnow」についてもご紹介いたします。

①ELT

ELTは「抽出(Extract)」「読み込み(Load)」「変換(Transform)」のプロセスを指します。生データを取り出し、必要に応じて変換してデータレイクやDWHに保存する技術で、多くのシステムに組み込まれています。

②アノテーション

アノテーションは、非構造化データに対して意味を持つメタデータを付加する技術です。データの解釈を助けるための注釈を付けることで、データの理解が容易になります。最近では、自動化ツールも多く利用されています。

③TF-IDF

TF-IDFは、特定の単語が文書内でどれだけ重要かを評価する方法です。単語の出現頻度と、その単語を含む文書の頻度を基に計算します。これにより、文書内での単語の重要度を数値化し、情報抽出に役立てます。

④iKnow

「iKnow」は、人間が書いた一般的な「文章」を、整理・蓄積や分析に適した「データ項目」に変換する自然言語解析するインターシステムズの技術です。「iKnow」は、従来のツールのように文章を単語に分割するのではなく、言語構造に基づいて、文章中から「意味のある一連のまとまり(これを「エンティティ」と呼ぶ)」を見つけることによって解析を行います。

関連するトピックス

あなたが好きかもしれない他のサクセスストーリー

次のステップへ

ぜひ、お話を聞かせてください。 詳細をご記入の上、送信してください。
*必須項目(英語でご記入ください)
Highlighted fields are required
*必須項目(英語でご記入ください)
Highlighted fields are required
** ここをチェックすることにより、お客様は、既存及び将来のインターシステムズ製品及びイベントに関するニュース、最新情報及びその他のマーケティング目的のために連絡を受けることに同意するものとします。 また、フォームを送信することで、お客様は、お客様のビジネス連絡先情報が、米国でホストされているが、適用されるデータ保護法に従って維持されている当社のCRMソリューションに入力されることに同意するものとします。