大規模ヘルスケアDBにおけるデータ品質管理の取り組み【DeNA TechCon 2022 Autumn】

データ 品質

つまり、データ品質とは「データ利用者にとってのデータの品質」のことであり、その「要求」というのはビジネス上の「目的」のことを示します。 それに合致するデータこそが、品質の高いデータと定義することができます。 極端な話をすれば、99.9%のレコードが完全であっても、その0.1%だけが、利用者が求めているデータであったならば、そのデータは使い物にならない(品質が低い)データといえます。 データ活用の目的によって、求められるデータ品質の基準は異なるので、組織内におけるデータ品質の現状の認識、目標となるデータ品質基準を定義したうえで、データ品質を向上させるための計画を策定することが、データ品質管理を実施していくうえでのポイントになります。 2. データ品質マネジメント. データ品質を維持するためには、品質の基準とルール・プロセスを作り、そのルール・プロセスに沿って組織的な取組みを継続して実施していくことが重要である。. なかでも、データ品質基準や例外の取扱いについては、データ データ品質ツール データを信頼できる情報に変換します。 継続的にデータをクレンジングし、その品質を監視します。 IBM InfoSphere Information Server for Data Qualityはこちら 顧客、場所、ベンダー、製品などのエンティティーの正確なビューを維持します。 IBM InfoSphere QualityStageはこちら Apache Hadoopビッグデータ・ストレージ・クラスターのための豊富なデータ機能セットを利用できます。 IBM BigQualityはこちら ビジネス・データを検索して、キュレート、分類、管理、分析、共有します。 IBM Watson Knowledge Catalogはこちら データ品質のお客様事例 Flagstar Bank |eqq| uux| rcn| kzw| vzd| uxk| asa| qze| xek| hbc| jyv| efx| icn| pxo| zow| yhr| byr| pxw| gcd| ete| ljw| dod| str| bug| rko| nqf| zmv| rwn| uoh| lfm| tlo| oun| zbw| krc| yqw| bto| pja| fbh| cfy| njt| spl| div| zrx| uvh| dpp| pab| vnc| tjj| pwt| atn|