「個人情報匿名化ソリューション」
製品概要
2017年5月改正個人情報保護法が全面施行され、個人情報を取り扱うためのルール整備が進んでいます。管理に関する厳密なルールが示される半面、適切な手続きを踏めば個人情報のデータを元にしたマーケティングが可能となる『匿名加工情報』制度が新設されており一定の条件の下で本人の同意なしに第三者への提供が可能となります。「個人情報匿名化ソリューション」は、新たなビジネスを創出するカギとなるソリューションです。

※テストエースは「株式会社システムエグゼ」の製品です。
「個人情報匿名化ソリューション」の特徴
- 「個人情報匿名化ソリューション」は、テストデータ作成ツール「テストエース」と匿名化モジュールで構成されています。
- Oracle/Microsoft SQL Server/PostgreSQLのデータベースやCSVファイルに標準で対応いたします。
- ファイル転送ミドルウェア『HULFT』シリーズ製品との併用により汎用機、その他DBMSにも対応いたします。(※)
- 個人情報秘匿化ソフト「テストエース」では、既に50社以上の実績があります。
- 「個人情報保護委員会規則で定める基準」に準拠した多くの匿名化機能を有しております。
- GUIによる簡単操作で、匿名加工情報の作成に多くの費用と工数を費やす必要はありません。
- 複数テーブル間の関連性を維持したデータ変換も可能で、金融機関をはじめ多くの企業に利用されております。
- 料金は、年間払いのサブスクリプションとなっております。
※『HULFT』シリーズは株式会社セゾン情報システムズの製品です。
適切な匿名加工義務
①データ加工における難点

②「個人情報保護委員会規則で定める基準」(個人情報保護法施行規則19条)
いわゆる「匿名加工基準」では、匿名加工情報を作成する事業者は、個人情報を以下のように適切に加工しなければならないとしております。
- 特定の個人を識別することができる記述等の全部又は一部を削除(置換を含む。以下同じ)すること
例⇒氏名は削除又は置換え - 個人識別符号の全部を削除すること 例⇒顔画像、指紋等
- 個人情報と他の情報とを連結する符号を削除すること
例⇒事業者内で個人情報を分散管理してデータベース等を相互に連結するために割り当てられているID等は削除する - 特異な記述等を削除すること
例⇒年齢116歳のように、国内で数名しかいない場合など - 上記のほか、個人情報とデータベース内の他の個人情報との差異等の性質を勘案し、適切な措置を講ずること
③「個人情報匿名化ソリューション」の機能
匿名化機能 | 機能概要 |
---|---|
トップボトムコーディング | 分析対象のデータの平均から大きく乖離するデータ群をまとめます。(特異な記述の削除) |
一般化 | 上位概念もしくは数字に置き換えます。 |
丸め | 個人情報データベース等に含まれる数値に対して、四捨五入等して得られた数値に置き換えます。 |
削除 | 加工対象となる個人情報データベース等に含まれる個人情報の記述を削除します。 |
ミクロアグリゲーション | 加工対象となる個人情報データベース等を構成する個人情報をグループ化した後、グループの代表的な記述に置き換えることとするもの。 |
疑似データ変換 | 氏名、住所、電話番号等の擬似データを標準搭載本番データに類似した擬似データに変換します。 |
マスキング変換 | 置換文字を指定し、データを置き換えます。 |
ランダム変換 | 日付データや数値データを指定された範囲の中でランダムにデータを置き換えます。 |
ユーザ定義関数変換 | ユーザーの定義したルールに沿って、データを変換します。 |
匿名化機能の例
トップ・ボトムコーディング
分析対象のデータの平均から大きく乖離するデータ群を閾値に揃えます。

一般化
対象データの上位概念に置き換えます。

丸め
対象データに含まれる数値について四捨五入当をして得られた数値に置き換えます。

削除
対象の項目/レコード/セルの削除を行います。

リレーション維持管理
データ変換後も複数テーブル間にまたがる関連性を維持しながら本番環境に酷似したテスト環境を実現します。

購買履歴の匿名加工事例 (クレジットカード利用)
クレジットカード事業者が保有するカード利用情報について、匿名加工を行った上で匿名加工情報の枠組みを活用して一般事業者へ提供する事例です。一般事業者においては、提供を受けた匿名加工情報に基づいて、年収や職業と利用加盟店等の関係を分析する事により、マーケティングに活かすことが想定されます。

出所:2017年2月個人情報保護委員会事務局「パーソナルデータの利活用促進と消費者の信頼性確保の両立に向けて」に基づいて弊社にて作成を行っております。
本ユースケースにおいて加工対象となるデータセットは、顧客属性データ・カード利用明細データの2種類からなり、いずれも契約者 ID(クレジットカード番号の変換番号)によって、リンクされています。 この2つのデータセットを個人属性情報と履歴情報とに分類すると、次のようになります。
図表:クレジットカード事業者が保有するカード利用情報におけるデータのレイアウトイメージ

どのように加工すべきか。
本ユースケースにおいて、取扱いに注意すべき情報は、個人属性情報に含まれる勤務先や年収と、履歴データであるカード利用明細データにおける利用日や利用加盟店、利用金額に関する情報と考えられます。
【個人属性情報】
<年収、勤務先>
- 勤務先の情報は、住所との組合せにより個人の特定可能性が高くなることが想定されます。
- 年収の情報が組み合わさることによって、職層等を推定することも可能です。
- 職種についてはマーケティング等の観点から有用な情報であることから、勤務先の情報については全部削除ではなく、職種のカテゴリーに置き換える加工を施します。
- 年収については、勤務先や住所に関する情報とともに提供することを想定している複数の年収区分に置き換える等の情報を一定程度丸める加工を行います。
- 超高収入である場合は、その情報を削除するかトップコーディングを行います。
【履歴情報】
<カード利用明細データの取扱い>
- 利用日時や利用金額と利用加盟店との組合せは、例えば、他の事業者が有する購買履歴情報と結びつくことにより、個人の特定につながる可能性があります。
- 利用日を月単位にすること、利用金額を複数の区分に置き換えること等の曖昧化を行い情報の有効活用を行います。
- 利用金額が極めて高額のもの、一定期間におけるカード利用回数が極めて多いものについては、その希少性から個人の特定につながる可能性があるため、トップコーディング等を行うことにより情報を加工します。
図表:「個人情報匿名化ソリューション」での加工例
項目 | 加工例 |
---|---|
契約書ID | 複数のデータセットを紐づけるため仮IDに置き換え関連性を維持するリレーション維持変換 |
氏名/クレジット番号/決済機関 | 削除 |
生年月日/住所 | 年代に置替えたり居住エリアに書き換え(丸め) |
年収 | 丸め/トップコーディング |
勤務先 | 職種分類に置き換え(一般化) |
利用日 | 利用月に置き換え(丸め) |
加盟店/利用金額 | 加工無し/トップコーディング |
図表:加工後のデータイメージ
