警視庁オープンデータから見えた犯罪発生パターン――東京の声かけ、公然わいせつと特殊詐欺


「メールけいしちょう」という警視庁のサービスを知っているだろうか。東京都内の各地域で発生した『犯罪発生情報』や犯罪を防ぐために必要な『防犯情報』等をメールで知らせるサービスである(1)。「メールけいしちょう オープンデータ」を検索しクリックすると、データの総数、通り魔やひったくりなどの種別ごとのデータ、東京都の市区町村ごとのデータが表示される。各データをダウンロードすると、1件1件の日付や被害状況など配信情報が一覧できる(2)。

メールけいしちょうは、警視庁が身近な犯罪の存在を市民に意識させることで、新たな被害を防ぐために情報を配信している。本記事では、市民へのさらなる注意喚起を目的とし、データとして公開されている配信情報をもとに1年余りのデータを分析・可視化を行った。(担当=岩味夏海、川村梨乃、林紗梨、八木橋萌々子)

「メールけいしちょう」とは

メールけいしちょうは、東京都内で発生した犯罪発生情報や防犯情報をメールで配信するサービスである。配信対象の事件は以下の10種類である。

  • 通り魔
  • ひったくり
  • 子供に対する犯罪等
  • 強盗
  • 声かけ等
  • 公然わいせつ
  • 多発事件
  • 特捜・共捜事件
  • ひき逃げ事件
  • その他の犯罪発生情報

メールけいしちょうで配信した犯罪発生情報のうち、最新の1年分がオープンデータとして公開されている。警視庁生活安全課によると、メールけいしちょうは住民に知らせた方が良い防犯情報の配信をおこなうものであり、捜査上の諸事情があって公開されていない情報も多々あるため、オープンデータは実際の被害件数とは異なる。

 

「声かけ」「公然わいせつ」情報を分析

メールけいしちょう(2022年11月24日から2023年12月21日)の中から「声かけ等」「公然わいせつ」の情報を取得し、被害の発生場所を東京都の地図上に「声かけ等」「公然わいせつ」の発生情報を表したマップを作成した。データを地図上に表す際に『Flourish』を利用した。『Flourish』は、データを可視化することができるウェブ上のツールである。

 

東京都内の「声かけ」「公然わいせつ」発生情報の時間・地点別マップ(2022年11月24日~23年12月21日)
【マップの操作法】マップの左下にある再生ボタンを押すと午前0時からの被害発生ポイントが地図上に順に出現し、時間経過に沿った発生件数が地図下のグラフに表される。再生ボタンを止め、ポイントにカーソルを合わせると、日付、時間、住所、被害者の属性(女性、もしくは子ども)という詳しい情報が表示される(各地域を拡大すると見やすくなる)。また、地図左上では被害者の属性が時間ごとにカウントされており、女性または子どものそれぞれが被害に遭いやすい時間帯を見ることができる。ただし、カウント表示には、地図左上の集計単位を分(MINUTE)ではなく時間(HOUR)に変更する必要がある。

作成したマップから、子どもの声かけや公然わいせつの事案が多いのは午後3時〜4時頃(358件)であり、女性は午後7時〜11時頃(247件)であるとわかる。このことから、子どもは下校時刻、女性は仕事や用事等からの帰宅時刻に合わせて声かけ事案が発生しやすいと推測できる。

メールけいしちょうによって公開された、不審者の年齢層を棒グラフで表した。(図1)この年齢層の区分けは、目撃情報から予測されるものである。集計したデータの不審者情報の件数は2241件であるが、グラフ作成時には「若者」「中年」などの年齢層を特定できないものと、「20〜40歳代」「不明」など振り幅が大きいものは除外した。

図3 不審者情報を年代別に分類した棒グラフ(n=1738)
図1 不審者情報を年代別に分類した棒グラフ(n=1738)

 

声かけや公然わいせつの発生情報から分析すると「20代」が491件と最も多い。次いで「30代」「40代」「50代」の順となっている。

「あげる」と「おいで」 声かけで多用

また、同データから「声かけ内容」を文書の計量的分析ツール『KH Coder』で頻出語分析し、その結果をワードクラウドで可視化した。ここで、分析した「声かけ内容」は480件である。以下がその結果である。『ワードクラウド(Word Cloud)』では、頻出度が高い単語ほどサイズが大きくなり、低いほど小さくなる。

図4 「声かけ内容」ワードクラウド
図2 「声かけ内容」ワードクラウド

そして、以下が声かけ内容の分析における頻出語上位20位(「する」「ない」は特徴語としては不適切であると判断したため除外してある)の表である。

表2 「声かけ内容」頻出語(上位20語)
表1 「声かけ内容」頻出語(上位20語)

これらの図と表から、「あげる」「おいで」という単語が声かけにおいて頻繁に使用されていることがわかる。これらは、「お金をあげるからついておいで」「チョコレートあげるからこっちおいで」など、金銭やお菓子などをあげるという名目で声をかけた相手を誘う手口でよく使用されている。また、「行く」「名前」「家」という単語もかなり頻繁に使用されている。これらは、「名前を教えて。家はどこなの?」など個人情報を聞き出す手口や、「おじさんの家近くだからおいで」など、声をかけた相手を自身の家に誘い込もうとする手口が多く見られる。また「お菓子」という単語も頻繁に使用されているほか、その類似語であると考えられる「ジュース」「チョコレート」「飴」という単語も使用される場合がある。これらは前述したように、「チョコレートあげるからこっちおいで」「ねぇお菓子いっぱいあるとこあるよ。」など、お菓子等をあげるという名目で相手を誘う手口でよく使用されている。

 

「特殊詐欺犯人からの架電情報」を分析

「メールけいしちょう(2022年11月24日〜2023年12月21日)」の中から、「特殊詐欺犯人からの架電情報」を取得し、「電話の内容」を分析した。ここで、「電話の内容」の総数は8771件である。KH Coderを用いて頻出単語を抽出し、ワードクラウドを用いて単語使用頻度を可視化したものが以下である。

図1 「電話の内容」ワードクラウド
図3 「電話の内容」ワードクラウド

図3では、「医療」と「還付」が最も大きいサイズであり、電話内で医療と還付という言葉がよく使われることを表している。

また、KH Coderを用いて電話の内容で用いられた語を、頻出単語順にランキング化した。 以下の表2が上位20語である。

表1 「電話の内容」頻出語(上位20語)
表2 「電話の内容」頻出語(上位20語)

 

「医療費還付」「累積医療費還付」 詐欺電話で多い手口

表2から、「還付」「医療」「手続き」「書類」「累積」の順に頻出であることがわかる。これらのことから、「医療費の還付」または「累積医療費の還付」(3)に関する詐欺の電話が多いことが予測できる。

 

続いて、単語がどのような文脈で使われているかを理解するために、KH corderを用いて『共起ネットワーク』を作成した。(図4)

共起ネットワークは単語のつながりや単語の頻出度を図で表現したものである。円の大きさは単語の出現頻度を表し、円同士を結ぶ線の太さで単語のつながりを表している。同じ色の円は、単語の関連性が高いことを示している。

図2 「電話の内容」共起ネットワーク
図4 「電話の内容」共起ネットワーク

ここで、図4−1の赤丸で囲った部分に着目すると、「累積」「医療」「還付」「手続き」「書類」は語の関連性が高いとわかる。「累積医療費の還付金があります。手続きのための書類を送りましたが、確認していただけましたか。」のような手口で口座情報を引き出そうとする電話で使われている。世田谷区(4)や品川区(5)、東村山市(6)などは自治体のホームページで、累積医療費の還付金詐欺に騙されないようにとする呼びかけを掲載している。

図2−1 「電話の内容」共起ネットワーク 左下拡大図
図4−1 「電話の内容」共起ネットワーク 左下拡大図

続いて、図4−2の赤丸の部分に注目すると、「カード」「買い物」「名義」「警察」も語の関連性が高いことがわかる。「あなた名義のクレジットカードで買い物をしている人がいる。犯人はカードを置いて出て行った。銀行と警察には連絡を入れています。家族はいますか。」のような言葉で電話の受け手の不安を煽り、キャッシュカードを預かる話や金銭の要求をする手口も使われている。

図2−2 「電話の内容」共起ネットワーク 右下拡大図
図4−2 「電話の内容」共起ネットワーク 右下拡大図

以上のことから、2023年を中心としたデータからは、医療費の還付あるいは累積医療の還付に関する詐欺の電話や、電話の受け手のクレジットカードやキャッシュカードの不正利用を謳った詐欺の電話が頻繁にされていることが推測できる。これらは電話の受け手の家族を巻き込むことや、公共機関の職員を装うなど悪質な場合も多い。家に現金がいくらあるかを確認した後、強盗に押し入る「アポ電強盗」も問題になっている。そこで、上のワードクラウドに示されたような単語が多く使われるような電話には注意が必要である。

 

(1)  警視庁 「メールけいしちょう」https://www.keishicho.metro.tokyo.lg.jp/about_mpd/joho/mail_info.html, 最終閲覧日2024年2月7日

(2)  警視庁生活安全総務課 「メールけいしちょうオープンデータ」

https://mail.digipolice.jp/opendata/,最終閲覧日2023年12月27日

(3)  累積医療費の還付という制度はそもそも見当たらない。

(4)  世田谷区「区役所職員を騙った還付金詐欺にご注意ください」

https://www.city.setagaya.lg.jp/mokuji/kurashi/005/002/001/d00195188.html, 最終閲覧日2024年5月9日

(5)  品川区「【ご注意ください】医療費等の払い戻しの不審な電話について」

https://www.city.shinagawa.tokyo.jp/PC/kuseizyoho/kuseizyoho-koho/kuseizyoho-koho-sonota/hpg000030518.html , 最終閲覧日2024年5月9日

(6)  東村山市 「職員をかたった還付金詐欺にご注意下さい」

https://www.city.higashimurayama.tokyo.jp/kurashi/zei/kokuho/sagi-tyuui.html, 最終閲覧日2024年5月9日

 

「声かけ内容」の分析手順詳細

① 「メールけいしちょう」の全データから「声かけ等」と「子どもに対する犯罪等」を抽出し、一つのデータとしてまとめる

② ①でまとめたデータから、「声かけ」に当てはまるケースのみ抽出

③ ②でまとめたデータから、「声かけ内容」が存在するケースのみ抽出

④「声かけ内容」をKH Coderの分析対象として設定

⑤「声かけ内容」の頻出語リストを作成

⑥頻出語リストの上位2単語「する」「ない」は特徴語としては不適切だと判断したため除外

⑦Google Colaboratoryで⑥までで作成したリストのWord Cloud化を実行

⑧頻出語リストの上位20語の順位表を作成

 

「特殊詐欺犯人からの架電情報」の「電話の内容」の分析手順詳細

①「メールけいしちょう」の全データから「特殊詐欺犯人からの架電情報」を抽出

②「特殊詐欺犯人からの架電情報」内の「電話の内容」をKH Coderの分析対象として設定

③「電話の内容」の頻出語リストを作成

④頻出語リスト中の「名詞・サ変名詞・固有名詞・組織名・人名・地名・未知語・名詞B」に絞って上位150語を抽出・リスト作成

⑤Google Colaboratoryで④で作成したリストのWord Cloud化を実行

⑥頻出語リストの上位20語の順位表を作成

共起ネットワーク分析の条件

共起ネットワーク分析条件