んで、ぶっちゃけた話をするとダークウェブにはかなりの数の個人情報リストが出回っています
ただし、その個人情報リストの真贋ってよくわからないものが多いんですよ
しかも、例えば表計算ファイルにウン千万件ってまとめてあるファイルには同じ個人情報の重複があったり、連番の途中が欠けていたり、何なら文字化けしてるのもあったりします
まぁこれもおそらくなのですが、個人情報を売買している業者が複数の個人情報リストを機械的に結合してるんじゃないかと思います
結合のアルゴリズムは名前を基準にとかで同姓同名を考慮しないザルな方法であったりと結果的にノイズが多すぎて使いにくい個人情報リストになってます
おそらく立民(もしくは情報提供者)が得た個人情報リストは、純粋な元ファイルじゃなくて、様々な個人情報リストを結合したカオスなリストだったんじゃないかなぁと
リストにおそらくは正しい部分もあるが間違った部分もあるとボクが言うのはこういうことなんですね