DRAGON'さんのブログ
ブログ
KDDI、投稿者のプロフィールを自動推定する技術を開発
なんだか怖いなー。こう言う技術。
http://news.searchina.ne.jp/disp.cgi?y=2010&d=0927&f=business_0927_122.shtml
"KDDI研究所は27日、インターネット上のブログや掲示板に投稿された文書を解析することで、投稿者のプロフィール(年齢、性別、職業、出身、趣味など)を自動推定する技術を開発した。
KDDI研究所は、投稿内容からクチコミ投稿者のプロフィールを自動的に推定する技術を開発した。この技術では、投稿者のユーザーIDを利用して過去の複数のコメントを取得し、その中に含まれているプロフィール推定に役立つキーワードを収集する。プロフィールが推定できるまでコメントをさかのぼって取得することで高精度なプロフィール推定が可能となる。
たとえば、日常のコメントに「学校」や「部活」、「宿題」などの単語が頻繁に見られるユーザーは、年齢が「10 代」で職業が「学生」、「梅田」「なんば」「やねん」のような単語が頻繁に見られるユーザは関西に居住していると推定する。
本技術の性能を検証するため、ツイッター上でプロフィールが確認できたユーザー約1万人を分析したところ、年齢は80.2%(20代は89.5%)、性別は78.3%、出身は72.6%といった高精度で推定できることが確認できたという。KDDI研究所は、この技術を使った試作システムを、10月に開催される「CEATEC JAPAN」に出展する。"
まぁ年代や趣味に合わせた広告とか送るとかが基本的な使われ方なんでしょうが。
その気になれば、かなりディープな個人情報まで集めるシステムの一端になりそうな。
…悪用されない事を祈ります。
-
関連銘柄:
KDDI(9433) -
タグ:
こんばんは。コメントありがとうございます。
>> えせ放言使こたりして、みんな身元ばれるのさけるんちゃいます?
うーんどうなんでしょうねぇ。
そもそも、そこまでする人ってどれ位いますかね。大概の人は面倒くさがってやらないんじゃないかと。
それに住所を隠すなら何処へ行ったって言う地名も書き込めないし。
将来的に技術が向上すれば例えば周辺のガードの甘い人物から情報を先に収集して来て複合的に推測(補足)するなんて事をしかねない気も。
そうやって考えると中々に隠し貫くのは難しい気がするんですがね。
…と言うのが私考えなんですが、悲観的すぎますかね?
で、個人的に怖いのは例えばプロフの部分の自動収集や、そこに書かれてるメアドの自動収集、IPアドレスから大まかな住所を調べる、GPS携帯に付いているカメラの写真から何処で取ったものか割り出すなんて現在ある既存の技術と複合してディープな個人情報を集めて行くってシステムを誰かがいずれ作る可能性が出て来たって事じゃないでしょうか。
…やっぱり私の考えは悲観的すぎますかね?
では、失礼します。
先日はうちに遊びに来ていただいてありがとうございました <(_ _)>
これ、精度的にどないなんでっしゃろ? DRAGON'はんのいわはるとおり
たぶんターゲティング広告に利用しようとか言う腹づもりなんやろけど
このコメントみたいに非関西人がえせ関西弁使うても
しっかり判定できるんやろか…
学校の先生かて「学校」や「部活」、「宿題」使うやろ?
誤判定で数年後にはサービス中止とかになるんちゃう?
こんな気色悪いサービス始まったら、地元の方に怒られるの覚悟で
えせ放言使こたりして、みんな身元ばれるのさけるんちゃいます?