Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

セクシー女優で学ぶ画像分類入門

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Cargando en…3
×

Eche un vistazo a continuación

1 de 42 Anuncio
Anuncio

Más Contenido Relacionado

Más de Takami Sato (13)

Más reciente (20)

Anuncio

セクシー女優で学ぶ画像分類入門

  1. 1. セクシー女優で学ぶ画像分類入門 tkm2261 @TokyoWebMining#26 2013年5月18日Tokyo WebMining #26 1
  2. 2. 解析動機 2013年5月18日Tokyo WebMining #26 2 最後の春だし画像処理の勉強でもしとくか 後輩からAV女優の類似画像検索の話を聞く (ぱろすけ 2012) DMMにはアフィリエイトあったよな これでウェブサービス作れば儲かるかも 決して下半身からの要望で解析したのではありません http://blog.parosky.net/archives/1506
  3. 3. 計算環境 2013年5月18日Tokyo WebMining #26 3 使用言語:Python 2.7 (少しだけR) 使用モジュール:Numpy, Scipy, OpenCV 科学技術計算用のライブラリ MATLABにできることは大体できる  numpy.ndarray 型付き多次元配列  numpy.linalg 線形代数計算  scipy.cluster 今回はこれのk-means法を使用  scipy.sparse 疎行列用のライブラリ ←オススメ 最近はscikit系(scikit-learnなど)も有名に Numpy, Scipy
  4. 4. 脱線:BLAS と LAPACK 2013年5月18日Tokyo WebMining #26 4 数値計算をやると裏で必ずお世話になるのがこの2つ  Basic Linear Algebra Subprograms (BLAS) -線型代数計算を実行するライブラリの標準仕様  Linear Algebra PACKage (LAPACK) -BLAS上に構築された固有値計算などの高位な線形代数計算ライブラリ 現在様々なBLAS実装が公開されている  Intel MKL … MATLABはコレ 有償 すごく速い・高い・安心!  ATLAS … 自動チューンのBLAS BSD 速い  GotoBLAS2 … 後藤和茂氏作成のBLAS BSD かなり速い 開発停止  OpenBLAS … xianyi氏によるGotoBLAS2の後継BLAS BSD すごく速い (MATLAB, R, Octave, numpy …) 計算が遅い時、4つのどれかの導入すると幸せになれるかも? ・ ・ ・
  5. 5. BLASの比較 2013年5月18日Tokyo WebMining #26 5 引用:R BLAS: GotoBLAS2 vs OpenBLAS vs MKL (http://blog.felixriedel.com/2012/11/r-blas-gotoblas2-vs-openblas-vs-mkl/) 実行コード A = matrix(rnorm(n*n),n,n) A %*% A solve(A) svd(A) RのデフォルトBLASから何倍早くなったか検証してるサイトがあったので紹介  最大で11倍ほど高速化  MKLが基本的に一番高速  OpenBLASも所によってはMKLを上回ることも  マルチスレッド環境では導入は必須かも
  6. 6. Unofficial Windows Binaries for Python Extension Packages 2013年5月18日Tokyo WebMining #26 6 Win機でBLASをビルドするのはちょっと手間がかかる・・・ なんとIntel MKLでビルドされたNumpyが配布されています Win機の方はこれを入れるのが最も良さそう Unix系の方はOpenBLASでビルドするのがオススメ http://www.lfd.uci.edu/~gohlke/pythonlibs/
  7. 7. OpenCV (Open Source Computer Vision Library) 2013年5月18日Tokyo WebMining #26 7 インテルが開発・公開したオープンソースの画像処理ライブラリ BSDライセンスなのに画像処理はこれ一つで大体なんでもできる 学習済みデータも入っているので、デフォルト状態で顔認証も可能 パラメータチューンしないと 精度は出ませんが・・・ OpenCVのPythonモジュールも先ほどのサイトでバイナリ入手可能
  8. 8. ここまでのまとめ 2013年5月18日Tokyo WebMining #26 8  BLASを変えると幸せになれるかも?  環境構築はWin機なら、全て「次へ」だけでインストール可能  LINUXはOpenCV以外はyumやapt-getでインストール可能  Python 2.7  Numpy 1.7.1  Scipy 0.12.0  OpenCV 2.4.5  R 2.13.2 しかしNumpyのBLASは低速の可能性
  9. 9. 画像収集 2013年5月18日Tokyo WebMining #26 9 解析のための画像収集の方法を今回は2つ考案 方針1:Bing Search APIの活用 API使用上限と画像の質で断念 方針2:DMMのAV女優名鑑から収集 成功!
  10. 10. 方針1:Bing Search APIの活用 2013年5月18日Tokyo WebMining #26 10 ① WikipediaのAV女優一覧から約3000人の名前を収集 ② Microsoftアカウントを作成し、APIKEYを取得 ③ 以下のコードで女優名でBing画像検索 結果をJSON形式で取得 ImageFiltersによって顔画像かつ写真に限定 #! /usr/bin/python # -*- coding:utf-8 -*- import urllib import requests import json url = 'https://api.datamarket.azure.com/Bing/Search/Image?' key = 'APIKEY'#api keyを入れる q=“検索文字列(女優名)" param = { 'Query':"'%s'"%q, #クエリを入れる 'Adult':"'Off'", #アダルトフィルタoff 'ImageFilters':"'Face:Face+Style:Photo'", #顔画像で写真のみ } req_url = url + urllib.urlencode(param) result = requests.get(req_url + json_param,auth=(key,key)) 注意:これは簡略版です これを女優人数だけfor文で回します その後に女優数が増加し、API無料使用上限の月5000回を超過 さらに胸部まで含まれていたり質が若干物足りなかった(大体はOK) Googleは一日100回まで無料
  11. 11. 方針2:DMMのAV女優名鑑から収集 2013年5月18日Tokyo WebMining #26 11 クローリング手法なので非公開 会場で実演解説します • 顔画像 • 年齢 (非公開多数) • スリーサイズ • 趣味・特技 この結果、AV女優7092人の を収集
  12. 12. 画像からの特徴抽出 2013年5月18日Tokyo WebMining #26 12 ここまでで画像収集が終わりました。次は画像をベクトルで表現します ベクトルで表現出来てしまえば、 お馴染みの各種データマイニング手法が使いたい放題 どんな特徴をでベクトルを構成するのかが最も重要 Ex) テキストマイニングよく使われるbag-ofーwordsは文書を単語の頻度ベクトルで表現 すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ すもももももももものうち すもも も もも の うち その他の 日本語全単語 1 2 2 1 1 0 日本語全単語数 ※MeCabで解析
  13. 13. 画像からの特徴抽出 2013年5月18日Tokyo WebMining #26 13 一番有名な画像の特徴はカラーヒストグラム RGBを8bitで表すと、 256x256x256=16777216次元のベクトルで表現可能 しかし、色情報だけで駄目そうなのはご想像の通り
  14. 14. 画像からの特徴抽出 2013年5月18日Tokyo WebMining #26 14 照明影響 不変 回転不変 拡大縮小 不変 特徴量 特徴量次元 用途 SIFT SURF ○ ○ ○ 特徴点毎 128 細かい特徴把握 パノラマ写真 HOG ○ × ※1 × ※1 画像に一つ 分割数 依存 大まかな特徴把握 Haar-like ○ × ※2 ○ ※3 画素ごと 矩形種類数 顔など形状が決まっているも のに強い 画像から特徴を抽出する手法はいくつか提案されている 引用:画像認識の初歩、SIFT,SURF特徴量 (http://www.slideshare.net/lawmn/siftsurf) ※1 別の方法で補完 ※2 学習画像による ※3 矩形の大きさで調整 今回はSURF特徴量を採用
  15. 15. SURF特徴量 (2008 Herbert Bay et al.) 2013年5月18日Tokyo WebMining #26 15 画像内の特徴的な点を128次元のベクトルで表した特徴量 詳細については、「画像認識の初歩、SIFT,SURF特徴量」などを参照 (http://www.slideshare.net/lawmn/siftsurf) 44特徴点 324特徴点 画像を44個や324個の128次元ベクトルで表現することができた ひとつのベクトルで表現するまで後少し! import cv im = cv.LoadImageM(imagePath , cv.CV_LOAD_IMAGE_GRAYSCALE) #画像読み込み cv.ExtractSURF(im , None , cv.CreateMemStorage() , (1 , 500, 3, 4)) で取得可能
  16. 16. Bag of Keypoints 2013年5月18日Tokyo WebMining #26 16 テキストマイニングで用いられるBag of Wordsを画像へ応用した手法 Bag of Features, Bag of Visual Wordsとも呼ばれる Bag of Keypoints:ある特徴(SURF)が何度登場したかの頻度ベクトル SURFは128次元の連続値ベクトルなのに頻度とは? ベクトル量子化を行う すもも も もも の うち その他の 日本語全単語 1 2 2 1 1 0 Bag of Words:ある単語が何度登場したかの頻度ベクトル
  17. 17. K-means法によるベクトル量子化 2013年5月18日Tokyo WebMining #26 17 ① トレーニング用画像集合からSURF特徴量を抽出 ② SURF特徴量をk-means法でクラスタリング(今回は100クラスタ) ③ 各クラスタのセントロイドを代表ベクトルとする ④ 対象の画像からSURF特徴量を抽出し、 最も近い代表ベクトルに割り当ててヒストグラムを作る 人工知能に関する断創録:Visual Wordsを用いた類似画像検索(http://aidiary.hatenablog.com/entry/20100227/1267277731)より引用 http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/k-means法についてはコチラ→
  18. 18. K-means法によるベクトル量子化 2013年5月18日Tokyo WebMining #26 18 http://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-visualise/k-means法についてはコチラ→  トレーニング用画像集合は500画像をランダムで抽出 -この500画像も④ステップの本番画像に含めます  今回はユークリッド距離が最も近いものに割り当てた -最近傍探索は総当り (各特徴点に対し100個の代表ベクトルとの距離を全て計算)  ヒストグラムは特徴点数で割った -各画像の特徴点数による影響を排除 今回の問題への適用 ① トレーニング用画像集合からSURF特徴量を抽出 ② SURF特徴量をk-means法でクラスタリング(今回は100クラスタ) ③ 各クラスタのセントロイドを代表ベクトルとする ④ 対象の画像からSURF特徴量を抽出し、 最も近い代表ベクトルに割り当ててヒストグラムを作る
  19. 19. 女優の分類 2013年5月18日Tokyo WebMining #26 19 クラスタリング手法は大きく分けて2つ 階層的クラスタリング 近いものをくっつけたり、遠いものを別クラスタに分類していく手法 集合間の近い、遠いって何? 様々な手法が提案 非階層的クラスタリング(k-means法) k-means法に代表される手法 計算コストが安く、程々によい分類が得られ、様々な場面で多用 7000人の分析は難しいので、 ひとまずk-means法で10クラスに分類 from scipy.cluster.vq import kmeans2 centroid, label = kmeans2(X) #Xはnumpy.ndarray で実行可能 濱田さんの 「R言語プログラミング: クラスター分析 - 階層的クラスタリング」 http://d.hatena.ne.jp/hamadakoichi/20100324/p1 などを今回参考
  20. 20. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 20 クラスタ1 クラスタ2
  21. 21. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 21 クラスタ3
  22. 22. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 22 クラスタ4
  23. 23. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 23 クラスタ5
  24. 24. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 24 クラスタ6 クラスタ7 ←の画像のクラスタ
  25. 25. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 25 クラスタ8
  26. 26. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 26 クラスタ9 クラスタ10
  27. 27. クラスタの可視化 2013年5月18日Tokyo WebMining #26 27 クラスタ間の関係が見えないと、似ているかの感覚が掴めない 階層的クラスタリング 前述 多次元尺度構成法(MDS) 類似度から低次元(2次元)へのプロットを生成する手法 この二つでk-means法で得られたセントロイドを可視化 Q.:k-means法したあと階層的クラスタリングやるのおかしくない? A.:よくわからないけど、変なことをやってる感じもないのでアリと判断
  28. 28. クラスタの可視化 2013年5月18日Tokyo WebMining #26 28 階層的クラスタリング 多次元尺度構成法 ※クラスタ間の類似度は完全連結法を使用 ※類似度にユークリッド距離を使用 7000人分のbag-of-keypointsの結果への主成分析が第二主成分まで で累積寄与率が10%程度だったので、こちらはあまり当てにならにかも Rではcmdscale(距離行列)で実行可能Rではhclust (サンプルデータ)で実行可能
  29. 29. 分類結果(DMMオススメ女優353名のみ) 2013年5月18日Tokyo WebMining #26 29 村上みわ , 紫彩乃 , 野原もも , 小川あさ美 , 杏美月 , 雪見紗弥 , 佐山愛 , 辰巳ゆい , 吉沢 みなみ , 紗奈 , 黒木いちか , 深田梨菜 , 鈴香 音色 , Erina , 水嶋あずみ , 篠めぐみ , 管野し ずか , 瀬奈ジュン , JULIA , 絵色千佳 , 倉木 みお , 香月悠梨 , 和久井もも , 前田かおり , 小島みなみ , そらのゆめ , のはらももか , 朝桐 光 , 瀬戸友里亜 , 新山かえで , 一色まりな , 平山こずえ , 小暮カレン , 百武あみ , 石原美 希 , 北川杏樹 望月加奈 , Maika , 寺澤しのぶ , 吉崎 直緒 , 流海 , KAORI , 翔田千里 , Rio , 東野愛鈴 , 恵けい , あいださく ら , 小向美奈子 , 羽月希 , 琥珀うた , 北川瞳 , LISA , 堀咲りあ , 山本美和 子 , 七沢るり , 藤澤美羽 , 吉野艶子 , 白木優子 , 双葉かな , 富永苺 , 上原花 恋 , 冬木舞 , 藤崎エリナ , 坂口みほの 寺島小春 , 志保 , 持田茜 , 恵ちとせ , 愛咲れい ら , 芦名未帆 , 麻美ゆま , 水城奈緒 , 浜崎りお , かすみりさ , めぐり , 園原みか , 澤村レイコ , みづなれい , 若菜あゆみ , 羽田あい , ましろ杏 , 春菜はな , 瑠川リナ , 橘なお , 神ユキ , 宇佐美 なな , 前田陽菜 , 後藤リサ , 上原保奈美 , 真木 今日子 , 篠田ゆう , 西野まお , 香西咲 , 枢木み かん , 小倉ゆず , 星川なつ , 沙藤ユリ , 絵里奈 モア , 杉崎杏梨 , 宮地由梨香 , 園咲杏里 , 松本 メイ , 尾上若葉 , 伊藤りな , 千紘真奈美 , あや み旬果 , 野宮さとみ , 緒川りお , 吉永あかね , 入江愛美 ① ⑤ ⑥ 流川瞬 , 宇佐美奈々 , 友崎亜希 , 霧島あんな , 瀬名涼子 , YOKO , 竹内あい , 手塚美智子 , 大 橋未久 , 芽衣奈 , ERIKA , 竹内結 , 月野りさ , 里美ゆりあ , 大槻ひびき , リコ , 桃音まみる , 友田彩也香 , 若葉くるみ , 内田美奈子 , 森川真 羽 , 有村千佳 , ほしのあすか , 前田優希 , 梨果 メリア , 瀬乃ゆいか , 由愛可奈 , 瀬名一花 , 鶴 田かな , 本真ゆり , 平原みなみ , 若林優 , 春原 未来 , 知世奏 , 立花樹里亜 , 山下優衣 , 小早川 怜子 , みなみ愛梨 , 麻生希 , 乃ノ原みき , 月奈 もえ , 渡辺なつみ , 古川いおり , 卯水咲流 , 雪 本芽衣 , 仁科和子 山口玲子 , 寺田美由紀 , 堤さやか , 灘ジュン , 鈴木麻奈美 , 友田真希 , めろん , 吉沢明歩 , RIRICO , 二宮沙樹 , 妃乃ひかり , つばさ , RYU , 園原りか , 織田真子 , 野中あんり , 七海なな , 芹沢恋 , 希志あいの , 瀬名あゆむ , 並木優 , 中森玲子 , 石原莉奈 , 栗林里莉 , 波多野結衣 , 長澤あ ずさ , 希崎ジェシカ , 水沢真樹 , 成瀬心美 , 向井ゆうき , 希美まゆ , 椎名ゆな , 横山みれい , つく し , RUMIKA , 優木あおい , 瑠菜 , 梨杏 , 泉麻那 , 周防ゆきこ , 結城みさ , 藤原ひとみ , 橘ひな た , 椎名ひかる , 武藤クレア , Nina , すずきりりか , 木下若菜 , 加藤リナ , ももかさくら , 奥田 咲 , TINA , 東尾真子 , 乃々果花 , さとう遥希 , 姫野ゆうり , 南梨央奈 , 音市美音 , 上原瑞穂 , 夏 目優希 , 紗倉まな , 芹沢つむぎ , 稲川なつめ , 野村萌香 , 遥結愛 , 上原千尋 , 元山はるか , 藤下梨 花 , ティア , 柳朋子 , 悠希めい , 星野来夢 , ELENA , ちとせりこ , 結夜 , 二階堂あい , ほのか美 空 , 瀧川花音 , 山川青空 , 柏木美玲 , 夢乃あいか メイファ , 東城えみ , 瀬戸由衣 , かすみ果穂 , 野宮凛子 , 辻本りょう , つぼみ , 桃咲まなみ , 七咲楓花 , 森ななこ , 横山美雪 , 女池さゆり , 時越芙美江 , 北条麻妃 , ☆LUNA☆ , 一ノ瀬アメ リ , 瀬奈涼 , 桜りお , 上原結衣 , 大堀香奈 , 江 原あけみ , 星美りか , 仁科百華 , 菜月アンナ , 美雪ありす , 向井恋 , 西尾かおり , 月城ルネ , 上原亜衣 , 山河ほたる , 矢野未夏 , 遠藤ななみ , 椿ゆい , 二宮ナナ , 初美沙希 , 木村つな , 暮町 ゆうこ , Ririca , 仁美まどか , 三浦恵理子 , 星 野ナミ , Sumire , 春宮こころ , 柑菜リサ , 宗方 志穂 , 板野有紀 , 江崎リリカ , 鈴村あいり , 鈴 木心春 ③ ④ ⑧ 夢野まりあ , 西野翔 , 当真ゆき , 黒木麻衣 , 村 上涼子 , 手塚真由美 , 若林美保 , 柳田やよい , 初音みのり , 茅ヶ崎ありす , 竹内紗里奈 , 川上 ゆう , 冬月かえで , 艶堂しほり , Hitomi , 藤井 シェリー , 有沢実紗 , 小西レナ , 藤沢芳恵 , 若 菜亜衣 , 富樫まり子 , 黒沢那智 , 寺島志保 , 高 橋美緒 , 滝川ソフィア , 若松かをり , 向井一葉 , 吉川あいみ 三浦あいか , 渡瀬晶 , 瞳リョウ , 風間ゆみ , 乃亜 , Rico , 遥めぐ み , 鈴木さとみ , 流川純 , RICA , 今井ひろの , 諸星セイ ラ , 北川エリカ , 近澤まゆみ , 矢部寿恵 , 松下ひかり , 百瀬 乃々花 , 倉多まお , 若槻シェル ビー ② ⑨ デヴィ , 寺崎泉 , 松本まりな , 牧原れい子 , 星野あかり , むかいねね , eco , 村西まりな , このは , 西條るり , やまぐちりこ , 優希まこ と , 桐谷ユリア , 日和香澄 , 吉咲あんり , 知 花メイサ , 椎名理紗 , 栗山朋香 , きみの歩美 , 倉持結愛 ⑩
  30. 30. 考察 2013年5月18日Tokyo WebMining #26 30 「No Printing」の画像は正確に分類できた(クラスタ7) その他は上手く分類できているかわからない・・・ ベクトル量子化の際に情報が落ちている可能性 画像からあまり特徴点がとれなかった SURF特徴量の妥当性 2chにスレ立てて聞いてみたが微妙な反応 代表ベクトルとの距離といった情報を入れた方が良いかも 顔認証と同様にHaar-Likeを用いるべきだったか しっかり論文をサーベイして精緻化が必要 今回はソースは全てネット 「割りと本気だしてAV女優分類したんだが」 http://himasoku.com/archives/51771982.html
  31. 31. サービス化に向けて 2013年5月18日Tokyo WebMining #26 31 改善の余地があるにせよ、7092人分の類似度が得られた これを使って ① 6枚ぐらい女優の画像を表示 ② 好きな女優を選ばせる ③ ①~②を3~10回ほど繰り返す ④ あなたにオススメな女優を表示 ⑤ アドレスを登録してもらい、あなたにオススメの新作を月一回推薦する といったサービスを考え中、しかし  ③を回答履歴から出題を変えたい  ブラウザ側とどう共有すればいいんだ?  何で実装しよう  Django? Rails? Node.js? 自前で実装? などの壁を感じているので、今日は「俺ならこうやる」を教えて下さい
  32. 32. 基礎集計結果 2013年5月18日Tokyo WebMining #26 32 女優の生年(7092人中3286人 残り3806人は非公表) 1 3 1 3 7 6 7 10 13 19 20 28 42 47 41 57 39 86 68 95 120 191 171 187 196 216 247 234 249 203 192 141 120 93 68 43 20 1 1 0 50 100 150 200 250 300 1955 1957 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1998 最大値:1955年 最小値:1998年
  33. 33. 基礎集計結果 2013年5月18日Tokyo WebMining #26 33 235 208 228 274 260 271 244 212 361 328 328 367 0 50 100 150 200 250 300 350 400 女優の星座(7092人中3286人 残り3806人は非公表) 遅生まれ早生まれが多い?
  34. 34. 基礎集計結果 2013年5月18日Tokyo WebMining #26 34 女優の身長(7092人中3427人 残り3665人は非公表) 大体正規分布? 159cmが不人気 1 1 4 1 14 6 26 64 38 97 52 122 180 146 246 233 210 342 103 371 130 202198 112 175 64 65 94 15 51 17 17 5 4 10 4 3 3 1 0 50 100 150 200 250 300 350 400 138139143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178182
  35. 35. 基礎集計結果 2013年5月18日Tokyo WebMining #26 35 女優のバスト(7092人中4610人 残り2482人は非公表) 1 2 1 2 3 9 6 1 29 11 223 77 307 614 379 601 457 185 519 81 377 38 123112 33 98 57 14 57 9 73 15 5 17 2 17 3 6 7 1 16 3 2 5 1 1 7 2 1 0 100 200 300 400 500 600 700 65 70 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 115 117 118 120 124 137 ポアソン分布? 87,89cmが嫌気されている?
  36. 36. 基礎集計結果 2013年5月18日Tokyo WebMining #26 36 女優のカップ数(7092人中2731人 残り4361人は非公表) 公表しているというバイアスが有りそう 14 147 557 622 522 350 266 124 77 28 15 5 1 1 1 1 1 0 100 200 300 400 500 600 700 Aカップ Bカップ Cカップ Dカップ Eカップ Fカップ Gカップ Hカップ Iカップ Jカップ Kカップ Lカップ Mカップ Nカップ Oカップ Pカップ Qカップ
  37. 37. 基礎集計結果 2013年5月18日Tokyo WebMining #26 37 女優のウエスト数(7092人中4610人 残り2482人は非公表) 58cmが良いらしい 61cm以上は嫌気されている? 3 1 9 19 56 153 374 431 1386 670 937 129 147 107 51 47 17 10 17 6 12 2 2 1 2 6 1 1 1 1 2 5 1 1 1 1 0 200 400 600 800 1000 1200 1400 1600 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 72 73 74 75 76 80 82 83 85 87 90 92 97 98 100
  38. 38. 基礎集計結果 2013年5月18日Tokyo WebMining #26 38 女優のウエスト数(7092人中4610人 残り2482人は非公表) 正規分布? 80~90cmに抑えたいらしい 3 2 1 1 1 1 4 1 14 9 126 67 231 451441 739 644 372 789 220 272 20 53 44 13 19 11 6 23 1 13 3 2 1 4 1 2 1 1 2 1 0 100 200 300 400 500 600 700 800 900 58 60 65 68 72 73 75 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100102103104105108110118120121125
  39. 39. 女優の基礎情報集計結果 2013年5月18日Tokyo WebMining #26 39 女優の出身県(7092人中2262人 残り4830人は非公表) 安定の首都圏
  40. 40. 女優の基礎情報集計結果 2013年5月18日Tokyo WebMining #26 40 女優の趣味・特技(7092人中2873人 残り4219人は非公表) 安定の料理 273 213 146 109 98 88 87 80 80 65 65 53 47 42 41 32 31 30 30 27 25 25 24 20 19 19 18 18 16 15 14 14 13 13 12 12 11 11 11 11 10 10 10 0 50 100 150 200 250 300 料理 ショッピング カラオケ ピアノ 音楽鑑賞 読書 水泳 テニス 映画鑑賞 ダンス 買い物 お菓子作り 旅行 散歩 ゲーム スノーボード バレーボール ドライブ ネイルアート マッサージ 歌 ネイル 書道 バスケットボール 英会話 スポーツ コスプレ ダーツ DVD鑑賞 卓球 絵を描くこと アニメ バレエ バドミントン 新体操 バスケット バスケ パソコン 犬の散歩 お買い物 音楽 剣道 ゴルフ
  41. 41. 1人しか居なかった趣味・特技一覧 2013年5月18日Tokyo WebMining #26 41 歌を歌う事, テレビゲーム, グルメの旅, エアロビ, ボクシング, 働くこと, 手品, 書道三段, 子供と遊ぶ事, メイクをする事 美術館めぐり, 漫画喫茶に行くこと, アウトドア, 海洋学, アイススケート, ローラブレード, 楽器, 買いもの, ペットと遊ぶ, 走ること 部屋の模様替え, 早口言葉, アロマの香り集め, ブログ, 家事, DS, ディズニービデオ鑑賞, パズル, 温泉, ペットの世話 漫画を書く, 競馬鑑賞, 太鼓, お香, プラネタリウム観賞, 洋裁, デパ地下巡り, 絵を書くこと, アクセサリー作り, グラビア鑑賞 AV鑑賞, 生け花, ウォーキング, K1観戦, 歩くこと, ウェイトトレーニング, エッチ, 家で犬とゴロゴロ, プロレス, 犬のカット 体操, すぐ寝れる, サンドイッチ作り, 模様替え, 通販, 作ること, 早起き, ペットのエサやり, ストレッチ, ショッピング DVD鑑賞 絵本作り, 睡眠, スケボー, 動物の鳴き真似, お掃除, お城, ぷよぷよ, Sex&Drink&Rock’nRoll, 調教, 犬とお散歩 書道5段, ジェットスキー, 蝶々モチーフのグッズ集め, 愛犬と遊ぶ事, サックス演奏, バトントワリング, ビーズ作り, 寝る, 猫のマネ, 居酒屋めぐり 何処でも寝れる事, 蚊取り, 陸上競技, ボイトレ, サイクリング, ヘアメイク, ニーソ集め, おもちゃ屋さんに行く, 飴玉の反復横跳び, シッピング ガチャピン関連グッズ収集, ツーリング, 球体関節人形作り, フランス語, クラッシックバレエ, トランス, 入浴剤集め, 自己投資, プーさん集め, 剃毛, タップダン ス, 剣道初段, 映画観賞etc, 編物, 日舞, 友達にメイクをしてあげること, ランニング, 平泳ぎ, ジムで体を鍛えること アクセサリー集め, 人見知りしないこと, ボウリング, 家庭菜園, 半身浴, ドラクエ, 健康&美肌グッズ集め, スケート, そうじ, ウィンドウショッピング 子供と遊ぶ, 三味線, チェス, 騎乗位, 飲みカラオケ, 耳かき, 笑う事, マリーちゃんグッズを集めること, PC, 何処でも寝れること 迷子, 猫と遊ぶこと, ピンクの小物を集める, チェロ, 綱渡り, 空中ブランコ, ロシア語, ケーキ作り, 美の追求, 各国別ダンス 沖縄県ダンス, ジャガーの写メを撮ること, 筋トレ, 温泉に行くこと, 竹馬, 海に行くこと, マリンスポーツ, 格闘技観戦, カラオケ 映画, ピラティス ムツゴロウさん並に動物と仲良くなれる事, カラーコーディネイト, オイルマッサージ, マージャン, クラシック音楽鑑賞, スイミング, 資格をとること サッカー観戦, 球技全般, 簿記二級, ネイルサロン, ミシン, ジャズダンス, バレエ10年, UFOキャッチャー, 体を動かすこと, ゴロゴロすること 体がとても柔らかい事, カラダ磨き, 歌う事, 器械体操, バンド活動, プロレス鑑賞, お裁縫, I字バランス, フルート演奏, ファンシーグッズ収集 長電話, バリ舞踊, なぎなた, 原付に乗ること, 音楽を聴くこと, ピアノを弾くこと, 胸を使った一発芸, テトリス, 柔道, 弓道 タイピング, 軟式テニス, デッサン, ピアノ演奏, じゅうなん♪, アクション, 早寝, じゃんけんが強い, ダイエット, 柔道2段 英検3級, 漢検3級, クロスワード, ディズニーランドに行くこと, 中国語, アイドルを見ること。, 電卓早打ち, 百人一首, ジグソーパズル, アニメを見ること 赤ワイン, HipHop, 髪いじり, 制服コスプレ, クラブ通い, 香水, 何処でも寝られること, 軟式野球, 陶芸, 猫, ヘアアレンジ 教会, お寺巡り, 歌舞伎, 体が柔らかいこと, 温泉めぐり, 長距離走, 漫画を読む, オセロ, 漫画集め, 釣り, 運動, 遊ぶこと, 自転車でお散歩♪, リラッ○マ収集, デジカメ, ケン玉, ブライス集め, スピードスケート, プロレス観戦, 軽音楽, クッキー作り, バイオリン♪ パラパラ, ライブ, 風水, 映画を見る, 帽子集め, レポートを早く書く, さくらんぼのヘタを舌で結ぶ, 美味しい店を探す, ブラジリアンワックス, イタズラ スケートボード, 野球観戦, 電卓, チアガール, 洋服を作れる事, Hなこと, そろばん, ブラインドタッチ, 身体のお手入れ, サンバ 古着屋めぐり, ポエム, 体が柔軟, 似顔絵, 動物観察, 工作, 珠算, メイクの研究, 雑貨屋巡り, ジャズ鑑賞, ルービックキューブ アルトサックス, 犬のお散歩♪, 楽器集め, 絵を描く事, お酒を飲むこと, 音楽を聴く, 健康オタク, どこでもすぐ寝れる, 数独, くまさん 買物, ぬいぐるみ集め, 人懐っこい性格, くりくりお目目, 暗記, 映画観賞, 独学ダンス, サバイバルゲーム, 木琴, カフェ巡り 作詞作曲, 友達と遊ぶ, リメイク, お笑い観賞, 車の運転, 下着集め, バイクに乗ること, 漫画を読むこと, カエル倒立, 音楽ゲーム 合気道, ジャグリング, 家で遊ぶ, アイスクリーム屋さんめぐり, なわとび, バック転, 身体を動かすこと, ホラー映画鑑賞, 工場ウォッチング, 測量 ドイツ語, お笑い, リラクゼーション, 萌え系アニメ鑑賞, 旅行のパンフレット集め, 息止め, 華, 和太鼓, せっけん集め, お花 お琴, お出かけ
  42. 42. ご清聴ありがとうございました 2013年5月18日Tokyo WebMining #26 42 女優全員は載せられなかったのでモナリザにしてみました(7000人) http://2chnewswatch.info/ads/av_monariza.jpg (容量注意:7MB)

×