Enviar búsqueda
Cargar
clustering of user
•
4 recomendaciones
•
1,563 vistas
Atsushi Hayakawa
Seguir
Tecnología
Denunciar
Compartir
Denunciar
Compartir
1 de 41
Descargar ahora
Descargar para leer sin conexión
Recomendados
Tokyo.R女子部#2「RMeCabを使おう」
Tokyo.R女子部#2「RMeCabを使おう」
Sachiko Hirata
名古屋Ruby会議02 LT:Ruby中級への道
名古屋Ruby会議02 LT:Ruby中級への道
Shigeru UCHIYAMA
Executive-Assistant-Jobs
Executive-Assistant-Jobs
Ralph290Roman
Results Evaluation Mocktails 2015
Results Evaluation Mocktails 2015
Dianova
Problemas de estadistica con spss
Problemas de estadistica con spss
pedro_zapata_sanchez
SPLINFANTCOLLECTIONPPT
SPLINFANTCOLLECTIONPPT
Emesure Mark
Индивидуальное занятие по РРС и ФПСР
Индивидуальное занятие по РРС и ФПСР
preemstvennost
Empresa Inserção Floricultura Dianova ISUP A3S 2016
Empresa Inserção Floricultura Dianova ISUP A3S 2016
Dianova
Recomendados
Tokyo.R女子部#2「RMeCabを使おう」
Tokyo.R女子部#2「RMeCabを使おう」
Sachiko Hirata
名古屋Ruby会議02 LT:Ruby中級への道
名古屋Ruby会議02 LT:Ruby中級への道
Shigeru UCHIYAMA
Executive-Assistant-Jobs
Executive-Assistant-Jobs
Ralph290Roman
Results Evaluation Mocktails 2015
Results Evaluation Mocktails 2015
Dianova
Problemas de estadistica con spss
Problemas de estadistica con spss
pedro_zapata_sanchez
SPLINFANTCOLLECTIONPPT
SPLINFANTCOLLECTIONPPT
Emesure Mark
Индивидуальное занятие по РРС и ФПСР
Индивидуальное занятие по РРС и ФПСР
preemstvennost
Empresa Inserção Floricultura Dianova ISUP A3S 2016
Empresa Inserção Floricultura Dianova ISUP A3S 2016
Dianova
Open Source Outlook: Expected Developments for 2016
Open Source Outlook: Expected Developments for 2016
Black Duck by Synopsys
Dianova Results Evaluation Mocktails 2016
Dianova Results Evaluation Mocktails 2016
Dianova
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
Héctor Garduño Real
(5)perubahan struktur ekonomi
(5)perubahan struktur ekonomi
Elisabeth Marina
Presentation3- JC Premiere Compensation Plan
Presentation3- JC Premiere Compensation Plan
JC Premiere Business International
What is beauty? Final Project Dee-Dee-Slideshare
What is beauty? Final Project Dee-Dee-Slideshare
DEEDEENLU
Análisis del Whitepaper DB4O
Análisis del Whitepaper DB4O
Héctor Garduño Real
Cocktail and mocktail
Cocktail and mocktail
Varun Rathore
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
Más contenido relacionado
Destacado
Open Source Outlook: Expected Developments for 2016
Open Source Outlook: Expected Developments for 2016
Black Duck by Synopsys
Dianova Results Evaluation Mocktails 2016
Dianova Results Evaluation Mocktails 2016
Dianova
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
Héctor Garduño Real
(5)perubahan struktur ekonomi
(5)perubahan struktur ekonomi
Elisabeth Marina
Presentation3- JC Premiere Compensation Plan
Presentation3- JC Premiere Compensation Plan
JC Premiere Business International
What is beauty? Final Project Dee-Dee-Slideshare
What is beauty? Final Project Dee-Dee-Slideshare
DEEDEENLU
Análisis del Whitepaper DB4O
Análisis del Whitepaper DB4O
Héctor Garduño Real
Cocktail and mocktail
Cocktail and mocktail
Varun Rathore
Destacado
(8)
Open Source Outlook: Expected Developments for 2016
Open Source Outlook: Expected Developments for 2016
Dianova Results Evaluation Mocktails 2016
Dianova Results Evaluation Mocktails 2016
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
Práctica de Creación de Máquina Virtual con LAMP en Amazon Web Services
(5)perubahan struktur ekonomi
(5)perubahan struktur ekonomi
Presentation3- JC Premiere Compensation Plan
Presentation3- JC Premiere Compensation Plan
What is beauty? Final Project Dee-Dee-Slideshare
What is beauty? Final Project Dee-Dee-Slideshare
Análisis del Whitepaper DB4O
Análisis del Whitepaper DB4O
Cocktail and mocktail
Cocktail and mocktail
Más de Atsushi Hayakawa
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Atsushi Hayakawa
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
Atsushi Hayakawa
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
Atsushi Hayakawa
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
Atsushi Hayakawa
バンクーバー旅行記
バンクーバー旅行記
Atsushi Hayakawa
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Atsushi Hayakawa
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
Atsushi Hayakawa
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
Atsushi Hayakawa
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
Atsushi Hayakawa
useR!2017 in Brussels
useR!2017 in Brussels
Atsushi Hayakawa
Japan.R 2016の運営
Japan.R 2016の運営
Atsushi Hayakawa
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Atsushi Hayakawa
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Atsushi Hayakawa
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Atsushi Hayakawa
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
Atsushi Hayakawa
gepuro task views
gepuro task views
Atsushi Hayakawa
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
Atsushi Hayakawa
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
Atsushi Hayakawa
イケてる分析基盤をつくる
イケてる分析基盤をつくる
Atsushi Hayakawa
らずぱいラジコン
らずぱいラジコン
Atsushi Hayakawa
Más de Atsushi Hayakawa
(20)
tidyverse.orgの翻訳
tidyverse.orgの翻訳
Zepp play soccerで測ってみた
Zepp play soccerで測ってみた
dataclassとtypehintを使ってますか?
dataclassとtypehintを使ってますか?
トライアスロンとgepuro task views V2.0 Japan.R 2018
トライアスロンとgepuro task views V2.0 Japan.R 2018
バンクーバー旅行記
バンクーバー旅行記
Analyze The Community Of Tokyo.R
Analyze The Community Of Tokyo.R
Visual Studio CodeでRを使う
Visual Studio CodeでRを使う
トライアスロンと僕 - Japan.R 2017
トライアスロンと僕 - Japan.R 2017
simputatoinで欠損値補完 - Tokyo.R #65
simputatoinで欠損値補完 - Tokyo.R #65
useR!2017 in Brussels
useR!2017 in Brussels
Japan.R 2016の運営
Japan.R 2016の運営
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
Rstudio上でのパッケージインストールを便利にするaddin4githubinstall
統計的学習の基礎 4.4~
統計的学習の基礎 4.4~
Splatoon界での壮絶な戦い&Japan.Rの宣伝
Splatoon界での壮絶な戦い&Japan.Rの宣伝
最近のクラウドストレージの事情と私情
最近のクラウドストレージの事情と私情
gepuro task views
gepuro task views
nginxのログを非スケーラブルに省メモリな方法で蓄積する
nginxのログを非スケーラブルに省メモリな方法で蓄積する
implyを用いたアクセスログの可視化
implyを用いたアクセスログの可視化
イケてる分析基盤をつくる
イケてる分析基盤をつくる
らずぱいラジコン
らずぱいラジコン
Último
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
Último
(11)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
clustering of user
1.
第6回 さくさくテキストマイニング勉強会 ツイートから
ユーザーを クラスタリング できる?
2.
自己紹介 早川 敦士
電気通信大学 システム工学科三年
3.
ブログ http://d.hatena.ne.jp/gepuro/
自己紹介 Twitter @gepuro
4.
2011年度 S-PLUS学
生研究奨励賞の (^O^) 特別賞を 頂きました!
5.
ある日の事・・・・
6.
本を読んでいて、
これを やってみたいなあ っと感じた。
7.
これ?
8.
それが ユーザーの クラスタリング
です。
9.
既に、書き手が 分かっているものを、
注意 判別していきます。
10.
フォローしている ユーザから、
ツイートを 適当に取得
11.
ゴミ取り ●@ユーザー名 ●RT以降 ●ハッシュタグ
12.
クラスター分析で 書き手を
分けてみる。
13.
対象のデータ集合を
分割して, クラスター分析 いくつかの集合に 分ける
14.
? 分割して、分ける? クラス分類とは、 違うの?
15.
クラスタリングとクラス分類って違うらしい http://d.hatena.ne.jp/Kshi_Kshi/20110110/1294687656 クラスタリング:教師なし クラス分類 :教師あり
16.
クラスタリングは、 大きく2種類
あります。
17.
●階層的クラスタリング ●非階層的クラスタリング
18.
●階層的クラスタリング ●非階層的クラスタリング
19.
ユーザーのツイートを 2分割しておいて・・・
20.
文字の バイグラムを 使って・・・
21.
文字のバイグラム ●
今日は、さくテキだ! 2文字のセットを 作って、 今-日 その出現頻度を ● ● 日-は 利用しました。 ● は- 、 ● 、 -さ ● ・・・・・・・
22.
23.
library(RMeCab) twit <- docNgram("./sep",type=0) plot(
hclust(dist(t(twit)),"ward"))
24.
書き手の判別には、 2万字以上必要と 言われているけど・・・
25.
多いのは、約3万字 少ないのは、約4500文字
だった。
26.
感じたこと 書き手によって、 文章の長さが異なる。
⇓ 差が出やすい
27.
相対度数で 見てみるかな
28.
29.
library(RMeCab) twit <- docNgram("./sep",type=0) soutai
<- t(twit) / rowSums(t(twit)) plot(hclust(dist(soutai),"ward"))
30.
一つ目が合わさる部分で
見たいけど、 高さの部分で区切るから、 クラスタリングが 希望通りにできない。
31.
●階層的クラスタリング ●非階層的クラスタリング
32.
kmeans
33.
今日から使える! みんなのクラスタリング超入門
kmeans http://www.slideshare.net/toilet_lunch/ss-7684979 に分かりやすく書かれています。
34.
出展:今日から使える! みんなのクラスタリング超入門
35.
階層的クラスタリングと kmeans 同じコーパスを用いて
36.
37.
上手くできてるかな
38.
kmeans(soutai,centers=13) answer = c() for
( i in 1:26){ answer[i] = strsplit(names(rlt),split="_")[[i]][1] } ctbl <- table(answer,rlt) ctbl
39.
クラスタリングを使うと、 書き手の特徴を掴み、
それぞれを 分けることができた。
40.
参考 •
Rによるテキストマイニング入門 著:石田 基広 出版社:森北出版株式会社 • RとLinuxと・・・ http://rmecab.jp/wiki/index.php?RMeCab • 今日から使える! みんなのクラスタリング超入門 http://www.slideshare.net/toilet_lunch/ss-7684979 • クラスタリングとクラス分類って違うらしい http://d.hatena.ne.jp/Kshi_Kshi/20110110/1294687656
41.
ご清聴 ありがとうございました
Descargar ahora