SlideShare una empresa de Scribd logo
1 de 62
Descargar para leer sin conexión
テキストからの評判分析と
    機械学習
     鍜治伸裕
 東京大学 生産技術研究所
講演の前に
• 想定している聴衆
 – 評判分析について専門的なことを知らない
 – 機械学習(ML)の素養を持っている

• 講演の内容
 – 評判分析という分野の解説
 – 評判分析における ML の適用事例の紹介

• お断り
 – 自然言語処理(NLP)の話に特化
 – ML を使っている論文を私の好みで選んで紹介
評判分析を概観する
評判分析はこんな技術
• 例: Yahoo!ブログ検索における「VAIO」の検索結果


                       肯定的な書き込みと否定的
                       な書き込みを分類して提示




肯定的評判と否定的評判の
書き込み数を集計して表示
背景: CGMの出現
• CGM
  – Consumer Generated Media のこと
  – 例えば Amazon に投稿されたレビューやブログなど
  – 一般人が作成,発信するコンテンツである点がポイント

• 人々の“生の声”を拾える可能性
  – 購買行動の決定支援 or 企業におけるマーケティング
    e.g., VAIOのtype Pが気になるんだけど,使いやすいの?

  – 世論の集約と分析
    e.g., 給付金ってみんなどう考えてるの?
NLP的に見ると
• CGMの出現に伴い,新しい解析技術が必要になった
 – テキスト中の評判や意見などを把握

• 斬新な問題に見える → 論文書けそう
 – 従来は,テキスト中の客観的事実が興味の対象
   e.g., イベント抽出,固有表現認識 etc.
 – それと比較すると,評判とは極めて主観的内容

• しかも応用先はかなりはっきりしている
大きな流れ
• 1990年代
  – 形容詞の肯定/否定分類(Hatzivassiloglou and McKeown, 1997)
    e.g., adequate → 肯定的, troublesome → 否定的

• 2000年代
  – レビュー文書の肯定/否定分類(Turney, 2002; Pang et al., 2002)
  – これ以降,評判分析が爆発的に流行

  – 評判分析を専門に扱う国際ワークショップ
    e.g., AAAI spring symposium 2004, ACL workshop 2006

  – タスクが複雑化,詳細化しながら現在にいたる
MLが使われる局面(1/2)
1. 評判情報を観点とした文書分類

    評判が記述された文書                        肯定 or 否定
      (レビューなど)


2. 属性(aspect)に着目した評判要約 or 抽出

                    あるレストランの評判の要約例
                           (Titov and McDonald, 2008)
         Aspect    Score      Mention
         Food      ☆☆☆☆       “Best fish in the city”, “Excellent appetizer”
         Decor     ☆☆☆        “Cozy with an old world feel”, “Too dark”
レビュー集合
         Service   ☆          “Our waitress was rude”, “Awful service”
MLが使われる局面(2/2)
3. 辞書の自動構築   おいしい → 肯定
             ダメだ → 否定
             不安が大きい → 否定
             不安なし → 肯定
             期待が大きい → 肯定
                 ......

4. 著者(= 評判の発信者)のプロファイリング



      男?女?
1. 評判情報を観点とした文書分類
背景(一部繰り返し)
• CGMの出現により,評判が書かれたテキストが増加
 – 例えばAmazon に投稿されたレビューやブログ

• 当時(2000年ごろ)の検索エンジン
 – 評判検索なんてない!
 – Akumal に旅行する人が“Akumal travel review” で検索し
   ても… (Turney, 2002)

• 誰かが考えたこと
 – 文書を肯定/否定に応じて分類できると役立つのでは?
MLが適用された初の事例
• (Pang et al., 2002)
  データ
  – WWW上の映画レビュー(Internet Movie Database, IMDb)
  – すでに肯定/否定のタグがついている

  手法
  – 単語の出現を2値素性(Bag-of-words, BOW 素性)
  – ただし否定タグを導入(….not good…. → NOT_good)
  – ナイーブベイズ,対数線形モデル,SVMs を適用

  結果
  – SVMs が最も良く 82.9% の分類精度
インパクト大
• 斬新だった点
 – “評判情報を観点とした文書分類”という問題提起
 – 肯定/否定の2値分類として定式化 + MLの適用
 – 訓練/評価事例をレビューサイトから収集

• 評判分析の流行の火付け役の一人
 – もう一人は (Turney, 2002)
 – 引用数は 524 と 504 (by Google Scholar)
(Pang et al., 2002)以降
A) 分類カテゴリの詳細化

B) 評判箇所の検出

C) 肯否定が混在する文書の扱い
A) 分類カテゴリの詳細化
• 肯定/否定より細かい粒度の分類
 – 2値分類 (Pang et al., 2002)の素直な拡張

• 問題設定
 – 肯定/否定/中立の3値分類 (Koppel and Scheler, 2006)
 – 4 or 5段階のスコア付け(Pang and Lee, 2005; Okanohara
   and Tsujii, 2007)

• 新しい設定に適したアルゴリズム
 – SVR (Vapnik, 1995; Smola and Scholkopf, 1998)
 – Metric labeling (Kleinberg and Tardos, 2002)
分類 VS. 回帰
• 実験例 (Okanohara and Tsujii, 2007)
  – 本のレビューを5段階でスコア付け
  – Mean square error で評価

     Method         Mean square error(corpus A, corpus B)
     Pairwise SVM   1.32               2.13
     SVR            0.94               1.38
                                                     改善が見られる
B) 評判箇所の検出
客観的事実の記述(レビューの場
 合,主に本や映画のあらすじ)

  “Harry Potter (本)” のレビュー の例(Okanohara and Tsujii, 2007)
It is a fantasy fairytale, sometimes linked to Cinderella, about
a young orphaned boy transported into a world of magic and
sorcery. Harry Potter finds himself at a school for wizards,
where his reputation precedes him, and soon becomes
embroiled in a classic battle of a good versus evil. …. The
pages shimmer with creativity, and although an easy read for
adults, I would recommend it heartily to anyone that enjoys
escaping the real world for an hour or three.

                                     主観的な記述(= 評判)
段階的処理

客観+主観         主観のみ      (Pang et al., 2002)
 文1             文1
 文2
                             肯定 or 否定
 文3
 文4             文4




• 主観/客観の2値分類
• BOW素性 + ナイーブベイズ or SVMs etc.
• 客観的事実のexample
  – 本,映画のあらすじ,新聞記事
ひと工夫
• 近接性の利用(Pang and Lee, 2004)
  – 近くに出現する2文の主観/客観は一致しやすい

• モデルの“イメージ”
  – 確率モデルを作っているわけではない


 主/客   主/客      主/客        主/客   主/客      主/客

                      ……                        ……
  文1    文2      文3         文1    文2       文3

       Before                     After
コスト最小化
• 以下の式を最小化するように主観/客観を決定

   cost
  xsubj
              ( x) 
           subj         cost
                       xobj
                                obj   ( x)      prox( x , x )
                                               x1subj
                                                         1   2

                                               x2 obj




  文 x を主観/客観と判定するコスト                           文 x1 と x2 の客観/主観が異な
                                               ると判定するコスト

• コスト関数の設計
 – costsubj(x) → 文単位で学習した学習器のコスト
 – prox(x1, x2) → 文の近さ
Min-Cut
文1を主観と判断                               文1と文3の主観/
したときのコスト                               客観が異なると判
                                       断したときのコスト
                     文1
            0.8
                    1.0   0.2          0.2
             0.5                 0.5
     主観              文2                  客観

                    0.1
           0.1
                                0.9
                     文3

 Min-cut = コスト最小の割り当て
実験結果
  + 評判検出
 (w/ Min-cut)



        分類精度




  +評判検出
( w/o Min-cut)




                 ベースライン
                              評判と判断された文の割合
(Pang and Lee, 2004)の図より抜粋
C) 肯否定が混在する文書の扱い
• 文書とは別に,文ごとにも肯定と否定を推定したい
  This is the first Mp3 player that I have used … I
  thought it sounded great… After only a few weeks,
  it started having trouble with the earphone connection
  … I won’t be buying another.

• 文書レベルの肯定/否定が有効な手掛かり
  My 11 year old daughter has also been using it and it is
  a lot harder than it looks.

 実はfitness 器具に関する記述なので hard なのは良いこと
McDonald’s Joint Model (1/2)
文書全体(= 文の列)
の肯定/否定ラベル                              文の肯定/否定
                                        /中立ラベル

                      ……
                      ……
文(BOW)

     隣接する文の間にエッジがある
     文と文書の間にもエッジがある
     Viterbi algorithm で最適なラベルを求める
     Online-large margin training (MIRA)
McDonald’s Joint Model (2/2)
• 実験結果
 – 3つのドメインのレビュー(Car, Fit, Mp3)
 – 各文の肯定/否定/中立を判定
 – ベースラインとの比較により有効性を検証

                     Car        Fit     Mp3    Total
    Sentence model   54.8       56.8    49.4   53.1
    Cascaded model   59.7       61.0    58.3   59.5
    Joint model      63.5       65.2    60.1   62.6
                            (McDonald et al., 2007)から抜粋
評判情報にもとづく文書分類: まとめ
• ML との相性が良い
 – 基本的には単純な分類問題
 – 4 or 5段階のスコア付けになると回帰問題

• 文書構造の重要性
 – 主観/客観,肯定/否定/中立などのカテゴリが混在
 – かといって,multi-label classification でもない

• (精緻な素性)
 – 否定表現の扱い → モダリティの扱い
 – 句の扱い (Kudo and Matsumoto, 2004)
2. 属性に着目した評判要約
分類から要約へ
• 分類だけでは不十分
 – どのみち,たくさんのレビューを読まないといけない
 – そもそも肯否定は多くのレビューのメタデータに…

• 情報の整理が必要
 – コンパクトな“レポート”みたいなものが欲しい

          否定的な         整理された
 肯定的な     レビュー         評判情報
 レビュー
評判要約
 • 特定製品に関する評判情報を構造化
   – いわゆる情報抽出に近く,評判抽出とも言われる

 • 1つの例(Titov and McDonald, 2008)
   – 属性(aspect)ごとに評判をまとめるのが主流

                       あるレストランに関する評判の要約
             Aspect    Score   Mention
             Food      ☆☆☆☆    “Best fish in the city”, “Excellent appetizer”
             Decor     ☆☆☆     “Cozy with an old world feel”, “Too dark”
レストランのレビュー
             Service   ☆       “Our waitress was rude”, “Awful service”
評判の要約に関する研究
• Rule (Nasukawa and Yi, 2003; Kanayama et al., 2004)
• Pattern mining (Hu and Liu, 2004; Liu et al., 2005)
• Clustering + visualization (Gamon et al., 2005)
• Log-linear models (Kim and Hovy, 2006)
• Boosting (Kobayashi et al., 2007)
• Mixture models (Mei et al., 2007)
 Bayesian models (Titov and McDonald, 2008a;
  2008b)
   → レビューから属性を発見するトピックモデル
   ……
LDA (Blei et al., 2003)
• 文書(= 単語の集合)の生成モデル
                                 ~ Dir ( )
                                 z ~ Dir (  )
      α    θ    z    w
                                z ~ Multi ( )
                                w ~ Multi ( z )
 潜在トピック         β    φ
                            単語
• 潜在トピックの発見
 – 単語 w がトピック z から生成される p(w|z)
 – あるトピックから生成されやすい単語 = トピック語

• レビューではトピック語 = 属性?
トピックの粒度
• グローバルな視点(≒ 製品) → LDA

                      Zen           iPod      Sonny


                      iPod           Sonny      iPod

  MP3 playerのレビュー集合

• ローカルな視点(≒ 属性) → ???
                            price
                                    battery

                            controls
      あるレビュー
Multi-grain LDA
            (Titov and McDonald, 2008a)

      γ              αmix   • 2つの粒度のパラメータから
                              トピックを生成
      ψ       v               – θgl と θloc
                              – 文書とウィンドウレベル
              r      π
                            • Gibbs sampling を用いてパ
αgl   θgl     z      θloc     ラメータを推定

             w

      β      φ       αloc
LDA
発見されたトピック
• トピックは属性と解釈可能(ラベルは人手で付与)
MP3 player
Label                Top words
sound quality        sound quality headphones volume bass earphones good…
connection with PC   usb pc windows port transfer computer mac software…
battery              battery hours life batteries charge aaa rechargeable time…
appearance           case pocket silver screen plastic clip easily small blue…

Hotel
Label                Top words
amenities            coffee microwave fridge tv ice room refrigerator iron…
food and drink       food restaurant bar good dinner service breakfast ate eat…
staff                staff friendly helpful very desk extremely help directions…
internet             internet free access wireless use lobby high computer …
トピック-属性の対応付け
• MG-LDA の欠点
  – トピックの解釈は不明
  – 先ほどの表では人手で解釈,ラベル付け

• レビューのメタデータの利用
                                          Label   Top words
属性                    評価値                 ???     delicious soup chicken eat…
Food: 5; Decor: 5; Service 5              ???     service staff rude …
The chicken was great. On top of that     ???     dark look old-fashoed…
our service was excellent and the price   ???     price dollar reasonable…
was right. Can’t wait to go back!
                                          …       ….
            レビューデータ                                      トピック
Multi-Aspect Sentiment Model
      (Titov and McDonald, 2008b)
        γ         αmix


        ψ     v

              r    π            トピックから
                               評価値を生成
αgl     θgl   z   θloc   y

              w

        β     φ   αloc
LDA
対応付け結果
Hotel の review
Aspect     Top words
service    staff friendly helpful service desk concierge excellent
location   hotel walk location station metro walking away right
rooms      room bathroom shower bed tv small water clean
---        breakfast free coffee internet morning access
---        $ night parking rate price paid day euros got cost


                       メタデータに出現する属性を対応付け


                     余ったトピックには対応付けなし
評判情報の要約:まとめ
• 研究の主流は分類から要約にシフトしつつある
 – 評判情報の抽出ともいう


• 属性(aspect)に着目する要約
 – 評価者や比較対象なども(小林ら, 2006; Jindal and Liu 2008)


• 事例紹介
 – Bayesian models (Titov and McDonald, 2008a,2008b)
 – スタンダードな枠組みはこれから(生成モデルが流行り?)
3. 評判分析のための辞書構築
辞書
• 辞書の必要性
 – 単語や句レベルの肯否定が分かると重要な手掛かり


• 評判分析用の辞書
 – 肯否定表現をリストアップしたデータベース
 – 既存の辞書はそのまま使用不可

• 自動構築
 – 人手による辞書構築はコスト大
 – ここでも ML の活用
手法1:語彙ネットワーク
• アイデア (Kamps et al., 2004)
  – 類/反義語の肯否定は一致しやすい/にくい

• 既存の辞書から語彙ネットワークを構築
  – ノード → 単語
  – 重み付きエッジ → 肯否定が一致/不一致

• 詳細は後ほど
手法2:共起
• ウィンドウ内の共起 (Turney, 2002)
  – 種単語(“良い”や“悪い”など)との自己相互情報量
  – 句の肯否定も判定可能


• 語彙統語パターン(Kaji and Kitsuregawa, 2006,2007;
  Tokuhisa et al., 2008)
  – 適合率重視,大規模テキストへの適用を前提



     この製品の 良い 点は 値段が 手頃な            こと
辞書構築に関する研究
• 語彙ネットワーク
  – Clustering (Hatzivassiloglou and McKeown, 1997)
  – Shortest-path (Kamps, 2004)
  – Bootstrapping (Hu and Liu, 2004)
  – Spin model (Takamura et al., 2005)
  – PageRank (Esuli et al., 2007)
  ……

• 共起
   – PMI (Turney, 2002)
   – Bootstrapping (Kanayama and Nasukawa 2006)
   – Lexico-syntactic pattern (Kaji and Kitsuregawa, 2006,2007;
     Tokuhisa et al., 2008)
   ……
Shortest-path
• 語彙ネットワーク
 – WordNet の類義関係のみ
 – 肯定同士,否定同士がリンクで結ばれる

• アルゴリズム
 – Seed からの shortest-path により決定


                                 bad
         good
                           sad
Bootstrapping
  • 語彙ネットワーク
       – WordNet の類義関係と反義関係

  • アルゴリズム
       – Seed と隣接するノードの肯否定を再帰的に決定
       – Shortest-path + bootstrapping

       swift                   swift                  swift
good                    good                   good
               tardy                   tardy                  tardy


                               同義関係

                               反義関係
Spin Model (1/3)
• 重み付き語彙ネットワーク
 – WordNet の類義関係,反義関係


    反義(負)                                              同義(正)

       1.5 great
                               tardy 1.5         bad
    good               - 1.0
              2.0                                2.0
                                 1.5       sad
                    swift
                               slow
Spin Models (2/3)
• 確率モデル
 – ノードの肯定(+1),否定(-1)を生成
 – 平均場近似の適用

     リンクの重み                          ノードの肯否定
                                       (±1)
                                
  P( x | w)  exp   wij xi x j 
                                
                   i, j         
                       肯否定が一致 → wij
                       肯否定が不一致 → -wij
Spin Model (3/3)
                        改善
Dataset1
#Seeds     Spin model        Shortest-path
14         73.4              70.8
4          71.0              64.9
2          68.2              66.9
                        改善

Dataset2
#Seeds     Spin model        Bootstrapping
14         83.6              72.8
4          82.3              73.2
2          83.5              71.1
                  (Takamura et al., 2005)
PageRank
• 有向語彙ネットワーク
 – “見出し語 → 語釈文に出現した語”
  (正確には synset)

• イメージ
      見出し語(肯定)    語釈文中の語
                           この語も肯定的
                           な可能性が高い
評判分析のための辞書構築:まとめ
• 依然としてNLPに辞書は重要

• 自動構築する方法が研究対象
 – 人手による整備はコスト大
 – ML など data-driven なアプローチ

• 2つのアプローチ
 – 語彙ネットワーク → ML や link analysis
 – 共起 → very large text
4. 著者のプロファイリング
著者の属性判定(1/2)
• “誰が書いた評判”であるが大事
  – 例えば,視聴率調査における F1層と M1 層


• 性別判定 (池田ら, 2006; 小林ら, 2006)
  – BOW素性 + SVMs etc.   有効な素性(池田ら, 2006)
                                    単語
  – 612件のブログで実験           χ二乗値
                          89.6188   私
  – 精度は約 89%              50.6925   ちゃん
                          42.5347   かしら
                          40.0182   買い物
                          39.8401   もらう
著者の属性判定(2/2)
• 性格診断(Oberlander and Nowson, 2006)
  – 4つの軸(extraversion, agreeableness, openness,
    conscientiousness)に分類
  – 71人のブロガーで実験

• BOW素性 + ナイーブベイズ

• ちょっと変わり種で面白い
  – どの程度うまくいくのかは…
まとめ
• 評判分析の紹介(MLを用いた事例を中心に)

• 話題
 –   評判情報を観点とした文書分類
 –   属性にもとづく評判の要約
 –   評判分析のための辞書構築
 –   著者のプロファイリング

• 参考文献
 – 乾孝司 and 奥村学,“テキストを対象とした評価情報の分析に
   関する研究動向”, 自然言語処理, 2006
 – Pang and Lee, “Opinion Mining and Sentiment Analysis”, 2008
ご清聴ありがとうございました
付録
このスライドは…
• ややMLに偏ったサーベイです
 – 例えば(Turney,2002)は扱いがやや小さいですが評判
   分析の基本文献です.

• “正確さ”よりも“平易さ”や“話しやすさ”を優先さ
  せて作成されています
 – 特に数式やグラフィカルモデル
 – 正確な知識が必要な方は,原著を読まれることをお
   薦めします
参考文献1
• Andrea Esuli and Fabrizio Zebastiani, “PageRanking WordNet Synsets: An
  Application to Opinion Mining”, ACL07
• Michael Gamon, Anthony Aue, Simon Corston-Oliver, and Eric Ringger,
  “Pulse: Mining Customer Opinions from Free Text”, CIDA05
• Vasileios Hatzivassiloglou and Kathleen R. McKeown, “Predicting the
  Semantic Orientation of Adjectives”, ACL97
• Minqing Hu nad Bing Liu, “Mining and Summarizing Customer Reviews”,
  KDD04
• Nitin Jindal and Bing Liu, “Identifying Comparative Sentences in Text
  Documents”, SIGIR06
• Nobuhiro Kaji and Masaru Kitsuregawa, “Automatic Construction of
  Polarity-tagged Corpus from HTML Documents”, COLING/ACL06
• Nobuhiro Kaji and Masaru Kitsuregawa, “Building Lexicon for Sentiment
  Analysis from Massive Collection of HTML Documents”, EMNLP07
参考文献2
• Jaap Kamps, Maarten Marx, Robert J. Mokken, and Maarten de Rijke,
  “Using WordNet to Measure Semantic Orientation of Adjectives”, LREC04
• Hiroshi Kanayama and Tetsuya Nasukawa, “Deeper Sentiment Analysis
  Using Machine Translation Technology”, COLING04
• Hiroshi Kanayama and Tetsuya Nasukawa, “Fully Automatic Lexicon
  Expansion for Domain-oriented Sentiment Analysis”, EMNLP07
• Soo-Min Kim and Eduard Hovy, “Extracting Opinions, Opinion Holders, and
  Topics Expressed in Online News Media Text”, COLING/ACL06 Workshop
  on Sentiment and Subjectivity in Text
• Nozomi Kobayashi, Kentaro Inui, and Yuji Matsumoto, “Extracting Aspect-
  Evaluation and Aspect-of Relations in Opinion Mining”, EMNLP07
• Moshe Koppel and Jonathan Schler, “Using Neutral Examples for Learning
  Polarity”, FINEXIN05
参考文献3
• Taku Kudo and Yuji Matsumoto, “A Boosting Algorithm for Classification of
  Semi-Structured Text”, EMNLP04
• Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan, “Thumbs up?
  Sentiment Classification using Machine Learning Techniques”, EMNLP02
• Bo Pang and Lillian Lee, “A Sentiment Education: Sentiment Analysis Using
  Subjectivity Summarization Based on Minimum Cuts”, ACL04
• Bo Pang and Lillian Lee, “Seeing stars: Exploiting class relationships for
  sentiment categorization with respect to rating scales”, ACL05
• Ryan McDonald, Kerry Hannan, Tyler Neylon, Mike Wells, and Jeff Reynar,
  “Structured Models for Fine-to-Coarse Sentiment Analysis”, ACL07
• Qiaozhu Mei, Xu Ling, Matthew Wondra, Hang Su, and ChengXiang Zhai,
  “Topic Sentiment Mixture: Modeling Facets and Opinons in Weblogs”,
  WWW07
参考文献4
• Tetsuya Nasukawa and Jeonghee Yi, “Sentiment Analysis: Capturing
  Favorability Using Natural Language Processing”, K-CAP03
• Jon Oberlander and Scott Nowson, “Whose Thumb Is It Anyway?
  Classifying Author Personality from Weblog Text”, COLING/ACL06
• Hiroya Takamura, Takashi Inui, and Manabu Okumura, “Extracting
  Semantic Orientations of Words using Spin Model”, ACL05
• Ivan Titov and Ryan McDonald, “Modeling Online Reviews with Multi-grain
  Topic Models”, WWW08
• Ivan Titov and RyanMcDonald, “A Joint Model for Text and Aspect Ratings
  for Sentiment Summarization”, ACL08
• Ryoko Tokuhisa, Kentaro Inui, and Yuji Matsumoto, “Emotion Classification
  Using Massive Examples Extracted from the Web”, COLING08
• Peter Turney, “Thumbs Up or Thumbs Down? Semantic Orientation
  Applied to Unsupervised Classification of Reviews”, ACL02
参考文献5
• 池田大輔, 南野朋之, and 奥村学, “blogの著者の性別推定”, 言語処理学
  会全国大会, 2006
• 岡野原大輔 and 辻井潤一, “レビューに対する評価指標の自動付与”, 自
  然言語処理, Volume 14, Number 3, 2007
• 小林大祐, 松村真宏, and 石塚満, “ブログ記事の書き手の男女分類”, 言
  語処理学会全国大会併設ワークショップ「感情・評価・態度と言語」, 2006
• 小林のぞみ, 乾健太郎, 松本裕二, “意見情報の抽出/構造化のタスク仕
  様に関する考察”, 情報処理学会研究報告NL171-18, 2006

Más contenido relacionado

La actualidad más candente

テキストマイニングとNLPビジネス
テキストマイニングとNLPビジネステキストマイニングとNLPビジネス
テキストマイニングとNLPビジネスHiroshi Ono
 
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676Turkmenistan Laws
 
网上购买防水Mp3五大注意点
网上购买防水Mp3五大注意点网上购买防水Mp3五大注意点
网上购买防水Mp3五大注意点tayogo
 
ブラウザでMap Reduce風味の並列分散処理
ブラウザでMap Reduce風味の並列分散処理ブラウザでMap Reduce風味の並列分散処理
ブラウザでMap Reduce風味の並列分散処理Shinya Miyazaki
 
Egxeiridio Drastiriotiton Modellus
Egxeiridio Drastiriotiton ModellusEgxeiridio Drastiriotiton Modellus
Egxeiridio Drastiriotiton ModellusStergios
 
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...Rochelle Kopp
 
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loopWoohyeok Kim
 
Assembly Definition あれやこれ
Assembly Definition あれやこれAssembly Definition あれやこれ
Assembly Definition あれやこれNakanoYosuke1
 
Sillabari Hiragana Katakana
Sillabari Hiragana KatakanaSillabari Hiragana Katakana
Sillabari Hiragana KatakanaEli Chan
 
20090522 Candycane
20090522 Candycane20090522 Candycane
20090522 CandycaneYusuke Ando
 
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)Chui-Wen Chiu
 
アジャイル事例紹介 —夜のおしごと編—
アジャイル事例紹介 —夜のおしごと編—アジャイル事例紹介 —夜のおしごと編—
アジャイル事例紹介 —夜のおしごと編—Fumihiko Kinoshita
 
高中数学知识
高中数学知识高中数学知识
高中数学知识Xu jiakon
 
Republic 1&2
Republic 1&2Republic 1&2
Republic 1&2huquanwei
 
清华大学精品课程 量子力学
清华大学精品课程 量子力学清华大学精品课程 量子力学
清华大学精品课程 量子力学littlesujin
 

La actualidad más candente (18)

テキストマイニングとNLPビジネス
テキストマイニングとNLPビジネステキストマイニングとNLPビジネス
テキストマイニングとNLPビジネス
 
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676
俄罗斯进出口标准,技术规格,法律,法规,中英文,目录编号RG 2676
 
From Virtual Worlds To The 3 D Web
From Virtual Worlds To The 3 D WebFrom Virtual Worlds To The 3 D Web
From Virtual Worlds To The 3 D Web
 
网上购买防水Mp3五大注意点
网上购买防水Mp3五大注意点网上购买防水Mp3五大注意点
网上购买防水Mp3五大注意点
 
ブラウザでMap Reduce風味の並列分散処理
ブラウザでMap Reduce風味の並列分散処理ブラウザでMap Reduce風味の並列分散処理
ブラウザでMap Reduce風味の並列分散処理
 
Egxeiridio Drastiriotiton Modellus
Egxeiridio Drastiriotiton ModellusEgxeiridio Drastiriotiton Modellus
Egxeiridio Drastiriotiton Modellus
 
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...
RSGT2021 Bilingual cross-cultural discussion 日本人と外国人のディスカッション: How to acceler...
 
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
[Regional Scrum Gathering Tokyo 2021] Scrum with OODA loop
 
Assembly Definition あれやこれ
Assembly Definition あれやこれAssembly Definition あれやこれ
Assembly Definition あれやこれ
 
Sillabari Hiragana Katakana
Sillabari Hiragana KatakanaSillabari Hiragana Katakana
Sillabari Hiragana Katakana
 
4
44
4
 
20090522 Candycane
20090522 Candycane20090522 Candycane
20090522 Candycane
 
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)
Windows 7兼容性系列课程(2):Windows 7用户权限控制 (UAC)
 
アジャイル事例紹介 —夜のおしごと編—
アジャイル事例紹介 —夜のおしごと編—アジャイル事例紹介 —夜のおしごと編—
アジャイル事例紹介 —夜のおしごと編—
 
高中数学知识
高中数学知识高中数学知识
高中数学知识
 
Republic 1&2
Republic 1&2Republic 1&2
Republic 1&2
 
清华大学精品课程 量子力学
清华大学精品课程 量子力学清华大学精品课程 量子力学
清华大学精品课程 量子力学
 
greek doc 1
greek doc 1greek doc 1
greek doc 1
 

Similar a Machine learning analysis and classification of reviews

Cop",!@#%$%&*()*()
Cop",!@#%$%&*()*()Cop",!@#%$%&*()*()
Cop",!@#%$%&*()*()hehe123456
 
QM-078-企業導入六標準差之個案探討
QM-078-企業導入六標準差之個案探討QM-078-企業導入六標準差之個案探討
QM-078-企業導入六標準差之個案探討handbook
 
081210 Idcon 04 Itoh Peopleservice
081210 Idcon 04 Itoh Peopleservice081210 Idcon 04 Itoh Peopleservice
081210 Idcon 04 Itoh PeopleserviceHiroki Itoh
 
Search Engines Chapter 1 Summary
Search Engines Chapter 1 SummarySearch Engines Chapter 1 Summary
Search Engines Chapter 1 Summarysleepy_yoshi
 
秩序从哪里来?
秩序从哪里来?秩序从哪里来?
秩序从哪里来?guest8430ea2
 
IE-027 動作與時間研究建立精實生產環境
IE-027 動作與時間研究建立精實生產環境IE-027 動作與時間研究建立精實生產環境
IE-027 動作與時間研究建立精實生產環境handbook
 
文献紹介:Semantic-based information retrieval in support of concept design.
文献紹介:Semantic-based information retrieval in support of concept design.文献紹介:Semantic-based information retrieval in support of concept design.
文献紹介:Semantic-based information retrieval in support of concept design.Shin Sano
 
Opportunity Magazine 2008-11-03 Vol.5
Opportunity Magazine 2008-11-03 Vol.5Opportunity Magazine 2008-11-03 Vol.5
Opportunity Magazine 2008-11-03 Vol.5opportunity service
 
當時間的座標落在格林威治的左邊
當時間的座標落在格林威治的左邊當時間的座標落在格林威治的左邊
當時間的座標落在格林威治的左邊Vincent
 
Sc2009autumn 次世代Daoフレームワーク Doma
Sc2009autumn 次世代Daoフレームワーク DomaSc2009autumn 次世代Daoフレームワーク Doma
Sc2009autumn 次世代Daoフレームワーク DomaToshihiro Nakamura
 
英語ブログのスヽメ - 1000スピーカープロジェクト#5
英語ブログのスヽメ - 1000スピーカープロジェクト#5英語ブログのスヽメ - 1000スピーカープロジェクト#5
英語ブログのスヽメ - 1000スピーカープロジェクト#5Yusuke Kawasaki
 
20090410 Gree Opentech Presentation (opening)
20090410 Gree Opentech Presentation (opening)20090410 Gree Opentech Presentation (opening)
20090410 Gree Opentech Presentation (opening)Hideki Yamane
 
QM-076-六標準差管理方法的解題邏輯與策略
QM-076-六標準差管理方法的解題邏輯與策略QM-076-六標準差管理方法的解題邏輯與策略
QM-076-六標準差管理方法的解題邏輯與策略handbook
 
Where20 2009report
Where20 2009reportWhere20 2009report
Where20 2009reportToru Mori
 
Practical Bug Reporting
Practical Bug ReportingPractical Bug Reporting
Practical Bug Reportingcharsbar
 
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」devsumi2009
 
Webken 03: Project Design for Optimaizing User Experience
Webken 03: Project Design for Optimaizing User ExperienceWebken 03: Project Design for Optimaizing User Experience
Webken 03: Project Design for Optimaizing User ExperienceNobuya Sato
 

Similar a Machine learning analysis and classification of reviews (20)

Green IT
Green ITGreen IT
Green IT
 
Cop",!@#%$%&*()*()
Cop",!@#%$%&*()*()Cop",!@#%$%&*()*()
Cop",!@#%$%&*()*()
 
QM-078-企業導入六標準差之個案探討
QM-078-企業導入六標準差之個案探討QM-078-企業導入六標準差之個案探討
QM-078-企業導入六標準差之個案探討
 
081210 Idcon 04 Itoh Peopleservice
081210 Idcon 04 Itoh Peopleservice081210 Idcon 04 Itoh Peopleservice
081210 Idcon 04 Itoh Peopleservice
 
Search Engines Chapter 1 Summary
Search Engines Chapter 1 SummarySearch Engines Chapter 1 Summary
Search Engines Chapter 1 Summary
 
秩序从哪里来?
秩序从哪里来?秩序从哪里来?
秩序从哪里来?
 
IE-027 動作與時間研究建立精實生產環境
IE-027 動作與時間研究建立精實生產環境IE-027 動作與時間研究建立精實生產環境
IE-027 動作與時間研究建立精實生產環境
 
文献紹介:Semantic-based information retrieval in support of concept design.
文献紹介:Semantic-based information retrieval in support of concept design.文献紹介:Semantic-based information retrieval in support of concept design.
文献紹介:Semantic-based information retrieval in support of concept design.
 
Opportunity Magazine 2008-11-03 Vol.5
Opportunity Magazine 2008-11-03 Vol.5Opportunity Magazine 2008-11-03 Vol.5
Opportunity Magazine 2008-11-03 Vol.5
 
Practices of an Agile Team
Practices of an Agile TeamPractices of an Agile Team
Practices of an Agile Team
 
當時間的座標落在格林威治的左邊
當時間的座標落在格林威治的左邊當時間的座標落在格林威治的左邊
當時間的座標落在格林威治的左邊
 
Sc2009autumn 次世代Daoフレームワーク Doma
Sc2009autumn 次世代Daoフレームワーク DomaSc2009autumn 次世代Daoフレームワーク Doma
Sc2009autumn 次世代Daoフレームワーク Doma
 
英語ブログのスヽメ - 1000スピーカープロジェクト#5
英語ブログのスヽメ - 1000スピーカープロジェクト#5英語ブログのスヽメ - 1000スピーカープロジェクト#5
英語ブログのスヽメ - 1000スピーカープロジェクト#5
 
20090410 Gree Opentech Presentation (opening)
20090410 Gree Opentech Presentation (opening)20090410 Gree Opentech Presentation (opening)
20090410 Gree Opentech Presentation (opening)
 
QM-076-六標準差管理方法的解題邏輯與策略
QM-076-六標準差管理方法的解題邏輯與策略QM-076-六標準差管理方法的解題邏輯與策略
QM-076-六標準差管理方法的解題邏輯與策略
 
Where20 2009report
Where20 2009reportWhere20 2009report
Where20 2009report
 
Practical Bug Reporting
Practical Bug ReportingPractical Bug Reporting
Practical Bug Reporting
 
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」
【13-C-4】 「もう業務はとまらない!オフライン機能を使った業務アプリケーションの実例と最新 Curl 情報」
 
Reloaded
ReloadedReloaded
Reloaded
 
Webken 03: Project Design for Optimaizing User Experience
Webken 03: Project Design for Optimaizing User ExperienceWebken 03: Project Design for Optimaizing User Experience
Webken 03: Project Design for Optimaizing User Experience
 

Más de Hiroshi Ono

Voltdb - wikipedia
Voltdb - wikipediaVoltdb - wikipedia
Voltdb - wikipediaHiroshi Ono
 
Gamecenter概説
Gamecenter概説Gamecenter概説
Gamecenter概説Hiroshi Ono
 
EventDrivenArchitecture
EventDrivenArchitectureEventDrivenArchitecture
EventDrivenArchitectureHiroshi Ono
 
program_draft3.pdf
program_draft3.pdfprogram_draft3.pdf
program_draft3.pdfHiroshi Ono
 
nodalities_issue7.pdf
nodalities_issue7.pdfnodalities_issue7.pdf
nodalities_issue7.pdfHiroshi Ono
 
genpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfgenpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfHiroshi Ono
 
kademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfkademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfHiroshi Ono
 
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdf
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdfpragmaticrealworldscalajfokus2009-1233251076441384-2.pdf
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdfHiroshi Ono
 
downey08semaphores.pdf
downey08semaphores.pdfdowney08semaphores.pdf
downey08semaphores.pdfHiroshi Ono
 
BOF1-Scala02.pdf
BOF1-Scala02.pdfBOF1-Scala02.pdf
BOF1-Scala02.pdfHiroshi Ono
 
TwitterOct2008.pdf
TwitterOct2008.pdfTwitterOct2008.pdf
TwitterOct2008.pdfHiroshi Ono
 
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfstateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfHiroshi Ono
 
SACSIS2009_TCP.pdf
SACSIS2009_TCP.pdfSACSIS2009_TCP.pdf
SACSIS2009_TCP.pdfHiroshi Ono
 
scalaliftoff2009.pdf
scalaliftoff2009.pdfscalaliftoff2009.pdf
scalaliftoff2009.pdfHiroshi Ono
 
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfstateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfHiroshi Ono
 
program_draft3.pdf
program_draft3.pdfprogram_draft3.pdf
program_draft3.pdfHiroshi Ono
 
nodalities_issue7.pdf
nodalities_issue7.pdfnodalities_issue7.pdf
nodalities_issue7.pdfHiroshi Ono
 
genpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfgenpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfHiroshi Ono
 
kademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfkademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfHiroshi Ono
 

Más de Hiroshi Ono (20)

Voltdb - wikipedia
Voltdb - wikipediaVoltdb - wikipedia
Voltdb - wikipedia
 
Gamecenter概説
Gamecenter概説Gamecenter概説
Gamecenter概説
 
EventDrivenArchitecture
EventDrivenArchitectureEventDrivenArchitecture
EventDrivenArchitecture
 
program_draft3.pdf
program_draft3.pdfprogram_draft3.pdf
program_draft3.pdf
 
nodalities_issue7.pdf
nodalities_issue7.pdfnodalities_issue7.pdf
nodalities_issue7.pdf
 
genpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfgenpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdf
 
kademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfkademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdf
 
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdf
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdfpragmaticrealworldscalajfokus2009-1233251076441384-2.pdf
pragmaticrealworldscalajfokus2009-1233251076441384-2.pdf
 
downey08semaphores.pdf
downey08semaphores.pdfdowney08semaphores.pdf
downey08semaphores.pdf
 
BOF1-Scala02.pdf
BOF1-Scala02.pdfBOF1-Scala02.pdf
BOF1-Scala02.pdf
 
TwitterOct2008.pdf
TwitterOct2008.pdfTwitterOct2008.pdf
TwitterOct2008.pdf
 
camel-scala.pdf
camel-scala.pdfcamel-scala.pdf
camel-scala.pdf
 
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfstateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
 
SACSIS2009_TCP.pdf
SACSIS2009_TCP.pdfSACSIS2009_TCP.pdf
SACSIS2009_TCP.pdf
 
scalaliftoff2009.pdf
scalaliftoff2009.pdfscalaliftoff2009.pdf
scalaliftoff2009.pdf
 
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdfstateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
stateyouredoingitwrongjavaone2009-090617031310-phpapp02.pdf
 
program_draft3.pdf
program_draft3.pdfprogram_draft3.pdf
program_draft3.pdf
 
nodalities_issue7.pdf
nodalities_issue7.pdfnodalities_issue7.pdf
nodalities_issue7.pdf
 
genpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdfgenpaxospublic-090703114743-phpapp01.pdf
genpaxospublic-090703114743-phpapp01.pdf
 
kademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdfkademlia-1227143905867010-8.pdf
kademlia-1227143905867010-8.pdf
 

Último

Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Patryk Bandurski
 
SIEMENS: RAPUNZEL – A Tale About Knowledge Graph
SIEMENS: RAPUNZEL – A Tale About Knowledge GraphSIEMENS: RAPUNZEL – A Tale About Knowledge Graph
SIEMENS: RAPUNZEL – A Tale About Knowledge GraphNeo4j
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptxLBM Solutions
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxMalak Abu Hammad
 
GenCyber Cyber Security Day Presentation
GenCyber Cyber Security Day PresentationGenCyber Cyber Security Day Presentation
GenCyber Cyber Security Day PresentationMichael W. Hawkins
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Alan Dix
 
Pigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions
 
The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024Rafal Los
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationSafe Software
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
Scaling API-first – The story of a global engineering organization
Scaling API-first – The story of a global engineering organizationScaling API-first – The story of a global engineering organization
Scaling API-first – The story of a global engineering organizationRadu Cotescu
 
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking MenDelhi Call girls
 
Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Paola De la Torre
 
Slack Application Development 101 Slides
Slack Application Development 101 SlidesSlack Application Development 101 Slides
Slack Application Development 101 Slidespraypatel2
 
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...HostedbyConfluent
 
[2024]Digital Global Overview Report 2024 Meltwater.pdf
[2024]Digital Global Overview Report 2024 Meltwater.pdf[2024]Digital Global Overview Report 2024 Meltwater.pdf
[2024]Digital Global Overview Report 2024 Meltwater.pdfhans926745
 
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024Scott Keck-Warren
 
04-2024-HHUG-Sales-and-Marketing-Alignment.pptx
04-2024-HHUG-Sales-and-Marketing-Alignment.pptx04-2024-HHUG-Sales-and-Marketing-Alignment.pptx
04-2024-HHUG-Sales-and-Marketing-Alignment.pptxHampshireHUG
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitecturePixlogix Infotech
 

Último (20)

Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
Integration and Automation in Practice: CI/CD in Mule Integration and Automat...
 
SIEMENS: RAPUNZEL – A Tale About Knowledge Graph
SIEMENS: RAPUNZEL – A Tale About Knowledge GraphSIEMENS: RAPUNZEL – A Tale About Knowledge Graph
SIEMENS: RAPUNZEL – A Tale About Knowledge Graph
 
Key Features Of Token Development (1).pptx
Key  Features Of Token  Development (1).pptxKey  Features Of Token  Development (1).pptx
Key Features Of Token Development (1).pptx
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptx
 
GenCyber Cyber Security Day Presentation
GenCyber Cyber Security Day PresentationGenCyber Cyber Security Day Presentation
GenCyber Cyber Security Day Presentation
 
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...Swan(sea) Song – personal research during my six years at Swansea ... and bey...
Swan(sea) Song – personal research during my six years at Swansea ... and bey...
 
Pigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food ManufacturingPigging Solutions in Pet Food Manufacturing
Pigging Solutions in Pet Food Manufacturing
 
The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024The 7 Things I Know About Cyber Security After 25 Years | April 2024
The 7 Things I Know About Cyber Security After 25 Years | April 2024
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
Scaling API-first – The story of a global engineering organization
Scaling API-first – The story of a global engineering organizationScaling API-first – The story of a global engineering organization
Scaling API-first – The story of a global engineering organization
 
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
08448380779 Call Girls In Diplomatic Enclave Women Seeking Men
 
Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101Salesforce Community Group Quito, Salesforce 101
Salesforce Community Group Quito, Salesforce 101
 
Slack Application Development 101 Slides
Slack Application Development 101 SlidesSlack Application Development 101 Slides
Slack Application Development 101 Slides
 
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
Transforming Data Streams with Kafka Connect: An Introduction to Single Messa...
 
[2024]Digital Global Overview Report 2024 Meltwater.pdf
[2024]Digital Global Overview Report 2024 Meltwater.pdf[2024]Digital Global Overview Report 2024 Meltwater.pdf
[2024]Digital Global Overview Report 2024 Meltwater.pdf
 
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
Neo4j - How KGs are shaping the future of Generative AI at AWS Summit London ...
 
SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024SQL Database Design For Developers at php[tek] 2024
SQL Database Design For Developers at php[tek] 2024
 
04-2024-HHUG-Sales-and-Marketing-Alignment.pptx
04-2024-HHUG-Sales-and-Marketing-Alignment.pptx04-2024-HHUG-Sales-and-Marketing-Alignment.pptx
04-2024-HHUG-Sales-and-Marketing-Alignment.pptx
 
Understanding the Laravel MVC Architecture
Understanding the Laravel MVC ArchitectureUnderstanding the Laravel MVC Architecture
Understanding the Laravel MVC Architecture
 

Machine learning analysis and classification of reviews

  • 1. テキストからの評判分析と 機械学習 鍜治伸裕 東京大学 生産技術研究所
  • 2. 講演の前に • 想定している聴衆 – 評判分析について専門的なことを知らない – 機械学習(ML)の素養を持っている • 講演の内容 – 評判分析という分野の解説 – 評判分析における ML の適用事例の紹介 • お断り – 自然言語処理(NLP)の話に特化 – ML を使っている論文を私の好みで選んで紹介
  • 4. 評判分析はこんな技術 • 例: Yahoo!ブログ検索における「VAIO」の検索結果 肯定的な書き込みと否定的 な書き込みを分類して提示 肯定的評判と否定的評判の 書き込み数を集計して表示
  • 5. 背景: CGMの出現 • CGM – Consumer Generated Media のこと – 例えば Amazon に投稿されたレビューやブログなど – 一般人が作成,発信するコンテンツである点がポイント • 人々の“生の声”を拾える可能性 – 購買行動の決定支援 or 企業におけるマーケティング e.g., VAIOのtype Pが気になるんだけど,使いやすいの? – 世論の集約と分析 e.g., 給付金ってみんなどう考えてるの?
  • 6. NLP的に見ると • CGMの出現に伴い,新しい解析技術が必要になった – テキスト中の評判や意見などを把握 • 斬新な問題に見える → 論文書けそう – 従来は,テキスト中の客観的事実が興味の対象 e.g., イベント抽出,固有表現認識 etc. – それと比較すると,評判とは極めて主観的内容 • しかも応用先はかなりはっきりしている
  • 7. 大きな流れ • 1990年代 – 形容詞の肯定/否定分類(Hatzivassiloglou and McKeown, 1997) e.g., adequate → 肯定的, troublesome → 否定的 • 2000年代 – レビュー文書の肯定/否定分類(Turney, 2002; Pang et al., 2002) – これ以降,評判分析が爆発的に流行 – 評判分析を専門に扱う国際ワークショップ e.g., AAAI spring symposium 2004, ACL workshop 2006 – タスクが複雑化,詳細化しながら現在にいたる
  • 8. MLが使われる局面(1/2) 1. 評判情報を観点とした文書分類 評判が記述された文書 肯定 or 否定 (レビューなど) 2. 属性(aspect)に着目した評判要約 or 抽出 あるレストランの評判の要約例 (Titov and McDonald, 2008) Aspect Score Mention Food ☆☆☆☆ “Best fish in the city”, “Excellent appetizer” Decor ☆☆☆ “Cozy with an old world feel”, “Too dark” レビュー集合 Service ☆ “Our waitress was rude”, “Awful service”
  • 9. MLが使われる局面(2/2) 3. 辞書の自動構築 おいしい → 肯定 ダメだ → 否定 不安が大きい → 否定 不安なし → 肯定 期待が大きい → 肯定 ...... 4. 著者(= 評判の発信者)のプロファイリング 男?女?
  • 11. 背景(一部繰り返し) • CGMの出現により,評判が書かれたテキストが増加 – 例えばAmazon に投稿されたレビューやブログ • 当時(2000年ごろ)の検索エンジン – 評判検索なんてない! – Akumal に旅行する人が“Akumal travel review” で検索し ても… (Turney, 2002) • 誰かが考えたこと – 文書を肯定/否定に応じて分類できると役立つのでは?
  • 12. MLが適用された初の事例 • (Pang et al., 2002) データ – WWW上の映画レビュー(Internet Movie Database, IMDb) – すでに肯定/否定のタグがついている 手法 – 単語の出現を2値素性(Bag-of-words, BOW 素性) – ただし否定タグを導入(….not good…. → NOT_good) – ナイーブベイズ,対数線形モデル,SVMs を適用 結果 – SVMs が最も良く 82.9% の分類精度
  • 13. インパクト大 • 斬新だった点 – “評判情報を観点とした文書分類”という問題提起 – 肯定/否定の2値分類として定式化 + MLの適用 – 訓練/評価事例をレビューサイトから収集 • 評判分析の流行の火付け役の一人 – もう一人は (Turney, 2002) – 引用数は 524 と 504 (by Google Scholar)
  • 14. (Pang et al., 2002)以降 A) 分類カテゴリの詳細化 B) 評判箇所の検出 C) 肯否定が混在する文書の扱い
  • 15. A) 分類カテゴリの詳細化 • 肯定/否定より細かい粒度の分類 – 2値分類 (Pang et al., 2002)の素直な拡張 • 問題設定 – 肯定/否定/中立の3値分類 (Koppel and Scheler, 2006) – 4 or 5段階のスコア付け(Pang and Lee, 2005; Okanohara and Tsujii, 2007) • 新しい設定に適したアルゴリズム – SVR (Vapnik, 1995; Smola and Scholkopf, 1998) – Metric labeling (Kleinberg and Tardos, 2002)
  • 16. 分類 VS. 回帰 • 実験例 (Okanohara and Tsujii, 2007) – 本のレビューを5段階でスコア付け – Mean square error で評価 Method Mean square error(corpus A, corpus B) Pairwise SVM 1.32 2.13 SVR 0.94 1.38 改善が見られる
  • 17. B) 評判箇所の検出 客観的事実の記述(レビューの場 合,主に本や映画のあらすじ) “Harry Potter (本)” のレビュー の例(Okanohara and Tsujii, 2007) It is a fantasy fairytale, sometimes linked to Cinderella, about a young orphaned boy transported into a world of magic and sorcery. Harry Potter finds himself at a school for wizards, where his reputation precedes him, and soon becomes embroiled in a classic battle of a good versus evil. …. The pages shimmer with creativity, and although an easy read for adults, I would recommend it heartily to anyone that enjoys escaping the real world for an hour or three. 主観的な記述(= 評判)
  • 18. 段階的処理 客観+主観 主観のみ (Pang et al., 2002) 文1 文1 文2 肯定 or 否定 文3 文4 文4 • 主観/客観の2値分類 • BOW素性 + ナイーブベイズ or SVMs etc. • 客観的事実のexample – 本,映画のあらすじ,新聞記事
  • 19. ひと工夫 • 近接性の利用(Pang and Lee, 2004) – 近くに出現する2文の主観/客観は一致しやすい • モデルの“イメージ” – 確率モデルを作っているわけではない 主/客 主/客 主/客 主/客 主/客 主/客 …… …… 文1 文2 文3 文1 文2 文3 Before After
  • 20. コスト最小化 • 以下の式を最小化するように主観/客観を決定  cost xsubj ( x)  subj  cost xobj obj ( x)   prox( x , x ) x1subj 1 2 x2 obj 文 x を主観/客観と判定するコスト 文 x1 と x2 の客観/主観が異な ると判定するコスト • コスト関数の設計 – costsubj(x) → 文単位で学習した学習器のコスト – prox(x1, x2) → 文の近さ
  • 21. Min-Cut 文1を主観と判断 文1と文3の主観/ したときのコスト 客観が異なると判 断したときのコスト 文1 0.8 1.0 0.2 0.2 0.5 0.5 主観 文2 客観 0.1 0.1 0.9 文3 Min-cut = コスト最小の割り当て
  • 22. 実験結果 + 評判検出 (w/ Min-cut) 分類精度 +評判検出 ( w/o Min-cut) ベースライン 評判と判断された文の割合 (Pang and Lee, 2004)の図より抜粋
  • 23. C) 肯否定が混在する文書の扱い • 文書とは別に,文ごとにも肯定と否定を推定したい This is the first Mp3 player that I have used … I thought it sounded great… After only a few weeks, it started having trouble with the earphone connection … I won’t be buying another. • 文書レベルの肯定/否定が有効な手掛かり My 11 year old daughter has also been using it and it is a lot harder than it looks. 実はfitness 器具に関する記述なので hard なのは良いこと
  • 24. McDonald’s Joint Model (1/2) 文書全体(= 文の列) の肯定/否定ラベル 文の肯定/否定 /中立ラベル …… …… 文(BOW) 隣接する文の間にエッジがある 文と文書の間にもエッジがある Viterbi algorithm で最適なラベルを求める Online-large margin training (MIRA)
  • 25. McDonald’s Joint Model (2/2) • 実験結果 – 3つのドメインのレビュー(Car, Fit, Mp3) – 各文の肯定/否定/中立を判定 – ベースラインとの比較により有効性を検証 Car Fit Mp3 Total Sentence model 54.8 56.8 49.4 53.1 Cascaded model 59.7 61.0 58.3 59.5 Joint model 63.5 65.2 60.1 62.6 (McDonald et al., 2007)から抜粋
  • 26. 評判情報にもとづく文書分類: まとめ • ML との相性が良い – 基本的には単純な分類問題 – 4 or 5段階のスコア付けになると回帰問題 • 文書構造の重要性 – 主観/客観,肯定/否定/中立などのカテゴリが混在 – かといって,multi-label classification でもない • (精緻な素性) – 否定表現の扱い → モダリティの扱い – 句の扱い (Kudo and Matsumoto, 2004)
  • 28. 分類から要約へ • 分類だけでは不十分 – どのみち,たくさんのレビューを読まないといけない – そもそも肯否定は多くのレビューのメタデータに… • 情報の整理が必要 – コンパクトな“レポート”みたいなものが欲しい 否定的な 整理された 肯定的な レビュー 評判情報 レビュー
  • 29. 評判要約 • 特定製品に関する評判情報を構造化 – いわゆる情報抽出に近く,評判抽出とも言われる • 1つの例(Titov and McDonald, 2008) – 属性(aspect)ごとに評判をまとめるのが主流 あるレストランに関する評判の要約 Aspect Score Mention Food ☆☆☆☆ “Best fish in the city”, “Excellent appetizer” Decor ☆☆☆ “Cozy with an old world feel”, “Too dark” レストランのレビュー Service ☆ “Our waitress was rude”, “Awful service”
  • 30. 評判の要約に関する研究 • Rule (Nasukawa and Yi, 2003; Kanayama et al., 2004) • Pattern mining (Hu and Liu, 2004; Liu et al., 2005) • Clustering + visualization (Gamon et al., 2005) • Log-linear models (Kim and Hovy, 2006) • Boosting (Kobayashi et al., 2007) • Mixture models (Mei et al., 2007)  Bayesian models (Titov and McDonald, 2008a; 2008b) → レビューから属性を発見するトピックモデル ……
  • 31. LDA (Blei et al., 2003) • 文書(= 単語の集合)の生成モデル  ~ Dir ( )  z ~ Dir (  ) α θ z w z ~ Multi ( ) w ~ Multi ( z ) 潜在トピック β φ 単語 • 潜在トピックの発見 – 単語 w がトピック z から生成される p(w|z) – あるトピックから生成されやすい単語 = トピック語 • レビューではトピック語 = 属性?
  • 32. トピックの粒度 • グローバルな視点(≒ 製品) → LDA Zen iPod Sonny iPod Sonny iPod MP3 playerのレビュー集合 • ローカルな視点(≒ 属性) → ??? price battery controls あるレビュー
  • 33. Multi-grain LDA (Titov and McDonald, 2008a) γ αmix • 2つの粒度のパラメータから トピックを生成 ψ v – θgl と θloc – 文書とウィンドウレベル r π • Gibbs sampling を用いてパ αgl θgl z θloc ラメータを推定 w β φ αloc LDA
  • 34. 発見されたトピック • トピックは属性と解釈可能(ラベルは人手で付与) MP3 player Label Top words sound quality sound quality headphones volume bass earphones good… connection with PC usb pc windows port transfer computer mac software… battery battery hours life batteries charge aaa rechargeable time… appearance case pocket silver screen plastic clip easily small blue… Hotel Label Top words amenities coffee microwave fridge tv ice room refrigerator iron… food and drink food restaurant bar good dinner service breakfast ate eat… staff staff friendly helpful very desk extremely help directions… internet internet free access wireless use lobby high computer …
  • 35. トピック-属性の対応付け • MG-LDA の欠点 – トピックの解釈は不明 – 先ほどの表では人手で解釈,ラベル付け • レビューのメタデータの利用 Label Top words 属性 評価値 ??? delicious soup chicken eat… Food: 5; Decor: 5; Service 5 ??? service staff rude … The chicken was great. On top of that ??? dark look old-fashoed… our service was excellent and the price ??? price dollar reasonable… was right. Can’t wait to go back! … …. レビューデータ トピック
  • 36. Multi-Aspect Sentiment Model (Titov and McDonald, 2008b) γ αmix ψ v r π トピックから 評価値を生成 αgl θgl z θloc y w β φ αloc LDA
  • 37. 対応付け結果 Hotel の review Aspect Top words service staff friendly helpful service desk concierge excellent location hotel walk location station metro walking away right rooms room bathroom shower bed tv small water clean --- breakfast free coffee internet morning access --- $ night parking rate price paid day euros got cost メタデータに出現する属性を対応付け 余ったトピックには対応付けなし
  • 38. 評判情報の要約:まとめ • 研究の主流は分類から要約にシフトしつつある – 評判情報の抽出ともいう • 属性(aspect)に着目する要約 – 評価者や比較対象なども(小林ら, 2006; Jindal and Liu 2008) • 事例紹介 – Bayesian models (Titov and McDonald, 2008a,2008b) – スタンダードな枠組みはこれから(生成モデルが流行り?)
  • 40. 辞書 • 辞書の必要性 – 単語や句レベルの肯否定が分かると重要な手掛かり • 評判分析用の辞書 – 肯否定表現をリストアップしたデータベース – 既存の辞書はそのまま使用不可 • 自動構築 – 人手による辞書構築はコスト大 – ここでも ML の活用
  • 41. 手法1:語彙ネットワーク • アイデア (Kamps et al., 2004) – 類/反義語の肯否定は一致しやすい/にくい • 既存の辞書から語彙ネットワークを構築 – ノード → 単語 – 重み付きエッジ → 肯否定が一致/不一致 • 詳細は後ほど
  • 42. 手法2:共起 • ウィンドウ内の共起 (Turney, 2002) – 種単語(“良い”や“悪い”など)との自己相互情報量 – 句の肯否定も判定可能 • 語彙統語パターン(Kaji and Kitsuregawa, 2006,2007; Tokuhisa et al., 2008) – 適合率重視,大規模テキストへの適用を前提 この製品の 良い 点は 値段が 手頃な こと
  • 43. 辞書構築に関する研究 • 語彙ネットワーク – Clustering (Hatzivassiloglou and McKeown, 1997) – Shortest-path (Kamps, 2004) – Bootstrapping (Hu and Liu, 2004) – Spin model (Takamura et al., 2005) – PageRank (Esuli et al., 2007) …… • 共起 – PMI (Turney, 2002) – Bootstrapping (Kanayama and Nasukawa 2006) – Lexico-syntactic pattern (Kaji and Kitsuregawa, 2006,2007; Tokuhisa et al., 2008) ……
  • 44. Shortest-path • 語彙ネットワーク – WordNet の類義関係のみ – 肯定同士,否定同士がリンクで結ばれる • アルゴリズム – Seed からの shortest-path により決定 bad good sad
  • 45. Bootstrapping • 語彙ネットワーク – WordNet の類義関係と反義関係 • アルゴリズム – Seed と隣接するノードの肯否定を再帰的に決定 – Shortest-path + bootstrapping swift swift swift good good good tardy tardy tardy 同義関係 反義関係
  • 46. Spin Model (1/3) • 重み付き語彙ネットワーク – WordNet の類義関係,反義関係 反義(負) 同義(正) 1.5 great tardy 1.5 bad good - 1.0 2.0 2.0 1.5 sad swift slow
  • 47. Spin Models (2/3) • 確率モデル – ノードの肯定(+1),否定(-1)を生成 – 平均場近似の適用 リンクの重み ノードの肯否定 (±1)   P( x | w)  exp   wij xi x j     i, j  肯否定が一致 → wij 肯否定が不一致 → -wij
  • 48. Spin Model (3/3) 改善 Dataset1 #Seeds Spin model Shortest-path 14 73.4 70.8 4 71.0 64.9 2 68.2 66.9 改善 Dataset2 #Seeds Spin model Bootstrapping 14 83.6 72.8 4 82.3 73.2 2 83.5 71.1 (Takamura et al., 2005)
  • 49. PageRank • 有向語彙ネットワーク – “見出し語 → 語釈文に出現した語” (正確には synset) • イメージ 見出し語(肯定) 語釈文中の語 この語も肯定的 な可能性が高い
  • 50. 評判分析のための辞書構築:まとめ • 依然としてNLPに辞書は重要 • 自動構築する方法が研究対象 – 人手による整備はコスト大 – ML など data-driven なアプローチ • 2つのアプローチ – 語彙ネットワーク → ML や link analysis – 共起 → very large text
  • 52. 著者の属性判定(1/2) • “誰が書いた評判”であるが大事 – 例えば,視聴率調査における F1層と M1 層 • 性別判定 (池田ら, 2006; 小林ら, 2006) – BOW素性 + SVMs etc. 有効な素性(池田ら, 2006) 単語 – 612件のブログで実験 χ二乗値 89.6188 私 – 精度は約 89% 50.6925 ちゃん 42.5347 かしら 40.0182 買い物 39.8401 もらう
  • 53. 著者の属性判定(2/2) • 性格診断(Oberlander and Nowson, 2006) – 4つの軸(extraversion, agreeableness, openness, conscientiousness)に分類 – 71人のブロガーで実験 • BOW素性 + ナイーブベイズ • ちょっと変わり種で面白い – どの程度うまくいくのかは…
  • 54. まとめ • 評判分析の紹介(MLを用いた事例を中心に) • 話題 – 評判情報を観点とした文書分類 – 属性にもとづく評判の要約 – 評判分析のための辞書構築 – 著者のプロファイリング • 参考文献 – 乾孝司 and 奥村学,“テキストを対象とした評価情報の分析に 関する研究動向”, 自然言語処理, 2006 – Pang and Lee, “Opinion Mining and Sentiment Analysis”, 2008
  • 57. このスライドは… • ややMLに偏ったサーベイです – 例えば(Turney,2002)は扱いがやや小さいですが評判 分析の基本文献です. • “正確さ”よりも“平易さ”や“話しやすさ”を優先さ せて作成されています – 特に数式やグラフィカルモデル – 正確な知識が必要な方は,原著を読まれることをお 薦めします
  • 58. 参考文献1 • Andrea Esuli and Fabrizio Zebastiani, “PageRanking WordNet Synsets: An Application to Opinion Mining”, ACL07 • Michael Gamon, Anthony Aue, Simon Corston-Oliver, and Eric Ringger, “Pulse: Mining Customer Opinions from Free Text”, CIDA05 • Vasileios Hatzivassiloglou and Kathleen R. McKeown, “Predicting the Semantic Orientation of Adjectives”, ACL97 • Minqing Hu nad Bing Liu, “Mining and Summarizing Customer Reviews”, KDD04 • Nitin Jindal and Bing Liu, “Identifying Comparative Sentences in Text Documents”, SIGIR06 • Nobuhiro Kaji and Masaru Kitsuregawa, “Automatic Construction of Polarity-tagged Corpus from HTML Documents”, COLING/ACL06 • Nobuhiro Kaji and Masaru Kitsuregawa, “Building Lexicon for Sentiment Analysis from Massive Collection of HTML Documents”, EMNLP07
  • 59. 参考文献2 • Jaap Kamps, Maarten Marx, Robert J. Mokken, and Maarten de Rijke, “Using WordNet to Measure Semantic Orientation of Adjectives”, LREC04 • Hiroshi Kanayama and Tetsuya Nasukawa, “Deeper Sentiment Analysis Using Machine Translation Technology”, COLING04 • Hiroshi Kanayama and Tetsuya Nasukawa, “Fully Automatic Lexicon Expansion for Domain-oriented Sentiment Analysis”, EMNLP07 • Soo-Min Kim and Eduard Hovy, “Extracting Opinions, Opinion Holders, and Topics Expressed in Online News Media Text”, COLING/ACL06 Workshop on Sentiment and Subjectivity in Text • Nozomi Kobayashi, Kentaro Inui, and Yuji Matsumoto, “Extracting Aspect- Evaluation and Aspect-of Relations in Opinion Mining”, EMNLP07 • Moshe Koppel and Jonathan Schler, “Using Neutral Examples for Learning Polarity”, FINEXIN05
  • 60. 参考文献3 • Taku Kudo and Yuji Matsumoto, “A Boosting Algorithm for Classification of Semi-Structured Text”, EMNLP04 • Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan, “Thumbs up? Sentiment Classification using Machine Learning Techniques”, EMNLP02 • Bo Pang and Lillian Lee, “A Sentiment Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts”, ACL04 • Bo Pang and Lillian Lee, “Seeing stars: Exploiting class relationships for sentiment categorization with respect to rating scales”, ACL05 • Ryan McDonald, Kerry Hannan, Tyler Neylon, Mike Wells, and Jeff Reynar, “Structured Models for Fine-to-Coarse Sentiment Analysis”, ACL07 • Qiaozhu Mei, Xu Ling, Matthew Wondra, Hang Su, and ChengXiang Zhai, “Topic Sentiment Mixture: Modeling Facets and Opinons in Weblogs”, WWW07
  • 61. 参考文献4 • Tetsuya Nasukawa and Jeonghee Yi, “Sentiment Analysis: Capturing Favorability Using Natural Language Processing”, K-CAP03 • Jon Oberlander and Scott Nowson, “Whose Thumb Is It Anyway? Classifying Author Personality from Weblog Text”, COLING/ACL06 • Hiroya Takamura, Takashi Inui, and Manabu Okumura, “Extracting Semantic Orientations of Words using Spin Model”, ACL05 • Ivan Titov and Ryan McDonald, “Modeling Online Reviews with Multi-grain Topic Models”, WWW08 • Ivan Titov and RyanMcDonald, “A Joint Model for Text and Aspect Ratings for Sentiment Summarization”, ACL08 • Ryoko Tokuhisa, Kentaro Inui, and Yuji Matsumoto, “Emotion Classification Using Massive Examples Extracted from the Web”, COLING08 • Peter Turney, “Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews”, ACL02
  • 62. 参考文献5 • 池田大輔, 南野朋之, and 奥村学, “blogの著者の性別推定”, 言語処理学 会全国大会, 2006 • 岡野原大輔 and 辻井潤一, “レビューに対する評価指標の自動付与”, 自 然言語処理, Volume 14, Number 3, 2007 • 小林大祐, 松村真宏, and 石塚満, “ブログ記事の書き手の男女分類”, 言 語処理学会全国大会併設ワークショップ「感情・評価・態度と言語」, 2006 • 小林のぞみ, 乾健太郎, 松本裕二, “意見情報の抽出/構造化のタスク仕 様に関する考察”, 情報処理学会研究報告NL171-18, 2006