Similarity and Distance Measures for Hierarchical Taxonomies

Introduction ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Phenomenon: Technology Space ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Patent Classification Taxonomy http://uspto.gov/go/classification/selectnumwithtitle.htm http://www.uspto.gov/web/offices/opc/documents/classescombined.pdf

USCL Hierarchy (Class and above)

USCL Class 704 (Subclass Level)

Traditional Distance Measures ,[object Object],[object Object],[object Object],[object Object]

Limitations of Traditional Measures ,[object Object],[object Object],[object Object],[object Object],A21B A21C B60F A 21B A 21B A 01M = = ≠ ≠ ,[object Object],[object Object],[object Object],[object Object]

Taxonomically Appropriate Measure ,[object Object],[object Object],[object Object],=Number of times classification i is assigned to entity A =Number of times classification i is assigned to entity B =Frequency of Patents Classified within subtree subsumed by parent of classification i =Frequency of Patents Classified within subtree subsumed by classification i

Class & Subclass Array Expansion ,[object Object],Dimension / Level Classification (Dimension Name) Description 1 G1-02 COMMUNICATIONS, RADIANT ENERGY, WEAPONS, ELECTRICAL, AND COMPUTER ARTS 2 G1-02/G2-05 … / CALCULATORS, COMPUTERS, OR DATA PROCESSING SYSTEMS 3 G1-02/G2-05 /704 … / DATA PROCESSING: SPEECH SIGNAL PROCESSING, LINGUISTICS, LANGUAGE TRANSLATION, AND AUDIO COMPRESSION-DECOMPRESSION 4 G1-02/G2-05 /704/200 … / SPEECH SIGNAL PROCESSING 5 G1-02/G2-05 /704/200/231 … / Recognition 6 G1-02/G2-05 /704/200/231/232 … / Neural network

IDF Weighting ,[object Object],[object Object],[object Object],[object Object],[object Object]

Patent Example 6 7 7 6 5 5 5 5 4 4 3 3 2 2 2 1 1 7 7 4 3 2

Dataset #1: Traditional Methods ,[object Object],[object Object],Primary Only All Classifications Class Level Class-Subclass Level Graphs show frequency of similarity calculations within samples Left most is similarity = 0 Right most is similarity = 1

Dataset #1: Taxonomical Method Primary Only All Classifications

Dataset #1: Traditional vs. Taxonomical Subclass Level Class Level

Dataset #2: Traditional Methods ,[object Object],[object Object],[object Object],[object Object],[object Object],Class Level Jaffe Subcategory Level Jaffe Category Level

Dataset #2: Taxonomical Method vs. Class vs. Subcategory vs. Category ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusions ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Similarity and Distance Measures for Hierarchical Taxonomies

Recommended

Recommended

More Related Content

Similar to Similarity and Distance Measures for Hierarchical Taxonomies

Similar to Similarity and Distance Measures for Hierarchical Taxonomies (20)

Similarity and Distance Measures for Hierarchical Taxonomies

Editor's Notes