SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
Kendthed og vigtighed
Om søgemaskiner og sociale netværk

          Kenneth Geisshirt
Agenda
 ●   Om mig
 ●   Baggrund
 ●   Grafer
 ●   Korteste sti
 ●   Facebook, PGP og Kevin Bacon
 ●   Small World
 ●   Søgemaskiner

2010-09-30          © 2010 Kenneth Geisshirt        2
Om mig
●   Privat
    ●   Gift med Pia
    ●   To børn: Svea (6 år) og Svante (9 år)
●   Uddannelse
    ●   B.Sc. i kemi/datalogi (KU)
    ●   cand.scient. i kemi (KU)
    ●   Ph.d. i soft material science (RUC)
●   Selvstændig/freelancer
    ●   Software-udvikling
    ●   Skribent (artikler, bøger)
    ●   Underviser (kurser, teknisk skole)
●   Rollemodel i IT-Branchen
2010-09-30                           © 2010 Kenneth Geisshirt        3
Lidt baggrund
 ●   Venner på Facebook
      ●      Mere end 50?
      ●      Mere end 250?
      ●      Mere end 500?

●    Brug af Google
     ●    Indenfor en uge?
     ●    Sidste døgn?
     ●    Her til morgen?
2010-09-30                   © 2010 Kenneth Geisshirt               4
Mere baggrund
                     Thomas Ring Pedersen
                     1.340 hits
                          Poul-Henning Kamp
                               50.400 hits

             Lars Løkke Rasmussen
             320.000 hits


2010-09-30                  © 2010 Kenneth Geisshirt         5
Grafer
En graf består af
      ●   En række knuder (eng. nodes)
      ●   Kanter/forbindelser (eng. edges) mellem knuderne
      ●   Kanterne kan have vægt eller længde (1 hvis intet andet
          siges)
      ●   Kanterne kan være orienteret
  ●   En sti mellem to knuder
      ●   4 →5 →1
      ●   4 →5 → 2 →1
      ●   4 → 3→ 2 → 1
      ●   4 → 3 →2 →5 →1
2010-09-30                   © 2010 Kenneth Geisshirt               6
Flere ord
 ●   En knudes valens er antal kanter som går ud fra
     knuden
      ●   Knude 4 har valens 3
 ●   En kreds eller cyklus er sti som ender hvor den
     begynder
      ●   2 →3 →4 →5
 ●   En graf er sammenhængende hvis er der findes
     mindst en sti mellem alle knuder
 ●   En lukket Euler-tur er en cyklus som indeholder
     alle kanter én gang
2010-09-30                 © 2010 Kenneth Geisshirt           7
Anvendelse af grafer
 ●   Optimering af vej/el/kloaknettet og
     computernetværk
 ●   Farvelægning af kort
     ●   Fire farver er nok
 ●   Overvågningskameraer
     ●   Mindste antal og bedste placering
 ●   Korteste sti
     ●   GPS i biler
 ●   Dine venner, venners venner, venners
     venners …
2010-09-30                    © 2010 Kenneth Geisshirt   8
Gåtur over broer i Königsberg
 ●   Opgave: er det muligt at komme
     hele byen rundt og kun passere
     broerne én gang?
 ●   Svar: Nej!
 ●   Argument: En lukket Euler-tur er
     kun mulig hvis og kun alle knuder
     har lige valens



2010-09-30            © 2010 Kenneth Geisshirt   9
Korteste sti
Udfordringen er at finde den korteste
sti mellem to knuder
 ●   Summen af kanternes
     vægt/længde skal være mindst
     muligt
 ●   Anvendelser:
      ●      Rejseplanen og bilnavigation
 ●   E. Dijkstra udviklede første                               4 →5 →1
     (computer)metode i 1956
2010-09-30                   © 2010 Kenneth Geisshirt                10
Facebook som graf
 ●   Personer er knuder
 ●   Venskab er en kant
      ●   Maximal valens er 2000
 ●   Grafen ændrer sig med tiden
 ●   En sti angiver venners venners …
 ●
     http://www.touchgraph.net/


     Vigtighed er laveste
     gennemsnitlige korteste sti
     Det er ikke antal venner
2010-09-30                        © 2010 Kenneth Geisshirt   11
Pretty Good Privacy
 ●   PGP er et socialt netværk
      ●   Udveksling af digital signatur til emails
      ●   Personerne skal mødes ikke-virtuelt og viser billed-ID
          (kørekort, pas, etc.)
 ●   Opbygger web of trust mellem brugerne
      ●   Du kan angive en værdi for din tillid
      ●   Og derved udregne tilliden til dine venners venner




2010-09-30                   © 2010 Kenneth Geisshirt              12
Kevin Bacon
●   Enhver skuespiller er forbunden med Kevin
    Bacon gennem højest 6 led
●   Som graf:
    ●   Skuespillere er knuderne
    ●   Filmene er kanterne
    ●   Korteste sti til Kevin Bacon er højest 6
                                                                               Foto: SAGIndie
●   http://oracleofbacon.org/




             Tomas Villum              Jakob Cedergren


2010-09-30                         © 2010 Kenneth Geisshirt     Dianne Wiest               13
Small World
 ●   Small World fænomenet
     ●   PGP og skuespillere lever i små verdener
     ●   Facebook er det sandsynligvis også
 ●   Højest 6 led/kanter adskiller os mennesker
 ●   Analyse af PGP (1997):
     ●   http://bcn.boulder.co.us/~neal/pgpstat/

     ●   Gennemsnitlig korteste sti: 6.2
     ●   Maximale korteste sti: 21
     ●   Derek Atkins: 3.99 (laveste)
     ●   Poul-Henning Kamp: 5.21
2010-09-30                                 © 2010 Kenneth Geisshirt             14
Websider som graf
WWW kan ses som en orienteret
graf
 ●   Siderne er knuder
 ●   Links er kanterne – et link har
     retning
 ●   Nogle sider er vigtigere end
     andre:
      ●   Relevant i en søgning
      ●   Mange indgående kanter (mange
          links til siden)
2010-09-30                 © 2010 Kenneth Geisshirt   15
PageRank
 ●   Google bruger metoden PageRank
     ●   Andre søgemaskiner bruger lignende metoder
 ●   En sides vigtighed afhænger af
     ●   Vigtigheden af sider som linker til siden
     ●   Vigtigheden opskrives med vigtigheden fra de andre sider
     ●   Sider med mange links tæller ikke så meget
                                 V B VC
                            V A =  ⋯
                                 n B nC
●    Google bruger andre tricks for at undgå snyd
     ●   En del firmaer lever af Search Engine Optimization

2010-09-30                          © 2010 Kenneth Geisshirt          16
Få mere at vide
 ●   Alt om DATA, pp. 40-42, 12/2010
 ●   Grafteori af J. Carstensen. Systime, 1992.
 ●   Matematik 3F af J. Carstensen og J. Frandsen.
     Systime, 1986.
 ●   Mat A htx af A. Bohnstedt. Systime, 2009.
 ●   http://da.wikipedia.org/wiki/Grafteori
 ●   SocNetV: http://socnetv.sourceforge.net/


2010-09-30             © 2010 Kenneth Geisshirt          17
IT-Branchen
             http://choosedifferent.com

               Powerpraktik i uge 46


2010-09-30            © 2010 Kenneth Geisshirt   18

Más contenido relacionado

Más de Kenneth Geisshirt

Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboyKenneth Geisshirt
 
Tips and tricks for building high performance android apps using native code
Tips and tricks for building high performance android apps using native codeTips and tricks for building high performance android apps using native code
Tips and tricks for building high performance android apps using native codeKenneth Geisshirt
 
Is the database a solved problem?
Is the database a solved problem?Is the database a solved problem?
Is the database a solved problem?Kenneth Geisshirt
 
Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboyKenneth Geisshirt
 
Building High Performance Android Applications in Java and C++
Building High Performance Android Applications in Java and C++Building High Performance Android Applications in Java and C++
Building High Performance Android Applications in Java and C++Kenneth Geisshirt
 
Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboyKenneth Geisshirt
 
Naturvidenskabsfestival 2012
Naturvidenskabsfestival 2012Naturvidenskabsfestival 2012
Naturvidenskabsfestival 2012Kenneth Geisshirt
 
Hadoop - the data scientist's toolbox
Hadoop - the data scientist's toolboxHadoop - the data scientist's toolbox
Hadoop - the data scientist's toolboxKenneth Geisshirt
 
JavaScript/Emacs integration
JavaScript/Emacs integrationJavaScript/Emacs integration
JavaScript/Emacs integrationKenneth Geisshirt
 
Introduction to JavaScript for Modern Software Development
Introduction to JavaScript for Modern Software DevelopmentIntroduction to JavaScript for Modern Software Development
Introduction to JavaScript for Modern Software DevelopmentKenneth Geisshirt
 

Más de Kenneth Geisshirt (11)

Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboy
 
Tips and tricks for building high performance android apps using native code
Tips and tricks for building high performance android apps using native codeTips and tricks for building high performance android apps using native code
Tips and tricks for building high performance android apps using native code
 
Is the database a solved problem?
Is the database a solved problem?Is the database a solved problem?
Is the database a solved problem?
 
Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboy
 
Extending Node.js using C++
Extending Node.js using C++Extending Node.js using C++
Extending Node.js using C++
 
Building High Performance Android Applications in Java and C++
Building High Performance Android Applications in Java and C++Building High Performance Android Applications in Java and C++
Building High Performance Android Applications in Java and C++
 
Unleash your inner console cowboy
Unleash your inner console cowboyUnleash your inner console cowboy
Unleash your inner console cowboy
 
Naturvidenskabsfestival 2012
Naturvidenskabsfestival 2012Naturvidenskabsfestival 2012
Naturvidenskabsfestival 2012
 
Hadoop - the data scientist's toolbox
Hadoop - the data scientist's toolboxHadoop - the data scientist's toolbox
Hadoop - the data scientist's toolbox
 
JavaScript/Emacs integration
JavaScript/Emacs integrationJavaScript/Emacs integration
JavaScript/Emacs integration
 
Introduction to JavaScript for Modern Software Development
Introduction to JavaScript for Modern Software DevelopmentIntroduction to JavaScript for Modern Software Development
Introduction to JavaScript for Modern Software Development
 

Kendthed og vigtighed

  • 1. Kendthed og vigtighed Om søgemaskiner og sociale netværk Kenneth Geisshirt
  • 2. Agenda ● Om mig ● Baggrund ● Grafer ● Korteste sti ● Facebook, PGP og Kevin Bacon ● Small World ● Søgemaskiner 2010-09-30 © 2010 Kenneth Geisshirt 2
  • 3. Om mig ● Privat ● Gift med Pia ● To børn: Svea (6 år) og Svante (9 år) ● Uddannelse ● B.Sc. i kemi/datalogi (KU) ● cand.scient. i kemi (KU) ● Ph.d. i soft material science (RUC) ● Selvstændig/freelancer ● Software-udvikling ● Skribent (artikler, bøger) ● Underviser (kurser, teknisk skole) ● Rollemodel i IT-Branchen 2010-09-30 © 2010 Kenneth Geisshirt 3
  • 4. Lidt baggrund ● Venner på Facebook ● Mere end 50? ● Mere end 250? ● Mere end 500? ● Brug af Google ● Indenfor en uge? ● Sidste døgn? ● Her til morgen? 2010-09-30 © 2010 Kenneth Geisshirt 4
  • 5. Mere baggrund Thomas Ring Pedersen 1.340 hits Poul-Henning Kamp 50.400 hits Lars Løkke Rasmussen 320.000 hits 2010-09-30 © 2010 Kenneth Geisshirt 5
  • 6. Grafer En graf består af ● En række knuder (eng. nodes) ● Kanter/forbindelser (eng. edges) mellem knuderne ● Kanterne kan have vægt eller længde (1 hvis intet andet siges) ● Kanterne kan være orienteret ● En sti mellem to knuder ● 4 →5 →1 ● 4 →5 → 2 →1 ● 4 → 3→ 2 → 1 ● 4 → 3 →2 →5 →1 2010-09-30 © 2010 Kenneth Geisshirt 6
  • 7. Flere ord ● En knudes valens er antal kanter som går ud fra knuden ● Knude 4 har valens 3 ● En kreds eller cyklus er sti som ender hvor den begynder ● 2 →3 →4 →5 ● En graf er sammenhængende hvis er der findes mindst en sti mellem alle knuder ● En lukket Euler-tur er en cyklus som indeholder alle kanter én gang 2010-09-30 © 2010 Kenneth Geisshirt 7
  • 8. Anvendelse af grafer ● Optimering af vej/el/kloaknettet og computernetværk ● Farvelægning af kort ● Fire farver er nok ● Overvågningskameraer ● Mindste antal og bedste placering ● Korteste sti ● GPS i biler ● Dine venner, venners venner, venners venners … 2010-09-30 © 2010 Kenneth Geisshirt 8
  • 9. Gåtur over broer i Königsberg ● Opgave: er det muligt at komme hele byen rundt og kun passere broerne én gang? ● Svar: Nej! ● Argument: En lukket Euler-tur er kun mulig hvis og kun alle knuder har lige valens 2010-09-30 © 2010 Kenneth Geisshirt 9
  • 10. Korteste sti Udfordringen er at finde den korteste sti mellem to knuder ● Summen af kanternes vægt/længde skal være mindst muligt ● Anvendelser: ● Rejseplanen og bilnavigation ● E. Dijkstra udviklede første 4 →5 →1 (computer)metode i 1956 2010-09-30 © 2010 Kenneth Geisshirt 10
  • 11. Facebook som graf ● Personer er knuder ● Venskab er en kant ● Maximal valens er 2000 ● Grafen ændrer sig med tiden ● En sti angiver venners venners … ● http://www.touchgraph.net/ Vigtighed er laveste gennemsnitlige korteste sti Det er ikke antal venner 2010-09-30 © 2010 Kenneth Geisshirt 11
  • 12. Pretty Good Privacy ● PGP er et socialt netværk ● Udveksling af digital signatur til emails ● Personerne skal mødes ikke-virtuelt og viser billed-ID (kørekort, pas, etc.) ● Opbygger web of trust mellem brugerne ● Du kan angive en værdi for din tillid ● Og derved udregne tilliden til dine venners venner 2010-09-30 © 2010 Kenneth Geisshirt 12
  • 13. Kevin Bacon ● Enhver skuespiller er forbunden med Kevin Bacon gennem højest 6 led ● Som graf: ● Skuespillere er knuderne ● Filmene er kanterne ● Korteste sti til Kevin Bacon er højest 6 Foto: SAGIndie ● http://oracleofbacon.org/ Tomas Villum Jakob Cedergren 2010-09-30 © 2010 Kenneth Geisshirt Dianne Wiest 13
  • 14. Small World ● Small World fænomenet ● PGP og skuespillere lever i små verdener ● Facebook er det sandsynligvis også ● Højest 6 led/kanter adskiller os mennesker ● Analyse af PGP (1997): ● http://bcn.boulder.co.us/~neal/pgpstat/ ● Gennemsnitlig korteste sti: 6.2 ● Maximale korteste sti: 21 ● Derek Atkins: 3.99 (laveste) ● Poul-Henning Kamp: 5.21 2010-09-30 © 2010 Kenneth Geisshirt 14
  • 15. Websider som graf WWW kan ses som en orienteret graf ● Siderne er knuder ● Links er kanterne – et link har retning ● Nogle sider er vigtigere end andre: ● Relevant i en søgning ● Mange indgående kanter (mange links til siden) 2010-09-30 © 2010 Kenneth Geisshirt 15
  • 16. PageRank ● Google bruger metoden PageRank ● Andre søgemaskiner bruger lignende metoder ● En sides vigtighed afhænger af ● Vigtigheden af sider som linker til siden ● Vigtigheden opskrives med vigtigheden fra de andre sider ● Sider med mange links tæller ikke så meget V B VC V A =  ⋯ n B nC ● Google bruger andre tricks for at undgå snyd ● En del firmaer lever af Search Engine Optimization 2010-09-30 © 2010 Kenneth Geisshirt 16
  • 17. Få mere at vide ● Alt om DATA, pp. 40-42, 12/2010 ● Grafteori af J. Carstensen. Systime, 1992. ● Matematik 3F af J. Carstensen og J. Frandsen. Systime, 1986. ● Mat A htx af A. Bohnstedt. Systime, 2009. ● http://da.wikipedia.org/wiki/Grafteori ● SocNetV: http://socnetv.sourceforge.net/ 2010-09-30 © 2010 Kenneth Geisshirt 17
  • 18. IT-Branchen http://choosedifferent.com Powerpraktik i uge 46 2010-09-30 © 2010 Kenneth Geisshirt 18