1. węzełki.pl
Wyszukiwanie, Przeglądanie i
Współdzielenie Informacji z Wykorzystaniem
Technologii Semantycznych i Społecznych
Sebastian R. Kruk, Adam Gzella,
Arkadiusz Kwoska, Mariusz Cygan
Copyright @ KnowledgeHives.com
2. Dlaczego Google i tagowanie za mało?
Społeczeństwo a semantyka - “jajo i kura” ?
węzełki.pl
Copyright @ KnowledgeHives.com
2
3. Wyszukiwanie, tak ale ...
Szukanie: “Kruk”
Google:
3,030,000 stron
brak informacji o ptaku na pierwszej stronie
moja strona w DERI - 5 pozycja (3 po włączeniu profilu)
Yahoo!
5,370,000 stron
link do wieloznaczeniowej strony w Wikipedii - 6 pozycja
brak informacji o ptaku na pierwszej stronie
brak linku do mnie na pierwszej stronie
I co dalej? ... podaj dodatkowe słowo, np.: “ptak”
Copyright @ KnowledgeHives.com
3
4. Czego brakuje ?
podpowiedzi możliwych znaczeń
jest tylko podpowiedź prawdopodobnych rozszerzeń
zapytania, ale
możliwości szybkiego odfiltrowania stron do max
50 (?) rezultatów
pewności, że ...
ważny wynik nie jest gdzieś daleko na liście wyników, albo
że nie ma go w ogóle
ktoś nie miesza reklam z wynikami, tzn. mogę jasno
powiedzieć co jest reklamą a co nie
Copyright @ KnowledgeHives.com
4
5. Tagowanie - tak ...
Wykorzystanie społeczności do opisywania
rzeczywistości
Kilkanaście tagów to lepiej niż indeks
pełnotekstowy
Możemy mieszać tagi z opisami semantycznymi
Copyright @ KnowledgeHives.com
5
6. Tagowanie - tak, ale ...
Znaczenie tagów jest znane tylko nam lub naszym
“znajomym”, ale nie jest globalne
Ilość tagów rośnie w czasie - a popularne
narzędzia wizualizacji (Tag Clouds) i zarządzania
tagami nie są na to gotowe
Tagi mają znaczenie tylko w danym serwisie
jak szukać własnych tagów na przekroju różnych
serwisów? (ewentualnie: Tag-o-matic, int.ere.st)
czy jest Google dla tagów? (częściowio: Technorati)
Copyright @ KnowledgeHives.com
6
7. Dlaczego Google i tagowanie to za mało?
Społeczeństwo a semantyka - “jajo i kura” ?
węzełki.pl
Copyright @ KnowledgeHives.com
7
8. Semantyka jest trudna ?
“Tagi są użyteczne, ... bo są proste” i co dalej ?
Jak ułatwić semantyczny opis?
semantyczne tagowanie: Flickr machine tags
wykorzystanie słowników: taksonomie, tezaurusy
zachęcanie do bardziej złożonych opisów (Aparicio)
Nie twórz semantyki - znajdź ją
Google tylko wykorzystuje linki pomiędzy stronami
Czas na wykorzystanie istniejącej informacji - dokumenty,
bazy danych, interakcja (Sindice, Freebase)
Copyright @ KnowledgeHives.com
8
9. Mamy semantykę, i ?
Obecne metody wyszukiwania raczej się nie
nadają:
po słowach kluczowych - stały by się za skomplikowane
chmury tagów (Tag Clouds) - jak wyrazić powiązania?
nawigacja fasetowa (faceted navigation) - wymaga
operacji na nieustalonym schemacie
Rozwiązanie: wykorzystaj znajomych do pomocy:
społeczne filtrowanie (Collaborative Filtering)
społeczne przeglądanie (Collaborative Browsing)
Copyright @ KnowledgeHives.com
9
10. Social Semantic Collaborative Filtering
Dlaczego?
Ostateczne rozwiązanie pozyskiwania wiedzy: nieformalna
komunikacja (“word of mouth”)
Jak?
Każdy klasyfikuje (filtruje) informacje w katalogach z zakładkami:
prywatne taksonomie
Katalogi opisywane są pojęciami ze zdefiniowanych słowników
Znajomi dzielą się katalogami tworząc społeczne taksonomie
System rekomenduje katalogi od dalszych znajomych (poza
horyzontem sieci społecznej)
Wynik?
Wiedza przepływa od eksperta dziedzinowego przez sieć
społeczna do danego użytkownika
System gromadzi informację kontekstową o danym użytkowniku,
np.: w celu poprawy wyników wyszukiwania
Copyright @ KnowledgeHives.com
10
11. Social Semantic Collaborative Filtering
TAG 3
Katalogi opisane Słowo A
semantycznie Słowo B
Zasób R1
Taksonomie
TAG 2
Słowa kluczowe Katalog Temat A
Zasób R2
Zasób R3
TAG 1
Tagowane zasoby
TAG 2
Rekomendacje na podstawie silnik
wnioskujący
profilu użytkownika
(program w Prologu) Zasób R3
Zasób R2
Copyright @ KnowledgeHives.com
11
12. Social Semantic Collaborative Filtering
FOAF:KNOWS
SSCF:INCLUDE
SSCF:RECOMMEND
SSCF:BOOKMARK
Data Mining Wnioskowanie Wprowadzenie
dla Opornych w OWL-DL do RDF
Copyright @ KnowledgeHives.com
12
13. MultiBeeBrowse - Przeglądanie Grafu RDF
Wyszukiwanie nie powinno kończyć się jedynie
długą listą wyników
Wyniki nie są listą zasobów ale grafem
powiązanych pojęć
A co jeśli zgubimy się w hiperprzestrzeni ? („Lost
in hyperspace”)
Potrzeba niezależnego API serwisów do
przeglądania, wyszukiwania, i filtrowania
Dzielenie się doświadczeniem w
przeglądaniu - społeczna nawigacja
(collaborative browsing)
Copyright @ KnowledgeHives.com
13
14. Społeczna Nawigacja
(Collaborative Browsing)
Dziś ludzie dzielą się zdjęciami, muzyką, linkami,
itp. - dlaczego nie zapytaniami?
Społeczna nawigacja umożliwia dzielenie się
doświadczeniem w konstruowaniu
skomplikowanych zapytań i interakcji
bazuje na komponencie do Social Semantic Collaborative
Filtering
użytkownicy mogą tagować swoje zapytania
nasi znajomi mogą nam pomóc w poprawieniu
zapytań którymi się z nimi dzielimy
Copyright @ KnowledgeHives.com
14
15. Kontekst Przeglądania
Problemy z typową nawigacją
Odnajdywanie informacji
Wielokrotne poprawianie zapytania (interakcja przód-tył)
Przegląd obecnego kontekstu interakcji z systemem
Odnajdywanie poprzednich zapytań
4 widoki:
Prosty widok
Widok historii ostatnich operacji
Graf ostatniej sesji przeglądania
Pełna historia interakcji z systemem
Copyright @ KnowledgeHives.com
15
16. Dlaczego Google i tagowanie to za mało?
Społeczeństwo a semantyka - “jajo i kura” ?
węzełki.pl
Copyright @ KnowledgeHives.com
16
17. Semantyczny serwis społecznościowy
Słowniki i opis semantyczny dodatkiem do
tagowania
Znajomi dzielą się wiedzą a nie tylko tagują
wspólne repozytorium zasobów
Rekomendacje oparte na znaczeniu informacji
Koniec silosów - wymiana informacji poza
systemami
Copyright @ KnowledgeHives.com
17
18. węzełki.pl
Pierwszy polski semantyczny serwis
społecznościowy
Rozszerzenie digi.me-core:
obecnie w fazie beta 1 (beta 2 wkrótce)
współdzielenie zakładek ze znajomymi (SSCF)
licencja open source AGPL
Dodatkowe komponenty:
zbieranie semantyki o dodanej stronie
automatyczna klasyfikacja zakładek
semantyczne rekomendacje
synchronizacja z innymi serwisami społecznymi
Copyright @ KnowledgeHives.com
18