3. 1. 웹보메트릭스란?
웹보메트릭스
• 월드와이드웹의 '웹'과 계량적 분석을 뜻하는 '메트릭(스)'를 합성하여
인터넷 정보와 디지털 기술의 사용방식을 계량적으로 분석한 연구방법.
• 웹기반 현상의 연구로 양적인 방법을 사용하고, 계량정보방법으로
그리는 것. (Björneborn and Ingwersen, 2004)
• 즉, 계량정보학의 방법들을 웹과 같은 가상공간에 적용한 것을 말함.
5. 2. 웹보메트릭스의 탄생
월드와이드웹(www)은
거시적 측면에서 집합체이자 미시적 측면에서 상호작용.
출처 - http://www.slideshare.net/Connecto/webometrics-10from-altavistato-small-worlds-and-genre-drift-presentation
6. 2. 웹보메트릭스의 탄생
가. 웹보메트릭스의 탄생
인용 분석
링크(hypertext, hyperlink) = 웹페이지의 암시된 또는 드러난 추천
하지만 또한 부정적 참조
’웹보메트릭스(Webometrics)’ + ‘웹영향지수(Web Impact Factor)’
Almind & Ingwersen(1997). 웰드와이드웹에서의 계량정보분석:
‘웹보메트릭스’ 방법론적 접근
Ingwersen(1998). 웹영향지수(Web Impact Factor)의 계산.
구글(google)’Page Rank’1998
링크구조의 개척: who receives many links from someone who also receives
many link from someone who also…?
7. 2. 웹보메트릭스의 탄생
나. 기본 링크 용어들
출처 - http://www.slideshare.net/Connecto/webometrics-10from-altavista-to-smallworlds-and-genre-drift-presentation
8. 2. 웹보메트릭스의 탄생
다. 여러 종류의 웹 메트릭스들
Netometrics (Bossy, 1995)
Webometry (Abraham, 1996)
Internetometrics (Almind & Ingwersen, 1996)
Webometrics (Almind & Ingwersen, 1997)
Cybermetrics (journal started 1997 by Isidro Aguillo)
Web bibliometry (Chakrabarti et al., 2002)
9. 2. 웹보메트릭스의 탄생
라. 웹 사이언스와 관련된 것들
Web Mining (e.g., Etzioni, 1996; Kosala & Blockeel, 2000)
Web Ecology (e.g., Pitkow, 1997; Chi et al., 1998; Huberman, 2001)
Cyber Geography (e.g., Girardin, 1995)
Cyber Cartography (e.g., Dodge, 1999)
Web Graph Analysis (e.g., Kleinberg et al., 1999; Broder et al., 2000)
Web Dynamics (e.g., Levene & Poulovassilis, 2001)
Webology (journal started 2004 by Alireza Noruzi)
Web Science (Berners-Lee et al., 2006)
10. 2. 웹보메트릭스의 탄생
마. 웹보메트릭스와 관련된 네 가지 주요 연구영역
웹 페이지 내용 분석
(web page content
analysis)
웹 링크 구조 분석
(web link structure
analysis)
웹 사용량 분석
(web usage analysis)
예: log files
웹 기술 분석
(web technology
analysis)
예: 서치엔진성능
11. 2. 웹보메트릭스의 탄생
바. 웹 데이터 수집
비표준화된, 지저분한 데이터
• 웹은 변화가 많고, 광범위하고, 역동적이기 때문
• 메타데이터(metadata)의 결여
주요한 데이터
• 자신의 웹 크롤러(crawler) *주의: 로봇 제외
• Log file을 포함한 웹서버에 직접 접근
• 인터넷 아카이브(Internet Archive) www.archive.org
• 브라우저에서 수동으로 수집
12. 2. 웹보메트릭스의 탄생
바. 웹 데이터 수집
부차적인 데이터
• 서치 엔진(search engines) *주의: 결함
(필요한)데이터 정제
• 미러 사이트(mirror sites), 다른 이름, 도메인과 링크의 오타
• 다양한 파일 포맷(format), 철자 오기 포함.
13. 3. 웹보메트릭스 분석의 예
가. 2012 세상을 바꿀 빅데이터 5 –과학동아
출처 - http://science.dongascience.com/articleviews/specialview?acIdx=11557&acCode=2&year=2014
16. 정리하기.
웹보메트릭스는 월드와이드웹의 '웹'과 계량적 분석을 뜻하는
'메트릭스'를 합성하여 인터넷 정보와 디지털 기술의 사용방식을
계량적으로 분석한 연구방법이다.
웹보메트릭스와 관련된 네가지 주요 연구영역은 웹 페이지 내용
분석(web page content analysis), 웹 링크 구조 분석(web link
structure analysis), 웹 사용량 분석(web usage analysis), 웹 기술
분석(web technology analysis)이다.