구글

1장 구글의 탄생

구글을
기술
지탱하는

* Contents
• Task 2 Brand Image (conclusion)
1. Search Engine
검색 Back-end
2.
3. Crawling
4. Index
5. Search Server


* Search Engine is
• Search Server
Mange 이용자와의 통신
-
Judge 요청해석/처리내용
-
Edit and Send, for 보기 쉬운 결론
-
• Back – end
- Create Crawling & Index
• Index


* Search Engine Development
• Correct web page from world’s web
server
• Crawler
- URL server가 전체 Crawler 지휘


* 검색 Back-end
• • Crawler Image (conclusion)
Task 2 Brand
- Crawling ; 웹 페이지를 수집하는 기술
• Repository ; 임시저장소
• Creating Index ; Web page를 검색용 인
덱스로 만들어 내는 과정


* Crawling
• Think 이용자의 편의성
• Expand 하드웨어
• Rank 웹 페이지

Internet Repository Index
Crawler


* Index
• Save data
• Search 요청 받은 데이터
• Rank 특정한 키에 연관된 정보
-> 효율적 검색, 간결한 데이터 표현
• Express 문자열 by 숫자


* Index - Creating
• Task 2 BrandWeb page 구조
• Analyze Image (conclusion)
• Word Index
• Link Index
• Ranking Index


* Search Server
• Think 이용자의 편의성
• Expand 하드웨어
• Rank 웹 페이지
• Search 복잡한 문제


* Search Server
wordID를 역 Index에서
검색하여 docID List 가져옴
Barrels
Searc
검색요청
Lexico
h
User docID에 Ranking Function을 적용,
n 점수 높은 순으로 정렬

결과반환
Server
Ranking의 상위 docID각각에 대해
Web Page정보 추출
DocIndex


2장 구글의 공룡화

구글을
기술
지탱하는

* Contents
1. Internet을 검색하는 거대 System
2. 검색 Cluster
3. 진화된 Google의 Web 검색 절차
4. Google의 기본적인 사상


* Internet을 검색하는 거대 System
1. Expand System
Scale-up Scale-out
뛰어난 하드웨어 도입 하드웨어의 수 늘림
단순한 시스템 장비의 수 증가 가능
Strong
변경할 필요 없는 소프트웨어 비교적 저렴한 비용
point

비싼 가격(고성능 하드웨어) 처음부터 복수의 하드웨어로 소
Weak
프트웨어를 개발
point 잘못된 설계, 장비 수 늘려도 개
선되지 않음


* Internet을 검색하는 거대 System
• Task 2 Brand하나의 (conclusion)
2. Connect Image 시스템
-Rack
-Cluster
-Data Center
3. 검색 엔진 개량
- 검색서버의 대규모화
- 검색 back-end의 대규모화


* 검색 Cluster
• Treat 검색 by 복수의 서버 조합

• GWS(Google Web Server)
• LB(Load Balancer)
• Document Server


* 검색 Cluster
1. Join 근접한 데이터 센터


* 검색 Cluster
2. Disperse 부하를
LB
다수의 서버로
- GWS(Google Web Server) ;
각각의 검색 요청을 한 곳에
모으는 역할
GWS GWS GWS
- LB(Load Balancer)
부하가 가벼운 곳으로 일을 넘
김

Index Document
Server Server


* 진화된 Google의 Web 검색 절차
• Index Server
- Request shared cluster
- Rank Web Pages than 이전
• Document Server
- Send Web Page 내용 to 복수
shared


* 진화된 Google의 Web 검색 절차
• Task 2User 검색요청 Image (conclusion)
Brand
GWS
검색요구 to Index Server의
모든 shared cluster

GWS, 반환된 것 중 상위만 채택

Index Document
Server Server
docID로 정보요구 to Document Server

shared shared
shared shared
Html Page만들어 결과 출력 shared shared


* Google의 기본적인 사상
• Task 2 Brand Image신뢰성
1. 높은 Software (conclusion)
- Hardware의 고장에 유연한 대처
2. Disperse 부하, by Hardware 추가
- 분산 System으로 병목현상 방지
3. Choice 비용 대비 고성능 Hardware


구글

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (16)

Destacado

Destacado (20)

Más de zerk87

Más de zerk87 (20)

구글