2. * Contents
• Task 2 Brand Image (conclusion)
1. Search Engine
검색 Back-end
2.
3. Crawling
4. Index
5. Search Server
1장 구글의 탄생
3. * Search Engine is
• Task 2 Brand Image (conclusion)
• Search Server
Mange 이용자와의 통신
-
Judge 요청해석/처리내용
-
Edit and Send, for 보기 쉬운 결론
-
• Back – end
- Create Crawling & Index
• Index
1장 구글의 탄생
4. * Search Engine Development
• Task 2 Brand Image (conclusion)
• Correct web page from world’s web
server
• Crawler
- URL server가 전체 Crawler 지휘
1장 구글의 탄생
5. * 검색 Back-end
• • Crawler Image (conclusion)
Task 2 Brand
- Crawling ; 웹 페이지를 수집하는 기술
• Repository ; 임시저장소
• Creating Index ; Web page를 검색용 인
덱스로 만들어 내는 과정
1장 구글의 탄생
6. * Crawling
• Think 이용자의 편의성
• Task 2 Brand Image (conclusion)
• Expand 하드웨어
• Rank 웹 페이지
Internet Repository Index
Crawler
1장 구글의 탄생
7. * Index
• Task 2 Brand Image (conclusion)
• Save data
• Search 요청 받은 데이터
• Rank 특정한 키에 연관된 정보
-> 효율적 검색, 간결한 데이터 표현
• Express 문자열 by 숫자
1장 구글의 탄생
8. * Index - Creating
• Task 2 BrandWeb page 구조
• Analyze Image (conclusion)
• Word Index
• Link Index
• Ranking Index
1장 구글의 탄생
9. * Search Server
• Think 이용자의 편의성
• Task 2 Brand Image (conclusion)
• Expand 하드웨어
• Rank 웹 페이지
• Search 복잡한 문제
1장 구글의 탄생
10. * Search Server
• Task 2 Brand Image (conclusion)
wordID를 역 Index에서
검색하여 docID List 가져옴
Barrels
Searc
검색요청
Lexico
h
User docID에 Ranking Function을 적용,
n 점수 높은 순으로 정렬
결과반환
Server
Ranking의 상위 docID각각에 대해
Web Page정보 추출
DocIndex
1장 구글의 탄생
12. * Contents
1. Internet을 검색하는 거대 System
• Task 2 Brand Image (conclusion)
2. 검색 Cluster
3. 진화된 Google의 Web 검색 절차
4. Google의 기본적인 사상
2장 구글의 공룡화
13. * Internet을 검색하는 거대 System
• Task 2 Brand Image (conclusion)
1. Expand System
Scale-up Scale-out
뛰어난 하드웨어 도입 하드웨어의 수 늘림
단순한 시스템 장비의 수 증가 가능
Strong
변경할 필요 없는 소프트웨어 비교적 저렴한 비용
point
비싼 가격(고성능 하드웨어) 처음부터 복수의 하드웨어로 소
Weak
프트웨어를 개발
point 잘못된 설계, 장비 수 늘려도 개
선되지 않음
2장 구글의 공룡화
14. * Internet을 검색하는 거대 System
• Task 2 Brand하나의 (conclusion)
2. Connect Image 시스템
-Rack
-Cluster
-Data Center
3. 검색 엔진 개량
- 검색서버의 대규모화
- 검색 back-end의 대규모화
2장 구글의 공룡화
15. * 검색 Cluster
• Treat 검색 by 복수의 서버 조합
• Task 2 Brand Image (conclusion)
• GWS(Google Web Server)
• LB(Load Balancer)
• Document Server
2장 구글의 공룡화
16. * 검색 Cluster
1. Join 근접한 데이터 센터
• Task 2 Brand Image (conclusion)
2장 구글의 공룡화
17. * 검색 Cluster
2. Disperse 부하를
• Task 2 Brand Image (conclusion)
LB
다수의 서버로
- GWS(Google Web Server) ;
각각의 검색 요청을 한 곳에
모으는 역할
GWS GWS GWS
- LB(Load Balancer)
부하가 가벼운 곳으로 일을 넘
김
Index Document
Server Server
2장 구글의 공룡화
18. * 진화된 Google의 Web 검색 절차
• Task 2 Brand Image (conclusion)
• Index Server
- Request shared cluster
- Rank Web Pages than 이전
• Document Server
- Send Web Page 내용 to 복수
shared
2장 구글의 공룡화
19. * 진화된 Google의 Web 검색 절차
• Task 2User 검색요청 Image (conclusion)
Brand
GWS
검색요구 to Index Server의
모든 shared cluster
GWS, 반환된 것 중 상위만 채택
Index Document
Server Server
docID로 정보요구 to Document Server
shared shared
shared shared
Html Page만들어 결과 출력 shared shared
2장 구글의 공룡화
20. * Google의 기본적인 사상
• Task 2 Brand Image신뢰성
1. 높은 Software (conclusion)
- Hardware의 고장에 유연한 대처
2. Disperse 부하, by Hardware 추가
- 분산 System으로 병목현상 방지
3. Choice 비용 대비 고성능 Hardware
2장 구글의 공룡화