3. 1. SCI의 고안과 실현
• 초기 웰치 의학도서관 색인 프로젝트에
합류하면서 정보학 분야에 발을 내딛음.
가필드
로베르토 부사
신부
(Roberto Busa)
• 문헌의 색인을 자동화하는데 컴퓨터를 사용할 수
있을지에 대한 여부와 가능하다면 어떻게
가능한지에 대한 고찰.
• 1940년 IBM 계산기에 펀치카드를 작성하여 성
토마스 아퀴나스(St. Thomas Acuinas)의 전집
색인을 작성함
4. 1. SCI의 고안과 실현
출처: http://www.answers.com/topic/punch-card
• 컴퓨터를 통해 자동색인과 자동 번역 시스템을 구축하려고 하였지만 여러 가지
어려움을 겪고 있었음.
• 통계적으로 한번이라도 색인어가 위치했으며 가장 접근하기 좋은 지점에서
색인어를 자동으로 추출하는 것.
• 웰치 프로젝트 팀이 선호했던 방식으로 처리시간과 비용 측면에서 많은 강점을
지녔지만 제목과 초록에는 적당하지 않음
5. 1. SCI의 고안과 실현
자동색인의 해법으로 가필드의 연구에 대한 영향
㉠ 언어와 구조
반복 가능한 순차적 연산을 이용하여 과학적 언어가 가진 복잡성을
기초적 구성요소 수준으로 축소시키고자 한 초기노력을 담음
학술 논문에 내재된 다양한 주제가 이 논문이 인용한 다른 논문에
따라 달라진다면 기본적으로 예측 불가능한 텍스트 생성과정을
상대적으로 더 예측가능하며 인용 생성을 지배하는 규칙으로
교체함으로써 과학 문헌을 알고리즘으로 효과적으로 색인 할 수
있다는 것임.
6. 1. SCI의 고안과 실현
자동색인의 해법으로 가필드의 연구에 대한 영향
㉡ 인용정보와 텍스트 분석 통합
순열주제색인(PSI)Permuterm Subject Index: 논문 제목(title)에서
추출한 주제를 이용함
키워드 핵심구문 주제색인(KWPSI) Keywords/Phrase Subject Index:
논문의 제목을 비롯해 키워드, 주제어, 주제명 등에서 추출한 단어와
어구를을 이용함
㉢ 메타텍스트
거의 모든 문장에 참고문헌을 달며, 이 문장의 주요 기능은 인용한
문헌의 개념적 내용을 보통과는 달리 결정적 색인문으로 소개하고
부분적으로 예측하는 것.
7. 1. SCI의 고안과 실현
• 문맥상 인용색인은 과학적 언어가 가진 복잡성을 다룰 수 있을 정도로
작은 단위로 축소시키고 이용자가 인용 네트워크를 앞뒤로 이동할 수
있음을 강조함으로써 인용색인을 수면 아래에 있는 구조 언어학
패러다임과 연결하고, 사회학과 정치학에서 인용색인에 있는 서지정보를
특별하게 이용하는 것과 연결.
• SCI는 상징적인 힘을 얻게 됨
• 노벨상 급 과학자들의 논문은 피인용 횟수가 높음
• 1972 SSCI
• 1978 A&HCI
• Web of Science & Current Contents ISI Web of Knowledge
8. 2. “다문학적”연구: 정보검색 도구로서 SCI
SCI의 초기 인쇄형 출판물이
가진 기본 구조
SCI
전자형, 온라인 형으로 전환
출처색인, 인용색인, 순열주제색인 키워드
플러스의 3개 파일로 구성되며 그 외 파일들에는
특허인용색인, 기관명색인 등이 있음.
1960년대 중반 이후
마이어 케슬러
(Myer Kessler)
• 서지결합법 (Bibliographical Coupling) :
하나이상의 참고문헌을 공유하는 논문 사이를
간접적으로 연결함으로써 이들 논문 주제가 서로
밀접하게 유사하다는 실증적 증거를 최초로 제시.
Co-outlinking concept
9. 2. “다문학적”연구: 정보검색 도구로서 SCI
제라드 솔턴(Gerard
• SMART 검색시스템에 인용이 추가되었을 때 얻을
Salton) & 마이클
수 있는 잠재적 가치를 경험
레스크(Michael Lesk)
스티븐스(M.E.S
tevens)와
어번(G.H.Urban)
그레이(W.A.Gra
y)와
할리(A.J.Harley
)
• SADSACT 자동 시스템에서 색인 작업을 수행하여
인용 데이터 품질 상향
• 인용 연관성에 의해 유지되는 MEDLARS레코드에
대해 컴퓨터를 이용해 색인하는 실험
• 1980년대 SCI의 온라인 접근 가능
• 인용정보와 키워드를 함께 사용하면 정보검색 시스템의 성능을
향상시킬 수 있음.
10. 2. “다문학적”연구: 정보검색 도구로서 SCI
가. 출처색인
• 형태와 연도에 있어서 그 깊이가 제한됨
• ISI 학술지 선정 정책을 충족시키는 핵심 학술지에 발표된
논문만을 포함
나. 인용색인
• 광범위하여 문헌의 형태 또는 발행일을 기준으로 문헌을 제한하지
않음
• 대다수 문헌이 그 이전 년도에 발표되었으며, 인용링크를 통해
과거 문헌과 연결
11. 2. “다문학적”연구: 정보검색 도구로서 SCI
다. 순열주제색인
• 논문 제목의 단어를 가능한 모두 순열하여 활용
• 어빙셔는 키워드 플러스라는 시스템을 개발
• 참고문헌의 제목에 출현하는 추가 용어를 이용하여 논문 색인
레코드의 품질 향상
12. 2. “다문학적”연구: 정보검색 도구로서 SCI
라. 키워드 검색
• 단순하면서도 가장 좋은 출발점
• 중요한 문헌을 식별하고 인용색인에서 이 레코드를 찾으면 이
문헌을 인용하고 있는 논문 리스트에 즉각 접근할 수 있음..
• 인용색인은 키워드 검색 시스템이나 주제 검색 시스템에서 흔히
다량의 작업을 필요로 하는 탐색 전략을 더 쉽게 작성.
13. 2. “다문학적”연구: 정보검색 도구로서 SCI
탐색
1. 방법론 탐색
전통적인 주제 색인에서 나타나지 않는 특수한 방법론적 기법을
언급하기 위해 문헌을 언급
2. 후속 또는 “최신”탐색
문헌 전체에 나타난 개념이나 기법의 변형을 추적하고자 할 때
3. 다문학적 그리고 학제적 탐색
전통적인 경계를 넘어 주제간 연계
4. 유사도 탐색
두 개 이상의 참고문헌을 공유하는 문헌
두 개 이상의 참고문헌에서 인용하는 문헌
14. QUIZ.
1940년 IBM 계산기에 펀치카드를 작성하여 성 토마스 아퀴나스(St. Thomas
Acuinas)의 전집 색인을 작성한 인물은?
로베르토 부사 신부(Roberto Busa)
15. 정리하기.
가필드는 초기 웰치 의학도서관 색인 프로젝트에 합류하면서 정보학
분야에 발을 내딛고, 문헌의 색인을 자동화하는데 컴퓨터를 사용할 수
있을지에 대한 여부와 가능하다면 어떻게 가능한지에 대한 고찰을
하였다.
문맥상 인용색인은 과학적 언어가 가진 복잡성을 다룰 수 있을 정도로
작은 단위로 축소시키고 이용자가 인용 네트워크를 앞뒤로 이동할 수
있음을 강조함으로써 인용색인을 수면 아래에 있는 구조 언어학
패러다임과 연결하고, 사회학과 정치학에서 인용색인에 있는
서지정보를 특별하게 이용하는 것과 연결되어 있다.
SCI의 초기 인쇄형 출판물이 가진 기본 구조는 전자형, 온라인 형으로
전환되었으며, SCI는 출처색인, 인용색인, 순열주제색인 키워드
플러스의 3개 파일로 구성되며 그 외 파일들에는 특허인용색인,
기관명 색인 등이 있다.