SlideShare una empresa de Scribd logo
1 de 29
Descargar para leer sin conexión
2010년 11월 24일
  탑쿼드란트 코리아 전략팀 추윤미
      ymchu@topquadrant.co.kr
홈페이지 : http://www.topquadrant.co.kr
 블로그 : http://blog.topquadrant.co.kr
목차

• 생명의학 분야의 R&D 환경 변화
• 제약 산업과 ICT
• 시맨틱 웹과 링크드 데이터
• LODD(Linked Open Drug Data)
     개요
     Competitive Intelligence Use Case
     기대효과

• 결론
생명의학 분야의 R&D 환경 변화


새로운 개념의 치료(therapy)에 대한 요구
– 개인 맞춤형 치료
– 질병의 조기 진단
– 질병의 치료 뿐만 아니라 예방, 노화 등에 관한 관심 증가
– Safty & efficacy(약품의 안전성, side effect, 효과 등에 대한
  정보 요구)


생명의학 분야
– Multidisciplinary
– 의학, 생물학, 약학, 유전 공학 등의 다양한 정보 증가
제약 산업과 ICT
정보 기술(ICT)의 발전
 – 데이터의 폭발적 증가
    • 실험 데이터, 환자 기록, 임상 실험, 유전자        DB ...
 – Knowledge Management
    • 다양한 정보를 가공함으로써 새로운 지식 창출이 가능
 – 연구 방법의 변화
    • Multidisciplinary – 학제간 연구의 증가
    • collaboration – 협업 연구의 증가
    • data 중심의 새로운 연구 방법
-> 혁신의 열쇠가 “정보”에 있음
 – 다양한 분야에서 생성되는 정보를 장벽 없이 접근하고 통합
   함으로써 새로운 지식을 생성
Information Interoperability
신약 개발을 위한 비즈니스 모델에 내부 정보 뿐만 아니라 외부
의 정보도 필요함
– Clinical Trials + Clinical Research(experiments) +
 Biomedical literature + electronic health records...
– + geographical data, medical vocabulary...
내, 외부의 정보를 통합하기 위한 정보 간의 상호운용성
(interoperability) 에 대한 요구 대두




   source : Mats Sundgren , “New needs for interoperability in
   Clinical Research” , AstraZeneca, health conference 2010
시맨틱 웹

 “The Semantic Web is a vision: the idea of having data on the
 Web defined and linked in a way that it can be used by machines
 not just for display purposes, but for automation, integration and
 reuse of data across various applications.[W3C 2001] ”




                                                  데이터의 웹



2010-12-07
시맨틱 웹


시맨틱 웹은 상호운용성에 관한 기술
– 시맨틱 웹 표준인 RDF(Resource Description Framework)
  로 데이터를 표현함으로써 이질적인 정보 간의 통합이 가능
지식 교환을 위한 표준과 아키텍처
– RDFS, OWL, SKOS(Simple Knowledge Organization
  System), FOAF(Friends of a Friend), etc...
– Sparql 질의 언어를 이용한 분산된 정보에 대한 통합 질의
– URI(Uniform Resource Identifier)를 이용한 웹에서의 정보
  접근
– Linked Data
RDF - 데이터 모델

RDF(Resource Description Framework)

              create
 마이크 샌델                  정의란 무엇인가




 subject    predicate      object



               트리플
              (Triple)
시맨틱 웹- integration




graph representation using RDF data model




                                            Source: Ivan Herman
SPARQL as a Unifying Source

                    Application

     Sparql query                 return data

                SPARQL Engine




DB   X     DB        X       DB         X       DB



                                                Source: Ivan Herman
시맨틱 웹 – Linked Data
          Data Silos on the Web




        Image: Bob Jagensdorf, http://flickr.com/photos/darwinbell/,
        CC-BY


 Many common things are represented in multiple data sets
 Linking identifiers connects these data sets
 Linked data opens the doors of the silos
Linked Data

   Tim Berners-Lee, “Linked Data- Design Issues(2006)”,
   http://www.w3.org/DesignIssues/LinkedData.html
1. Use URIs as names for things
2. Use HTTP URIs so that people can look up those names
3. When someone looks up a URI, provide useful RDF Information
4. Include RDF statements that link to other URIs so that they can discover
    related things




    Linked data는 웹 상의 데이터들에 URI를 이용해 이름을 붙이고,
   RDF로 데이터를 기술할 뿐만 아니라 데이터 간의 관계를 부여하여
  HTTP를 통해 웹으로 발행함으로써 데이터가 인간 뿐만 아니라 기계에
              의해 사용되고 이해될 수 있도록 하는 방법
Linked Data – RDF Data Link


  Linked Data                Linked Data                    Search
    Browsers                   Mashups                      Engines




Thing            Thing            Thing            Thing                 Thing


Thing            Thing            Thing            Thing                 Thing

        typed            typed            typed               typed
         links            links            links               links


  A               B                C                  D                    E


                                            참고 : Chris Bizer / The Emerging Web of Linked Data
W3C – Linking Open Data Project
W3C SWEO Community (Semantic Web Education & Outreach Interest Group)
 다양한 공개 데이터 셋을 RDF형태로 웹에 퍼블리싱하여, 다양한 데이터 소스 간의
   RDF 링크를 설정함으로써, 공유 데이터(data common)를 통해 웹을 확장하고자 하는
   목적




        Over 500 million RDF triples
        Around 120,000 RDF links between data sources
LOD Cloud – 2008. 2
LOD Cloud – 2009. 7

                      July 2009
LOD Cloud – 2010. 9




2010-12-07
LOD Cloud – Life Science 분야
제약 분야 Linked Data 사례 – LODD




Linking Open Drug Data(LODD)
– Health Care와 Life Science 분야, 특히 Drug에 관련된 정보의 링크드 데이터
  셋 구축
– 이미 구축되어 있는 clinical practice(LinkedCT), disease, gene 관련 Linked
  Data 데이터 셋과 링크를 통해 연계
목적
– Drug Discovery, drug development, 그리고 clinical practice 분야의 데이터
  들을 통합함으로써 제약업체에 맞춤형의 약품 개발이 가능하도록 전문적인
  정보를 제공
제약 분야 Linked Data 사례 – LODD
The Linked Clinical Trials(LinkedCT)
 – 미국 NIH에서 제공되는 158개국의 임상실험에 관한 레지스트리
    • http://linkedct.org
    • 6만 건 이상의 임상실험 보유
DrugBank
 – FDA 승인을 받은 5000개 이상의small molecule과 biotech drugs에 관한 레파
   지토리
     • http://www4.wiwiss.fu-berlin.de/drugbank/drugbank
Diseasome
 – 4300 여 가지의 disorders와 disease genes, 그리고 이들간의 관계에 관한 정보
   (from OMIM:The Online Mendelian Inheritance in Man)
      • http://www4.wiwiss.fu-berlin.de/diseasome
DailyMed
 – NLM에 의해 발행되는 시판되는 약품에 대한 정보
 – high quality information
     • 약품의 화학구조에 관한 일반적인 백그라운드, 효과의 메카니즘, 사용방법, 부작용, 복
       용제한조건, 경고, 이상반응 등에 관한 정보를 포함
     • http://www4.wiwiss.fu-berlin.de/dailymed/
Competitive Intelligence Use Case
어떤 비즈니스 매니저가 알츠하이머에 관한 새로운 임상실험결과를 찾음
– 임상실험 결과 및 관련 약품 정보와 지리정보를 통합함으로써 -> 앞으로의 세
  일즈 예측과 새로운 제약에 대한 요구 파악
– 시맨틱 웹 브라우저를 통해 LinkedCT에서 AD에 관련한 모든 임상실험과 관련
  약품검색
   1) Pfizer의 Varenicline이라 불리는 약품 검색
      http://data.linkedct.org/resource/trials/NCT00744978
   2) 이 약품에 대한 더 많은 정보를 찾고 싶음
        http://dbpedia.org/resource/Varenicline
        http://www4.wiwiss.fu-berlin.de/drugbank/resource/drugs/DB01273
   3)   데이터의 링크를 따라 DailyMed에 있는 데이터를 통해 이 약품이 이미 nicotine
        addiction 치료를 위해 시장에 나와있음을 찾음
   4)   데이터를 스크롤하여 이 약품이 이미 시장에 나와있으므로 부작용에 관한 정보를
        얻을 수 있음.
   5)   임상실험 (LinkedCT) 을 통해 검증된 일반적인 복용량에 관한 정보도 얻을 수 있어
        안전성에 관한 데이터도 확보됨
Competitive Intelligence Use Case

– 왜 nicotine addiction 약품이 AD(Alzheimer’s Disease)에도 효과가 있는지 찾
  고 싶어짐
   6)   DrugBank의 링크를 따라 Varenicline이 alpha-4와 beta-2 neuronal nicotinic
        acetylcholine receptor agonist임을 알 수 있음
   7)   그러나 Desiasome은 관련된 유전자가 AD보다는 nicotine addiction에만 중요함
        을 알려줌
   8)   Diseasome은 이 질병들 간의 더욱 복잡한 관계가 존재함을 알려줌
   9)   SWAN 지식베이스(http://hypothesis.alzforum.org/swan)로 브라우징을 확장하면
        AD가 nicotinic receptors와 관계가 있다는 가설을 검색 임상실험 (LinkedCT) 을
        통해 검증된 일반적인 복용량에 관한 정보도 얻을 수 있어 안전성에 관한 데이터도
        확보됨
USE CASE 분석을 통한 기대효과

관련된 데이터를 통합적인 view로 브라우징 함
 – Linked Data 접근 방법을 통해서
    •기업, 임상실험, 약품, 질병과 유전적 변형간의 관계된 데이터를 브
     라우징할 수 있으며,
    •이를 통해 부가적인 데이터를 접근할 수 있고,
    •전체적으로 이형의 데이터의 정보들을 서로 연결(interlinking)함으
     로써 얻고자 하는 정보를 더 구체화 할 수 있으며,
    •관련 지식에 대한 탐험(exploring)을 통해 의사결정에 도움을 받음

외부의 Knowledge Base를 이용한 새로운 Innovation
 – Internal Information과 External Information의 통합을 통해
    •DailyMed, LinkedCT, DrugBank와 같은 신뢰성 있는 정보와 내부의
     정보를 융합, 새로운 지식의 창출이 가능
신약 개발을 위한 혁신의 요구
Open Innovation
 – 기업 외부로부터의 R&D Sourcing
     •requires data standards to enable rapid data integration
Data Requirements for Clinical Trials
 – 데이터의 상호 교환을 위한 표준 기반의 데이터 유통
     •all the different departments, regulators and partners h
      ave to look at data in the same way
     •standards applicable across any enterprise within the Bi
      oPharma business
신약 개발을 위한 정보전략
                              LODD,
      LOD                  BioRDF, etc
    (DBPedia,               from Life
  Geo-data, etc              Science
   from other                domain)
    domains)

                                   external


Linked Data 기술 기반의 Information Interoperability

                                    internal


                                Patient Scientific Data
               Internal                                   heterogeneous
             Information          Research Reports
                                                          Information
                                different vocabularies
탑쿼드란트 코리아의 Linked Data 보유 기술
결론

신약 개발을 위한 혁신의 Key Capability
– 다양한 정보를 접근, 통합하고 새로운 지식으로 가공하기 위
  한 기술
– 다양한 내부, 외부의 정보를 자유롭게 유통할 수 있는 표준
  기반의 데이터 유통 체계가 필요
시맨틱 웹 기술
– 자유로운 정보 유통과 통합을 위한 열쇠
Linked Data를 이용한 신약 개발
– 표준 기반의 데이터 생성 및 유통을 통해
– LOD(특히, LODD) 데이터와의 융, 복합으로
– 혁신적인 제품 개발 가능
탑쿼드란트 코리아 전략팀 추윤미
      ymchu@topquadrant.co.kr
홈페이지 : http://www.topquadrant.co.kr
 블로그 : http://blog.topquadrant.co.kr

Más contenido relacionado

La actualidad más candente

D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동Suntae Kim
 
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)NDSL 아이디어 공모전 임보람(포항공과대학교 사서)
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)Boram Lim
 
LOD (linked open data) part 2 lod 구축과 현황
LOD (linked open data) part 2   lod 구축과 현황LOD (linked open data) part 2   lod 구축과 현황
LOD (linked open data) part 2 lod 구축과 현황LiST Inc
 
20140602 module2 presentation bm
20140602 module2 presentation bm20140602 module2 presentation bm
20140602 module2 presentation bmweowoonbae
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data AnalyticsDaemin Park
 
공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?Myungjin Lee
 
문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용LiST Inc
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked dataymchu88
 
인터링킹, InterLinking, LOD
인터링킹, InterLinking, LOD인터링킹, InterLinking, LOD
인터링킹, InterLinking, LOD경욱 이
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
News Big Data Analytics 101
News Big Data Analytics 101News Big Data Analytics 101
News Big Data Analytics 101Daemin Park
 

La actualidad más candente (13)

D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
D bguide 데이터 기반 연구 패러다임(2회)_데이터 과학과 오픈 사이언스 운동
 
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)NDSL 아이디어 공모전 임보람(포항공과대학교 사서)
NDSL 아이디어 공모전 임보람(포항공과대학교 사서)
 
LOD (linked open data) part 2 lod 구축과 현황
LOD (linked open data) part 2   lod 구축과 현황LOD (linked open data) part 2   lod 구축과 현황
LOD (linked open data) part 2 lod 구축과 현황
 
20140602 module2 presentation bm
20140602 module2 presentation bm20140602 module2 presentation bm
20140602 module2 presentation bm
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data Analytics
 
공공데이터, 현재 우리는?
공공데이터, 현재 우리는?공공데이터, 현재 우리는?
공공데이터, 현재 우리는?
 
digital archiving
digital archivingdigital archiving
digital archiving
 
문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용문화유산 정보와 시맨틱웹 응용
문화유산 정보와 시맨틱웹 응용
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
Statistics and linked data
Statistics and linked dataStatistics and linked data
Statistics and linked data
 
인터링킹, InterLinking, LOD
인터링킹, InterLinking, LOD인터링킹, InterLinking, LOD
인터링킹, InterLinking, LOD
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
News Big Data Analytics 101
News Big Data Analytics 101News Big Data Analytics 101
News Big Data Analytics 101
 

Destacado

Destacado (7)

The Third WordPress
The Third WordPressThe Third WordPress
The Third WordPress
 
도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]도서관과 링크드데이터[TQK]
도서관과 링크드데이터[TQK]
 
The Third WordPress
The Third WordPressThe Third WordPress
The Third WordPress
 
Web Presence
Web PresenceWeb Presence
Web Presence
 
Developing formultisite
Developing formultisiteDeveloping formultisite
Developing formultisite
 
The Third WordPress
The Third WordPressThe Third WordPress
The Third WordPress
 
library linked data
library linked datalibrary linked data
library linked data
 

Similar a Pharmaceutical Industry and Linked Data

국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향Haklae Kim
 
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서Life Semantics, Inc.
 
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012Daum DNA
 
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012Daum DNA
 
Semantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataSemantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataHaklae Kim
 
LOD 구축현황 과 현황
LOD 구축현황 과 현황LOD 구축현황 과 현황
LOD 구축현황 과 현황sbchae
 
Interlinking for Linked Data
Interlinking for Linked DataInterlinking for Linked Data
Interlinking for Linked DataMyungjin Lee
 
대한민국, 잇다!
대한민국, 잇다! 대한민국, 잇다!
대한민국, 잇다! Haklae Kim
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용Jin wook
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0Konkuk University
 
국내 공공데이터 플랫폼 현황과 발전방향
 국내 공공데이터 플랫폼 현황과 발전방향 국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향Haklae Kim
 
Src슬라이드(2총괄1세부) 이상구
Src슬라이드(2총괄1세부) 이상구Src슬라이드(2총괄1세부) 이상구
Src슬라이드(2총괄1세부) 이상구SRCDSC
 
1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdfssuserde0b2d
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)Steve Min
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집Hansung University
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원datasciencekorea
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형datasciencekorea
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료Hyun Namgoong
 

Similar a Pharmaceutical Industry and Linked Data (20)

Kswc2012
Kswc2012Kswc2012
Kswc2012
 
국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향
 
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점에서
 
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012
빅데이터 시각으로 본 공공데이터 활용 - 의료서비스 관점 | Devon 2012
 
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012
빅데이터시각으로 본 공공데이터 활용-의료서비스관점에서 | Devon 2012
 
Semantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of dataSemantic Web: sustainable solution for ending hunger of data
Semantic Web: sustainable solution for ending hunger of data
 
LOD 구축현황 과 현황
LOD 구축현황 과 현황LOD 구축현황 과 현황
LOD 구축현황 과 현황
 
Interlinking for Linked Data
Interlinking for Linked DataInterlinking for Linked Data
Interlinking for Linked Data
 
대한민국, 잇다!
대한민국, 잇다! 대한민국, 잇다!
대한민국, 잇다!
 
빅 데이터 개요 및 활용
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
 
빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0빅데이터와 타겟 마케팅 Ver 1 0
빅데이터와 타겟 마케팅 Ver 1 0
 
국내 공공데이터 플랫폼 현황과 발전방향
 국내 공공데이터 플랫폼 현황과 발전방향 국내 공공데이터 플랫폼 현황과 발전방향
국내 공공데이터 플랫폼 현황과 발전방향
 
Src슬라이드(2총괄1세부) 이상구
Src슬라이드(2총괄1세부) 이상구Src슬라이드(2총괄1세부) 이상구
Src슬라이드(2총괄1세부) 이상구
 
1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
 
2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집2014 한국 링크드 데이터 사례집
2014 한국 링크드 데이터 사례집
 
Open Data Workshop
Open Data Workshop Open Data Workshop
Open Data Workshop
 
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
빅데이터 기술을 활용한 뉴스 큐레이션 서비스 - 온병원
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형
 
DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료DAUM DevOn 2012 발표자료
DAUM DevOn 2012 발표자료
 

Pharmaceutical Industry and Linked Data

  • 1. 2010년 11월 24일 탑쿼드란트 코리아 전략팀 추윤미 ymchu@topquadrant.co.kr 홈페이지 : http://www.topquadrant.co.kr 블로그 : http://blog.topquadrant.co.kr
  • 2. 목차 • 생명의학 분야의 R&D 환경 변화 • 제약 산업과 ICT • 시맨틱 웹과 링크드 데이터 • LODD(Linked Open Drug Data)  개요  Competitive Intelligence Use Case  기대효과 • 결론
  • 3. 생명의학 분야의 R&D 환경 변화 새로운 개념의 치료(therapy)에 대한 요구 – 개인 맞춤형 치료 – 질병의 조기 진단 – 질병의 치료 뿐만 아니라 예방, 노화 등에 관한 관심 증가 – Safty & efficacy(약품의 안전성, side effect, 효과 등에 대한 정보 요구) 생명의학 분야 – Multidisciplinary – 의학, 생물학, 약학, 유전 공학 등의 다양한 정보 증가
  • 4. 제약 산업과 ICT 정보 기술(ICT)의 발전 – 데이터의 폭발적 증가 • 실험 데이터, 환자 기록, 임상 실험, 유전자 DB ... – Knowledge Management • 다양한 정보를 가공함으로써 새로운 지식 창출이 가능 – 연구 방법의 변화 • Multidisciplinary – 학제간 연구의 증가 • collaboration – 협업 연구의 증가 • data 중심의 새로운 연구 방법 -> 혁신의 열쇠가 “정보”에 있음 – 다양한 분야에서 생성되는 정보를 장벽 없이 접근하고 통합 함으로써 새로운 지식을 생성
  • 5. Information Interoperability 신약 개발을 위한 비즈니스 모델에 내부 정보 뿐만 아니라 외부 의 정보도 필요함 – Clinical Trials + Clinical Research(experiments) + Biomedical literature + electronic health records... – + geographical data, medical vocabulary... 내, 외부의 정보를 통합하기 위한 정보 간의 상호운용성 (interoperability) 에 대한 요구 대두 source : Mats Sundgren , “New needs for interoperability in Clinical Research” , AstraZeneca, health conference 2010
  • 6. 시맨틱 웹 “The Semantic Web is a vision: the idea of having data on the Web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.[W3C 2001] ” 데이터의 웹 2010-12-07
  • 7. 시맨틱 웹 시맨틱 웹은 상호운용성에 관한 기술 – 시맨틱 웹 표준인 RDF(Resource Description Framework) 로 데이터를 표현함으로써 이질적인 정보 간의 통합이 가능 지식 교환을 위한 표준과 아키텍처 – RDFS, OWL, SKOS(Simple Knowledge Organization System), FOAF(Friends of a Friend), etc... – Sparql 질의 언어를 이용한 분산된 정보에 대한 통합 질의 – URI(Uniform Resource Identifier)를 이용한 웹에서의 정보 접근 – Linked Data
  • 8. RDF - 데이터 모델 RDF(Resource Description Framework) create 마이크 샌델 정의란 무엇인가 subject predicate object 트리플 (Triple)
  • 9. 시맨틱 웹- integration graph representation using RDF data model Source: Ivan Herman
  • 10. SPARQL as a Unifying Source Application Sparql query return data SPARQL Engine DB X DB X DB X DB Source: Ivan Herman
  • 11. 시맨틱 웹 – Linked Data Data Silos on the Web Image: Bob Jagensdorf, http://flickr.com/photos/darwinbell/, CC-BY  Many common things are represented in multiple data sets  Linking identifiers connects these data sets  Linked data opens the doors of the silos
  • 12.
  • 13. Linked Data Tim Berners-Lee, “Linked Data- Design Issues(2006)”, http://www.w3.org/DesignIssues/LinkedData.html 1. Use URIs as names for things 2. Use HTTP URIs so that people can look up those names 3. When someone looks up a URI, provide useful RDF Information 4. Include RDF statements that link to other URIs so that they can discover related things Linked data는 웹 상의 데이터들에 URI를 이용해 이름을 붙이고, RDF로 데이터를 기술할 뿐만 아니라 데이터 간의 관계를 부여하여 HTTP를 통해 웹으로 발행함으로써 데이터가 인간 뿐만 아니라 기계에 의해 사용되고 이해될 수 있도록 하는 방법
  • 14. Linked Data – RDF Data Link Linked Data Linked Data Search Browsers Mashups Engines Thing Thing Thing Thing Thing Thing Thing Thing Thing Thing typed typed typed typed links links links links A B C D E 참고 : Chris Bizer / The Emerging Web of Linked Data
  • 15. W3C – Linking Open Data Project W3C SWEO Community (Semantic Web Education & Outreach Interest Group)  다양한 공개 데이터 셋을 RDF형태로 웹에 퍼블리싱하여, 다양한 데이터 소스 간의 RDF 링크를 설정함으로써, 공유 데이터(data common)를 통해 웹을 확장하고자 하는 목적  Over 500 million RDF triples  Around 120,000 RDF links between data sources
  • 16. LOD Cloud – 2008. 2
  • 17. LOD Cloud – 2009. 7 July 2009
  • 18. LOD Cloud – 2010. 9 2010-12-07
  • 19. LOD Cloud – Life Science 분야
  • 20. 제약 분야 Linked Data 사례 – LODD Linking Open Drug Data(LODD) – Health Care와 Life Science 분야, 특히 Drug에 관련된 정보의 링크드 데이터 셋 구축 – 이미 구축되어 있는 clinical practice(LinkedCT), disease, gene 관련 Linked Data 데이터 셋과 링크를 통해 연계 목적 – Drug Discovery, drug development, 그리고 clinical practice 분야의 데이터 들을 통합함으로써 제약업체에 맞춤형의 약품 개발이 가능하도록 전문적인 정보를 제공
  • 21. 제약 분야 Linked Data 사례 – LODD The Linked Clinical Trials(LinkedCT) – 미국 NIH에서 제공되는 158개국의 임상실험에 관한 레지스트리 • http://linkedct.org • 6만 건 이상의 임상실험 보유 DrugBank – FDA 승인을 받은 5000개 이상의small molecule과 biotech drugs에 관한 레파 지토리 • http://www4.wiwiss.fu-berlin.de/drugbank/drugbank Diseasome – 4300 여 가지의 disorders와 disease genes, 그리고 이들간의 관계에 관한 정보 (from OMIM:The Online Mendelian Inheritance in Man) • http://www4.wiwiss.fu-berlin.de/diseasome DailyMed – NLM에 의해 발행되는 시판되는 약품에 대한 정보 – high quality information • 약품의 화학구조에 관한 일반적인 백그라운드, 효과의 메카니즘, 사용방법, 부작용, 복 용제한조건, 경고, 이상반응 등에 관한 정보를 포함 • http://www4.wiwiss.fu-berlin.de/dailymed/
  • 22. Competitive Intelligence Use Case 어떤 비즈니스 매니저가 알츠하이머에 관한 새로운 임상실험결과를 찾음 – 임상실험 결과 및 관련 약품 정보와 지리정보를 통합함으로써 -> 앞으로의 세 일즈 예측과 새로운 제약에 대한 요구 파악 – 시맨틱 웹 브라우저를 통해 LinkedCT에서 AD에 관련한 모든 임상실험과 관련 약품검색 1) Pfizer의 Varenicline이라 불리는 약품 검색 http://data.linkedct.org/resource/trials/NCT00744978 2) 이 약품에 대한 더 많은 정보를 찾고 싶음 http://dbpedia.org/resource/Varenicline http://www4.wiwiss.fu-berlin.de/drugbank/resource/drugs/DB01273 3) 데이터의 링크를 따라 DailyMed에 있는 데이터를 통해 이 약품이 이미 nicotine addiction 치료를 위해 시장에 나와있음을 찾음 4) 데이터를 스크롤하여 이 약품이 이미 시장에 나와있으므로 부작용에 관한 정보를 얻을 수 있음. 5) 임상실험 (LinkedCT) 을 통해 검증된 일반적인 복용량에 관한 정보도 얻을 수 있어 안전성에 관한 데이터도 확보됨
  • 23. Competitive Intelligence Use Case – 왜 nicotine addiction 약품이 AD(Alzheimer’s Disease)에도 효과가 있는지 찾 고 싶어짐 6) DrugBank의 링크를 따라 Varenicline이 alpha-4와 beta-2 neuronal nicotinic acetylcholine receptor agonist임을 알 수 있음 7) 그러나 Desiasome은 관련된 유전자가 AD보다는 nicotine addiction에만 중요함 을 알려줌 8) Diseasome은 이 질병들 간의 더욱 복잡한 관계가 존재함을 알려줌 9) SWAN 지식베이스(http://hypothesis.alzforum.org/swan)로 브라우징을 확장하면 AD가 nicotinic receptors와 관계가 있다는 가설을 검색 임상실험 (LinkedCT) 을 통해 검증된 일반적인 복용량에 관한 정보도 얻을 수 있어 안전성에 관한 데이터도 확보됨
  • 24. USE CASE 분석을 통한 기대효과 관련된 데이터를 통합적인 view로 브라우징 함 – Linked Data 접근 방법을 통해서 •기업, 임상실험, 약품, 질병과 유전적 변형간의 관계된 데이터를 브 라우징할 수 있으며, •이를 통해 부가적인 데이터를 접근할 수 있고, •전체적으로 이형의 데이터의 정보들을 서로 연결(interlinking)함으 로써 얻고자 하는 정보를 더 구체화 할 수 있으며, •관련 지식에 대한 탐험(exploring)을 통해 의사결정에 도움을 받음 외부의 Knowledge Base를 이용한 새로운 Innovation – Internal Information과 External Information의 통합을 통해 •DailyMed, LinkedCT, DrugBank와 같은 신뢰성 있는 정보와 내부의 정보를 융합, 새로운 지식의 창출이 가능
  • 25. 신약 개발을 위한 혁신의 요구 Open Innovation – 기업 외부로부터의 R&D Sourcing •requires data standards to enable rapid data integration Data Requirements for Clinical Trials – 데이터의 상호 교환을 위한 표준 기반의 데이터 유통 •all the different departments, regulators and partners h ave to look at data in the same way •standards applicable across any enterprise within the Bi oPharma business
  • 26. 신약 개발을 위한 정보전략 LODD, LOD BioRDF, etc (DBPedia, from Life Geo-data, etc Science from other domain) domains) external Linked Data 기술 기반의 Information Interoperability internal Patient Scientific Data Internal heterogeneous Information Research Reports Information different vocabularies
  • 28. 결론 신약 개발을 위한 혁신의 Key Capability – 다양한 정보를 접근, 통합하고 새로운 지식으로 가공하기 위 한 기술 – 다양한 내부, 외부의 정보를 자유롭게 유통할 수 있는 표준 기반의 데이터 유통 체계가 필요 시맨틱 웹 기술 – 자유로운 정보 유통과 통합을 위한 열쇠 Linked Data를 이용한 신약 개발 – 표준 기반의 데이터 생성 및 유통을 통해 – LOD(특히, LODD) 데이터와의 융, 복합으로 – 혁신적인 제품 개발 가능
  • 29. 탑쿼드란트 코리아 전략팀 추윤미 ymchu@topquadrant.co.kr 홈페이지 : http://www.topquadrant.co.kr 블로그 : http://blog.topquadrant.co.kr