Material de la sesión técnica sobre los datos genómicos en el Ámbito de la Salud que organizamos el pasado 8 de octubre de 2.015
Postgrado en BI :
http://informatica1.eug.es/es/estudios/postgrados/postgrado-en-business-intelligence-2015-2016
Desde la presentación de los resultados del Proyecto Genoma Humano en el año 2000, son muchos los avances y el impacto que los estudios genómicos están teniendo en la sociedad. Cada día las noticias nos muestran cómo estos estudios están aportando información muy valiosa para la prevención y el tratamiento de enfermedades y el momento de su aplicación de forma habitual en los centros de salud es cada día más cercano. Dado el gran volumen de estos datos y la confidencialidad con que hay que gestionarlas, la genómica supone un reto para la Informática de la Salud y su tratamiento se apoya en tecnologías de Business Intelligence (BI) y BigData.
Jordi Rambla, del Centro de Regulación Genómica (CRG), gestiona el Archivo Europeo del Genoma-fenómeno (EGA), de alcance mundial y con sedes en Barcelona y Cambridge. http://ega.crg.eu
Material de la sesión técnica sobre los datos genómicos en el Ámbito de la Salud que organizamos el pasado 8 de octubre de 2.015
Postgrado en BI :
http://informatica1.eug.es/es/estudios/postgrados/postgrado-en-business-intelligence-2015-2016
Desde la presentación de los resultados del Proyecto Genoma Humano en el año 2000, son muchos los avances y el impacto que los estudios genómicos están teniendo en la sociedad. Cada día las noticias nos muestran cómo estos estudios están aportando información muy valiosa para la prevención y el tratamiento de enfermedades y el momento de su aplicación de forma habitual en los centros de salud es cada día más cercano. Dado el gran volumen de estos datos y la confidencialidad con que hay que gestionarlas, la genómica supone un reto para la Informática de la Salud y su tratamiento se apoya en tecnologías de Business Intelligence (BI) y BigData.
Jordi Rambla, del Centro de Regulación Genómica (CRG), gestiona el Archivo Europeo del Genoma-fenómeno (EGA), de alcance mundial y con sedes en Barcelona y Cambridge. http://ega.crg.eu
2024 State of Marketing Report – by HubspotMarius Sescu
https://www.hubspot.com/state-of-marketing
· Scaling relationships and proving ROI
· Social media is the place for search, sales, and service
· Authentic influencer partnerships fuel brand growth
· The strongest connections happen via call, click, chat, and camera.
· Time saved with AI leads to more creative work
· Seeking: A single source of truth
· TLDR; Get on social, try AI, and align your systems.
· More human marketing, powered by robots
ChatGPT is a revolutionary addition to the world since its introduction in 2022. A big shift in the sector of information gathering and processing happened because of this chatbot. What is the story of ChatGPT? How is the bot responding to prompts and generating contents? Swipe through these slides prepared by Expeed Software, a web development company regarding the development and technical intricacies of ChatGPT!
2024 State of Marketing Report – by HubspotMarius Sescu
https://www.hubspot.com/state-of-marketing
· Scaling relationships and proving ROI
· Social media is the place for search, sales, and service
· Authentic influencer partnerships fuel brand growth
· The strongest connections happen via call, click, chat, and camera.
· Time saved with AI leads to more creative work
· Seeking: A single source of truth
· TLDR; Get on social, try AI, and align your systems.
· More human marketing, powered by robots
ChatGPT is a revolutionary addition to the world since its introduction in 2022. A big shift in the sector of information gathering and processing happened because of this chatbot. What is the story of ChatGPT? How is the bot responding to prompts and generating contents? Swipe through these slides prepared by Expeed Software, a web development company regarding the development and technical intricacies of ChatGPT!
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
The realm of product design is a constantly changing environment where technology and style intersect. Every year introduces fresh challenges and exciting trends that mold the future of this captivating art form. In this piece, we delve into the significant trends set to influence the look and functionality of product design in the year 2024.
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
Mental health has been in the news quite a bit lately. Dozens of U.S. states are currently suing Meta for contributing to the youth mental health crisis by inserting addictive features into their products, while the U.S. Surgeon General is touring the nation to bring awareness to the growing epidemic of loneliness and isolation. The country has endured periods of low national morale, such as in the 1970s when high inflation and the energy crisis worsened public sentiment following the Vietnam War. The current mood, however, feels different. Gallup recently reported that national mental health is at an all-time low, with few bright spots to lift spirits.
To better understand how Americans are feeling and their attitudes towards mental health in general, ThinkNow conducted a nationally representative quantitative survey of 1,500 respondents and found some interesting differences among ethnic, age and gender groups.
Technology
For example, 52% agree that technology and social media have a negative impact on mental health, but when broken out by race, 61% of Whites felt technology had a negative effect, and only 48% of Hispanics thought it did.
While technology has helped us keep in touch with friends and family in faraway places, it appears to have degraded our ability to connect in person. Staying connected online is a double-edged sword since the same news feed that brings us pictures of the grandkids and fluffy kittens also feeds us news about the wars in Israel and Ukraine, the dysfunction in Washington, the latest mass shooting and the climate crisis.
Hispanics may have a built-in defense against the isolation technology breeds, owing to their large, multigenerational households, strong social support systems, and tendency to use social media to stay connected with relatives abroad.
Age and Gender
When asked how individuals rate their mental health, men rate it higher than women by 11 percentage points, and Baby Boomers rank it highest at 83%, saying it’s good or excellent vs. 57% of Gen Z saying the same.
Gen Z spends the most amount of time on social media, so the notion that social media negatively affects mental health appears to be correlated. Unfortunately, Gen Z is also the generation that’s least comfortable discussing mental health concerns with healthcare professionals. Only 40% of them state they’re comfortable discussing their issues with a professional compared to 60% of Millennials and 65% of Boomers.
Race Affects Attitudes
As seen in previous research conducted by ThinkNow, Asian Americans lag other groups when it comes to awareness of mental health issues. Twenty-four percent of Asian Americans believe that having a mental health issue is a sign of weakness compared to the 16% average for all groups. Asians are also considerably less likely to be aware of mental health services in their communities (42% vs. 55%) and most likely to seek out information on social media (51% vs. 35%).
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
This article is all about what AI trends will emerge in the field of creative operations in 2024. All the marketers and brand builders should be aware of these trends for their further use and save themselves some time!
A report by thenetworkone and Kurio.
The contributing experts and agencies are (in an alphabetical order): Sylwia Rytel, Social Media Supervisor, 180heartbeats + JUNG v MATT (PL), Sharlene Jenner, Vice President - Director of Engagement Strategy, Abelson Taylor (USA), Alex Casanovas, Digital Director, Atrevia (ES), Dora Beilin, Senior Social Strategist, Barrett Hoffher (USA), Min Seo, Campaign Director, Brand New Agency (KR), Deshé M. Gully, Associate Strategist, Day One Agency (USA), Francesca Trevisan, Strategist, Different (IT), Trevor Crossman, CX and Digital Transformation Director; Olivia Hussey, Strategic Planner; Simi Srinarula, Social Media Manager, The Hallway (AUS), James Hebbert, Managing Director, Hylink (CN / UK), Mundy Álvarez, Planning Director; Pedro Rojas, Social Media Manager; Pancho González, CCO, Inbrax (CH), Oana Oprea, Head of Digital Planning, Jam Session Agency (RO), Amy Bottrill, Social Account Director, Launch (UK), Gaby Arriaga, Founder, Leonardo1452 (MX), Shantesh S Row, Creative Director, Liwa (UAE), Rajesh Mehta, Chief Strategy Officer; Dhruv Gaur, Digital Planning Lead; Leonie Mergulhao, Account Supervisor - Social Media & PR, Medulla (IN), Aurelija Plioplytė, Head of Digital & Social, Not Perfect (LI), Daiana Khaidargaliyeva, Account Manager, Osaka Labs (UK / USA), Stefanie Söhnchen, Vice President Digital, PIABO Communications (DE), Elisabeth Winiartati, Managing Consultant, Head of Global Integrated Communications; Lydia Aprina, Account Manager, Integrated Marketing and Communications; Nita Prabowo, Account Manager, Integrated Marketing and Communications; Okhi, Web Developer, PNTR Group (ID), Kei Obusan, Insights Director; Daffi Ranandi, Insights Manager, Radarr (SG), Gautam Reghunath, Co-founder & CEO, Talented (IN), Donagh Humphreys, Head of Social and Digital Innovation, THINKHOUSE (IRE), Sarah Yim, Strategy Director, Zulu Alpha Kilo (CA).
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
The search marketing landscape is evolving rapidly with new technologies, and professionals, like you, rely on innovative paid search strategies to meet changing demands.
It’s important that you’re ready to implement new strategies in 2024.
Check this out and learn the top trends in paid search advertising that are expected to gain traction, so you can drive higher ROI more efficiently in 2024.
You’ll learn:
- The latest trends in AI and automation, and what this means for an evolving paid search ecosystem.
- New developments in privacy and data regulation.
- Emerging ad formats that are expected to make an impact next year.
Watch Sreekant Lanka from iQuanti and Irina Klein from OneMain Financial as they dive into the future of paid search and explore the trends, strategies, and technologies that will shape the search marketing landscape.
If you’re looking to assess your paid search strategy and design an industry-aligned plan for 2024, then this webinar is for you.
5 Public speaking tips from TED - Visualized summarySpeakerHub
From their humble beginnings in 1984, TED has grown into the world’s most powerful amplifier for speakers and thought-leaders to share their ideas. They have over 2,400 filmed talks (not including the 30,000+ TEDx videos) freely available online, and have hosted over 17,500 events around the world.
With over one billion views in a year, it’s no wonder that so many speakers are looking to TED for ideas on how to share their message more effectively.
The article “5 Public-Speaking Tips TED Gives Its Speakers”, by Carmine Gallo for Forbes, gives speakers five practical ways to connect with their audience, and effectively share their ideas on stage.
Whether you are gearing up to get on a TED stage yourself, or just want to master the skills that so many of their speakers possess, these tips and quotes from Chris Anderson, the TED Talks Curator, will encourage you to make the most impactful impression on your audience.
See the full article and more summaries like this on SpeakerHub here: https://speakerhub.com/blog/5-presentation-tips-ted-gives-its-speakers
See the original article on Forbes here:
http://www.forbes.com/forbes/welcome/?toURL=http://www.forbes.com/sites/carminegallo/2016/05/06/5-public-speaking-tips-ted-gives-its-speakers/&refURL=&referrer=#5c07a8221d9b
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
Everyone is in agreement that ChatGPT (and other generative AI tools) will shape the future of work. Yet there is little consensus on exactly how, when, and to what extent this technology will change our world.
Businesses that extract maximum value from ChatGPT will use it as a collaborative tool for everything from brainstorming to technical maintenance.
For individuals, now is the time to pinpoint the skills the future professional will need to thrive in the AI age.
Check out this presentation to understand what ChatGPT is, how it will shape the future of work, and how you can prepare to take advantage.
A brief introduction to DataScience with explaining of the concepts, algorithms, machine learning, supervised and unsupervised learning, clustering, statistics, data preprocessing, real-world applications etc.
It's part of a Data Science Corner Campaign where I will be discussing the fundamentals of DataScience, AIML, Statistics etc.
Time Management & Productivity - Best PracticesVit Horky
Here's my presentation on by proven best practices how to manage your work time effectively and how to improve your productivity. It includes practical tips and how to use tools such as Slack, Google Apps, Hubspot, Google Calendar, Gmail and others.
The six step guide to practical project managementMindGenius
The six step guide to practical project management
If you think managing projects is too difficult, think again.
We’ve stripped back project management processes to the
basics – to make it quicker and easier, without sacrificing
the vital ingredients for success.
“If you’re looking for some real-world guidance, then The Six Step Guide to Practical Project Management will help.”
Dr Andrew Makar, Tactical Project Management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Fast comparison of microbial genomes using the Chaos Games Representation for metagenomic applications
1. Fast comparison of microbial genomes using the Chaos
Games Representation for metagenomic applications
Jhon Trujillo
Seminario Gebix
John Trujillo - Universidad Del Valle - Cali
jhon.trujillo@univalle.edu.co
24 de abril de 2014
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 1 / 54
2. Overview
1 Abstract
2 Introduction
3 Metodolog´ıa
Datos gen´omicos usados
Usando los CGR para comprar genomas
Usando los CGR para comprar genomas
4 Resultados
Tama˜nos de los fragmentos de las secuencias
Comparaci´on con Blast
Comparaci´on con Blast
Comparaci´on con Blast
5 Discussion and future work
6 Conclusiones
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 2 / 54
3. Abstract
Genome sequencing technology.
Secuenciamiento de genomas genera grandes bases de datos.
El Hardware existente no es suficiente y es muy costo.
Se requiere de algoritmos eficientes.
Se propone un m´etodo eficiente : Teor´ıa del Caos y an´alisis
Multifractral.
Realizar b´usquedas y filtrar datos.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 3 / 54
4. Ejemplo
Conjunto de 1500 genomas.
Blast puede tomar hasta 25 horas en buscar esta secuencia con
fragmentos grandes, por ejemplo de 100k.
Usando el m´etodo propuesto reduce el conjunto de b´usqueda en un
95 %. (1500 a 50) en solo 15 minutos.
Predice una secuencia con un 67 % de exactitud.
La idea es demostrar que este m´etodo es mas r´apido para comprar
secuencias en grandes conjuntos de datos.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 4 / 54
5. Introduction
El Secuenciamiento de genomas genera grandes datos.
La secuenciaci´on por nanoporos genera grandes “reads” de 100.000
pb en longitudes de 100kb.
El poder computacional no es suficiente : Una opci´on es usar Blast.
Segunda opci´on es usar: la teor´ıa del caos y el an´alisis
multifractral.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 5 / 54
6. Introduction
Cada secuencia tiene una representaci´on fractal. Una combinaci´on de
nucle´otidos tiene una escala independiente.
Un CGR puede ser usado para visualizar estas representaciones.
El CGR puede mostrar la frecuencia de una “word” del c´odigo
gen´etico usando una imagen simple donde un conjunto de pixels
puede representar la frecuencia de una”word”. Mostrando la
frecuencia de cada palabra con un color determinado.
Luego, un an´alisis multifractral puede ser aplicado al CGR.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 6 / 54
7. Introduction
Figura : Diagrama representativo a la Introducci´on del Paper
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 7 / 54
8. Introduction
Demostrar [Z.-G.Yu,V.Anh,K.-S.Lau] donde usaron esta metodolog´ıa para
clasificar 33 genomas bacterianos.
Los autores mostraron la similaridad filogen´etica de las bacterias
agrupadas en 2 y 3 dimensiones ( Estas dimensiones fueron derivadas
a partir de la dimensi´on fractal ).
Usaron conceptos como el Heat Capacity para distinguir exones e
intrones en el genoma bacteriano.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 8 / 54
9. Introduction
La dimensi´on fractal era mas alta en secuencias no codificantes que
en secuencias codificantes.
Similares aproximaciones fueron realizadas para el genoma humano y
distinguir los genomas del HIV-1 [A.Pandit,A.Dasanna] .
No es claro como escalar este tipo de an´alisis a los cientos de
genomas presentes en los repositorios p´ublicos.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 9 / 54
13. Secuenciaci´on
El Secuenciamiento moderno solo hace lecturas muy peque˜nas.
Unir cada palabra es un juego de rompecabezas.
¿C´omo saber cual es el mejor m´etodo de ensamblaje?.
¿C´omo saber que tan bueno es el ensamblaje y su correcta
organizaci´on?.
Se compararon ambos genomas relacionados por medio de sus atributos
taxon´omicos :
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 13 / 54
18. Introduction
Objetivo
Investigar la utilidad de los CGR para comparar y estudiar metagenomas
donde los fragmentos de cientos de genomas necesitan ser clasificados
taxon´omicamente e identificados.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 18 / 54
19. Metodolog´ıa
Se presenta un breve resumen de la metodolog´ıa.
Un gr´afico CGR en dos dimensiones se representa con un cuadrado de
dos dimensiones y cada v´ertice del cuadrado representa uno de los 4
nucle´otidos base(g).
A=(0,0)
T=(1,0)
C=(0,1)
G=(1,1)
Ejemplo : ATGCGAGTGT.
Figura : Representaci´on CGRJhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 19 / 54
20. Metodolog´ıa
Una secuencia puede ser graficada dentro del ´area del cuadrado, de tal
manera que la posicion de un nucle´otido i corresponde a una posicion Ri .
ri = 0,5 ∗ (r(i − 1) + gi )
Donde el primer nucle´otido dibujado en el cuadrado es graficado en el
centro del cuadrado, en la posicion (0.5 , 0.5).
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 20 / 54
22. Metodolog´ıa
Cada sub-cuadrado tiene definido un tama˜no r.
Por ejemplo:
Un cuadrado con 100
sub-cuadrados tiene
un r = 1/10
Ejemplo : ATGCGAGTGT.
Figura : Resoluci´on de la 8-esima coordenada en la
secuencia. Cada coordenada tiene una precisi´on de 4 bits.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 22 / 54
23. Metodolog´ıa
Suma de Particiones
Zr (q) =
i
(Pi )q
(1)
Donde q pertenece a los Reales y se usa para indicar las regiones con
mucha y poca densidad. En este paper : −15 <= q <= 15
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 23 / 54
24. Metodolog´ıa
Exponente de escalamiento del espectrum
τq = l´ım
r→0
log(Zr (q))
log(r)
(2)
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 24 / 54
25. Metodolog´ıa
Dimensi´on fractal en funci´on del espectrum
Para q diferente de 1.
Dq =
τ
q − 1
(3)
Para q igual a 1.
Dq = l´ım
r→0
(Pi ) ∗ log(Zr (q))
log(r)
(4)
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 25 / 54
26. Metodolog´ıa
Exponente de escalamiento del espectrum
Calculado la segunda derivada diferencial de τ con respecto a q.
Cq =
δ2 ∗ τq
δ ∗ q2
= 2 ∗ τq − τ(q − 1) − τ(q + 1) (5)
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 26 / 54
27. Metodolog´ıa
Figura : CGR con r de diferentes tama˜nos y un k-mer determinado
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 27 / 54
28. Metodolog´ıa
Figura : CGR con r de diferentes tama˜nos y un k-mer determinado
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 28 / 54
29. Metodolog´ıa
Figura : Figuras donde se observa la dimension fractal y el Heat Capacity en
funci´on de q y de diferentes tama˜nos de r = 1/8, 1/16, 1/32, 1/64, 1/128
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 29 / 54
30. Fuente de los Datos
Se obtuvieron los datos del programa GENOMETA.
de 2550 genomas se sacaron 1551 genomas donde cada uno de ellos
son de una especie diferente (species-target).
Los genomas restantes (999 genomas) se usaron como datos de
consulta.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 30 / 54
31. Usando los CGR
Se usaron varios tama˜nos para los r y las siguientes propiedades de los
CGRs:
1 La densidad de la caja Pi .
2 2. La dimensi´on Fractal Di .
3 El heat Capacity Cq.
Por cada una de estas medidas se uso un RMSD de la siguiente forma:
Nb
i,j
(di − dj )2
Nb
(6)
Para este caso di y dj son las densidades de los cuadrados i y j en cada
uno de los dos CGRs.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 31 / 54
32. Usando los CGR
De igual manera se usa para medir las otras dos propiedades:
Para la dimensi´on fractal di y dj hacen referencia a la dimensi´on.
Para el Heat Capacity di y dj hacen referencia al hear capacity en un
determinado q.
La Sumatoria se da en funci´on de promedio de todos los valores de q.
Yo propongo las siguientes ecuaciones ( el paper no las presenta ):
Nq
i,j
(deni − denj )2
Nq
(7)
Nq
i,j
(Ci − Cj )2
Nq
(8)
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 32 / 54
33. ¡ Recordar !
Que el string-query no se encuentra en la secuencia target.
Un emparejamiento exacto entre dos secuencias no es posible
Por lo tanto :
El menor valor medido por el RMSD (menor diferencia) deber´ıa identificar
el genoma desde el conjunto Target.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 33 / 54
34. ¿C´omo validar la presici´on del proceso ?
Usandoinformaci´on taxon´omica descargada desde el NCBI
(ftp://ftp.ncbi.nih.gov/pub/taxonomy/) de cada genoma.
Y usando un algoritmo para la construcci´on del ´arbol taxon´omico.
Se compararon ambos genomas relacionados por medio de sus atributos
taxon´omicos :
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 34 / 54
35. ¿C´omo validar la presici´on del proceso ?
Especies.
Genus
family
order
Phylum
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 35 / 54
36. Resultados
Para calibrar y la evaluaci´on del m´etodo se evaluaron los siguientes
experimentos se realizar´on:
Tama˜nos de los fragmentos de las secuencias.
Comparaci´on con Blast.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 36 / 54
37. Resultados
Tener en cuenta que :
Un CGR generado a partir de una fracci´on de una secuencia de un
genoma es similar la secuencia completa.
Se sabe que una dimensi´on fractal difiere significativamente para
CGRs generados para regiones codificantes y no codificantes.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 37 / 54
38. Resultados
El objetivo de esta prueba consiste en :
Determinar cuanto varia la identificaci´on de una secuencia de un
genoma dependiendo del tama˜no del fragmento usado a partir de la
secuencia.
En otras palabras determinar el m´ınimo tama˜no del fragmento sin que
haya un cambio significativo.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 38 / 54
39. Resultados
Tama˜nos de las secuencias : 3.2kb hasta 20kb (E-coli) .
Fragmentos de cada tama˜no fueron tomados en intervalos irregulares.
Cada fragmento fue sobre-lapado en un 50 % con el fragmento
anterior
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 39 / 54
40. Resultados
El promedio de los RMSD es igual para casi todos los cuadrados de
diferentes tama˜nos
Sin embargo, si hay una variabilidad si cambia con respecto al tama˜no
de cada fragmento hasta tama˜nos de 50kb.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 40 / 54
41. Resultados
Usando el M´aximo de los RMSD los cambios son mucho mas altos
con respecto a los promedios.
Usar el M´aximo de los RMSD puede no ser adecuado para identificar
secuencias.
Fragmentos peque˜nos hay una gran diferencia. r <= 1/8.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 41 / 54
42. Resultados
Importante :
Para fragmentos de tama˜no 100kb o mas, el RMSD para cualquier
tama˜no r tienden a converger.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 42 / 54
43. Resultados
Usando el M´aximo de los RMSD los cambios son mucho mas altos
con respecto a los promedios.
Usar el M´aximo de los RMSD puede no ser adecuado para identificar
secuencias.
Fragmentos peque˜nos hay una gran diferencia. r <= 1/8.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 43 / 54
44. Resultados
Los gr´aficos que se presentan en el heat capacity no son muy
adecuados.
Esto puede indicar la presencia de ruido que pueden debilitar el poder
discriminatorio de estas dos medidas.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 44 / 54
45. Resultados Blast
¿ Podr´ıamos clasificar la especie taxon´omica de un genoma correctamente
dentro de un sub-conjunto de datos predicho a partir de un Numero N de
Hits determinados ?
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 45 / 54
46. Resultados Blast
Lado Izquierdo : N´umero de clasificaciones correctas con N=1.
Lado Derecho : Indica el conjunto de “top ranked” que podr´ıa
contener la clasificaci´on correcta.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 46 / 54
47. Resultados Blast
Podr´ıamos decir que un CGR de densidad podr´ıa ser usado para reducir un
conjunto de datos de 1550 genomas a un conjunto de datos de 50( Al
menos uno de estos 50 seria la clasificaci´on correcta para el genoma
buscado ). Luego aplicar Blast.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 47 / 54
50. Resultados Blast
Comparison of timings using CGR box densities and BLAST.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 50 / 54
51. Discusi´on y trabajo futuro
Las comunidades cient´ıficas trabajan fragmentos peque˜nos de lecturas
(100pb).
El desaf´ıo esta en poder usar fragmentos peque˜nos por que seria mas
preciso: Identificar secuencias novel y raras.
Los procesos de secuenciaci´on aun generan “reads” muy peque˜nos.
En este estudio se uso una funci´on RMSD muy sencilla.
Se deber´ıa aplicar un m´etodo que pretermita identificar puntos clave
en los CGR.
Aplicar conceptos estad´ısticos mas fuertes como los propuestos en
algunos papers de referencia que ellos recomiendan.
Desarrollar algoritmos de computer visi´on que permitan extraer
informaci´on importante del CGR.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 51 / 54
52. Discusi´on y trabajo futuro
La teor´ıa del caos para representar genomas fue introducida hace mas
de dos d´ecadas. Es una forma conveniente para visualizar y comprar
genomas de secuencias.
Estos resultados pueden ser usados por otros m´etodos para el
alineamiento de las secuencias.
Aun falta muchas pruebas con los nuevos m´etodos de secuenciaci´on
existentes.
Se mostro que la propiedad CGR Density Box puede ser usada como
un m´etodo para filtrar espacios de b´usqueda.
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 52 / 54
53. References
Z.-G.Yu,V.Anh,K.-S.Lau (2001)
Measure representation and multifractal analysis of complete genomes
Phys.Rev.E64 (2001) 031903.
A.Pandit,A.Dasanna,S.Sinha, (2012)
Multifractal analysis of hiv-1 genomes.
MolPhylogenet Evol 62 (2) (2012) 756–63..
Jhon Trujillo (Univalle) Seminario Gebix - JTrujillo 24 de abril de 2014 53 / 54