Enviar búsqueda
Cargar
大資料分析技術的濫觴 0727
•
Descargar como PPTX, PDF
•
0 recomendaciones
•
535 vistas
家雋 莊
Seguir
大資料分析技術的濫觴
Leer menos
Leer más
Educación
Denunciar
Compartir
Denunciar
Compartir
1 de 37
Descargar ahora
Recomendados
大資料分析技術的濫觴
大資料分析技術的濫觴
家雋 莊
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Ching-Lin Tao
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Wei-Yu Chen
Hadoop 介紹 20141024
Hadoop 介紹 20141024
Jay Chu, PMP/OCM
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
What could hadoop do for us
What could hadoop do for us
Simon Hsu
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計
Wei-Yu Chen
Recomendados
大資料分析技術的濫觴
大資料分析技術的濫觴
家雋 莊
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Big data, big challenge- splunk 幫你解決 big data 議題帶來的挑戰
Ching-Lin Tao
Hadoop 2.0 之古往今來
Hadoop 2.0 之古往今來
Wei-Yu Chen
Hadoop 介紹 20141024
Hadoop 介紹 20141024
Jay Chu, PMP/OCM
Hadoop ecosystem - hadoop 生態系
Hadoop ecosystem - hadoop 生態系
Wei-Yu Chen
What could hadoop do for us
What could hadoop do for us
Simon Hsu
大資料趨勢介紹與相關使用技術
大資料趨勢介紹與相關使用技術
Wei-Yu Chen
Hadoop 0.20 程式設計
Hadoop 0.20 程式設計
Wei-Yu Chen
Hadoop与数据分析
Hadoop与数据分析
George Ang
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Jazz Yao-Tsung Wang
Hdfs introduction
Hdfs introduction
baggioss
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
Fred Chiang
Hdfs
Hdfs
baggioss
Hdfs
Hdfs
baggioss
Life of Big Data Technologies
Life of Big Data Technologies
Jazz Yao-Tsung Wang
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
Jazz Yao-Tsung Wang
Hadoop hive
Hadoop hive
Wei-Yu Chen
Enterprise Data Lake in Action
Enterprise Data Lake in Action
Jazz Yao-Tsung Wang
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
Beckett Hsieh
Google BigQuery introduction
Google BigQuery introduction
Simon Su
聚类 (Clustering)
聚类 (Clustering)
Yueshen Xu
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
When R meet Hadoop
When R meet Hadoop
Jazz Yao-Tsung Wang
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
Spark Introduction
Spark Introduction
Kevin Zhang
Hash算法
Hash算法
清平 张
資料分析的前奏曲 談資料收集的挑戰
資料分析的前奏曲 談資料收集的挑戰
Shih-En Chou
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
gravestomas0
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
黑客 接单【TG/微信qoqoqdqd】
Más contenido relacionado
La actualidad más candente
Hadoop与数据分析
Hadoop与数据分析
George Ang
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Jazz Yao-Tsung Wang
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Jazz Yao-Tsung Wang
Hdfs introduction
Hdfs introduction
baggioss
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
Fred Chiang
Hdfs
Hdfs
baggioss
Hdfs
Hdfs
baggioss
Life of Big Data Technologies
Life of Big Data Technologies
Jazz Yao-Tsung Wang
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
Jazz Yao-Tsung Wang
Hadoop hive
Hadoop hive
Wei-Yu Chen
Enterprise Data Lake in Action
Enterprise Data Lake in Action
Jazz Yao-Tsung Wang
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
Beckett Hsieh
Google BigQuery introduction
Google BigQuery introduction
Simon Su
聚类 (Clustering)
聚类 (Clustering)
Yueshen Xu
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
Jazz Yao-Tsung Wang
When R meet Hadoop
When R meet Hadoop
Jazz Yao-Tsung Wang
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
James Chen
Spark Introduction
Spark Introduction
Kevin Zhang
Hash算法
Hash算法
清平 张
資料分析的前奏曲 談資料收集的挑戰
資料分析的前奏曲 談資料收集的挑戰
Shih-En Chou
La actualidad más candente
(20)
Hadoop与数据分析
Hadoop与数据分析
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
Hadoop Deployment Model @ OSDC.TW
Hadoop Deployment Model @ OSDC.TW
Hdfs introduction
Hdfs introduction
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
Hdfs
Hdfs
Hdfs
Hdfs
Life of Big Data Technologies
Life of Big Data Technologies
淺談台灣巨量資料產業發展現況
淺談台灣巨量資料產業發展現況
Hadoop hive
Hadoop hive
Enterprise Data Lake in Action
Enterprise Data Lake in Action
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
Google BigQuery introduction
Google BigQuery introduction
聚类 (Clustering)
聚类 (Clustering)
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
2014-10-17 探析台灣巨量資料產業供應鏈串聯現況
When R meet Hadoop
When R meet Hadoop
Hadoop 與 SQL 的甜蜜連結
Hadoop 與 SQL 的甜蜜連結
Spark Introduction
Spark Introduction
Hash算法
Hash算法
資料分析的前奏曲 談資料收集的挑戰
資料分析的前奏曲 談資料收集的挑戰
Último
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
gravestomas0
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
黑客 接单【TG/微信qoqoqdqd】
【国外大学文凭样本】多大毕业证认证Q/微:892798920办多伦多大学毕业证留信留服使馆公公证,多大硕士毕业证,U of T研究生毕业证,文凭,改U o...
【国外大学文凭样本】多大毕业证认证Q/微:892798920办多伦多大学毕业证留信留服使馆公公证,多大硕士毕业证,U of T研究生毕业证,文凭,改U o...
ggbob1
1.🔥承接黑客破解任务,你的难题我们来解决! 💡无论你是游戏玩家、企业用户还是个人用户,都能在这里找到满意的解决方案。 💪经验丰富的专业团队为您提供全方位...
1.🔥承接黑客破解任务,你的难题我们来解决! 💡无论你是游戏玩家、企业用户还是个人用户,都能在这里找到满意的解决方案。 💪经验丰富的专业团队为您提供全方位...
黑客 接单【TG/微信qoqoqdqd】
1.💥黑客接单,挑战你的想象力! 🚀💡从最炫酷的黑科技到神秘莫测的代码世界,这里都是你想要的技术。无论是破解密码、入侵系统还是开发软件,我们都能帮你实现!...
1.💥黑客接单,挑战你的想象力! 🚀💡从最炫酷的黑科技到神秘莫测的代码世界,这里都是你想要的技术。无论是破解密码、入侵系统还是开发软件,我们都能帮你实现!...
黑客 接单【TG/微信qoqoqdqd】
正方教务系统的小漏洞被黑客找到啦~他现在正在偷偷溜进去玩呢!(*^__^*)法国大学挂科改成绩 德国大学挂科改成绩 韩国大学挂科改成绩大学成绩修改,找黑客...
正方教务系统的小漏洞被黑客找到啦~他现在正在偷偷溜进去玩呢!(*^__^*)法国大学挂科改成绩 德国大学挂科改成绩 韩国大学挂科改成绩大学成绩修改,找黑客...
黑客 接单【TG/微信qoqoqdqd】
保分服务在SAT考试作弊问题上的应对策略和措施是否充分,如何确保服务的可靠性??
保分服务在SAT考试作弊问题上的应对策略和措施是否充分,如何确保服务的可靠性??
testhelper Sobrenome
Grade 6 Lesson 7 Environment Protection.pptx
Grade 6 Lesson 7 Environment Protection.pptx
PriscilleXu
003 DSKP KSSR SEMAKAN 2017 BAHASA CINA TAHUN 3.pdf
003 DSKP KSSR SEMAKAN 2017 BAHASA CINA TAHUN 3.pdf
shanshanhui1
🎉一键更改成绩单,轻松点亮你的未来! 💡[书]想知道自己成绩怎么样?别担心!我们来帮您解答疑惑。 在这里,只需轻轻一点按钮,就能立即查看到分数、排名和其他...
🎉一键更改成绩单,轻松点亮你的未来! 💡[书]想知道自己成绩怎么样?别担心!我们来帮您解答疑惑。 在这里,只需轻轻一点按钮,就能立即查看到分数、排名和其他...
黑客 接单【TG/微信qoqoqdqd】
30T.ppt【国外大学文凭样本】TWU毕业证认证Q/微:892798920办西三一大学毕业证留信留服使馆公证,TWU硕士毕业证,TWU研究生毕业证,文凭...
30T.ppt【国外大学文凭样本】TWU毕业证认证Q/微:892798920办西三一大学毕业证留信留服使馆公证,TWU硕士毕业证,TWU研究生毕业证,文凭...
ggbob1
【創業簡報練習】當一個人吃飯會想起誰:(A)I-DOLL 陪吃娃娃|科技創業與營運實務
【創業簡報練習】當一個人吃飯會想起誰:(A)I-DOLL 陪吃娃娃|科技創業與營運實務
sardinesaying
加急代办一个日本鹿儿岛纯心女子大学学位记🌈学习成绩单电子版定制🌈仿制荷兰大学毕业证🌈日语JLPT证书定制
加急代办一个日本鹿儿岛纯心女子大学学位记🌈学习成绩单电子版定制🌈仿制荷兰大学毕业证🌈日语JLPT证书定制
bairnshajjes
我了解到黑客在某些领域拥有卓越的技术能力,特别是在处理系统漏洞方面。在当前的情境下,如果我想要改变我的毕业成绩,他们的帮助或许是我唯一可行的选择。【微 t...
我了解到黑客在某些领域拥有卓越的技术能力,特别是在处理系统漏洞方面。在当前的情境下,如果我想要改变我的毕业成绩,他们的帮助或许是我唯一可行的选择。【微 t...
黑客 接单【TG/微信qoqoqdqd】
Último
(14)
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
未毕业在线购买日本熊本县立大学学位记🏆学习成绩单电子版定制🏆克隆爱尔兰大学文凭🏆CFA证书定制
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
我曾试图入侵正方教务系统,但我发现它有一些漏洞找黑客入侵电脑,找黑客入侵服务器,找黑客破解密码,怎么找黑客?【微 tytyqqww 信】
【国外大学文凭样本】多大毕业证认证Q/微:892798920办多伦多大学毕业证留信留服使馆公公证,多大硕士毕业证,U of T研究生毕业证,文凭,改U o...
【国外大学文凭样本】多大毕业证认证Q/微:892798920办多伦多大学毕业证留信留服使馆公公证,多大硕士毕业证,U of T研究生毕业证,文凭,改U o...
1.🔥承接黑客破解任务,你的难题我们来解决! 💡无论你是游戏玩家、企业用户还是个人用户,都能在这里找到满意的解决方案。 💪经验丰富的专业团队为您提供全方位...
1.🔥承接黑客破解任务,你的难题我们来解决! 💡无论你是游戏玩家、企业用户还是个人用户,都能在这里找到满意的解决方案。 💪经验丰富的专业团队为您提供全方位...
1.💥黑客接单,挑战你的想象力! 🚀💡从最炫酷的黑科技到神秘莫测的代码世界,这里都是你想要的技术。无论是破解密码、入侵系统还是开发软件,我们都能帮你实现!...
1.💥黑客接单,挑战你的想象力! 🚀💡从最炫酷的黑科技到神秘莫测的代码世界,这里都是你想要的技术。无论是破解密码、入侵系统还是开发软件,我们都能帮你实现!...
正方教务系统的小漏洞被黑客找到啦~他现在正在偷偷溜进去玩呢!(*^__^*)法国大学挂科改成绩 德国大学挂科改成绩 韩国大学挂科改成绩大学成绩修改,找黑客...
正方教务系统的小漏洞被黑客找到啦~他现在正在偷偷溜进去玩呢!(*^__^*)法国大学挂科改成绩 德国大学挂科改成绩 韩国大学挂科改成绩大学成绩修改,找黑客...
保分服务在SAT考试作弊问题上的应对策略和措施是否充分,如何确保服务的可靠性??
保分服务在SAT考试作弊问题上的应对策略和措施是否充分,如何确保服务的可靠性??
Grade 6 Lesson 7 Environment Protection.pptx
Grade 6 Lesson 7 Environment Protection.pptx
003 DSKP KSSR SEMAKAN 2017 BAHASA CINA TAHUN 3.pdf
003 DSKP KSSR SEMAKAN 2017 BAHASA CINA TAHUN 3.pdf
🎉一键更改成绩单,轻松点亮你的未来! 💡[书]想知道自己成绩怎么样?别担心!我们来帮您解答疑惑。 在这里,只需轻轻一点按钮,就能立即查看到分数、排名和其他...
🎉一键更改成绩单,轻松点亮你的未来! 💡[书]想知道自己成绩怎么样?别担心!我们来帮您解答疑惑。 在这里,只需轻轻一点按钮,就能立即查看到分数、排名和其他...
30T.ppt【国外大学文凭样本】TWU毕业证认证Q/微:892798920办西三一大学毕业证留信留服使馆公证,TWU硕士毕业证,TWU研究生毕业证,文凭...
30T.ppt【国外大学文凭样本】TWU毕业证认证Q/微:892798920办西三一大学毕业证留信留服使馆公证,TWU硕士毕业证,TWU研究生毕业证,文凭...
【創業簡報練習】當一個人吃飯會想起誰:(A)I-DOLL 陪吃娃娃|科技創業與營運實務
【創業簡報練習】當一個人吃飯會想起誰:(A)I-DOLL 陪吃娃娃|科技創業與營運實務
加急代办一个日本鹿儿岛纯心女子大学学位记🌈学习成绩单电子版定制🌈仿制荷兰大学毕业证🌈日语JLPT证书定制
加急代办一个日本鹿儿岛纯心女子大学学位记🌈学习成绩单电子版定制🌈仿制荷兰大学毕业证🌈日语JLPT证书定制
我了解到黑客在某些领域拥有卓越的技术能力,特别是在处理系统漏洞方面。在当前的情境下,如果我想要改变我的毕业成绩,他们的帮助或许是我唯一可行的选择。【微 t...
我了解到黑客在某些领域拥有卓越的技术能力,特别是在处理系统漏洞方面。在当前的情境下,如果我想要改变我的毕业成绩,他们的帮助或许是我唯一可行的选择。【微 t...
大資料分析技術的濫觴 0727
1.
大資料分析技術的濫觴 Hadoop MapReduce 莊家雋 1
2.
生活中的推薦系統 • YouTube • 博客來
3.
Google流感預測趨勢 3
4.
大資料在食的應用 • 預測與分析社會趨勢 – 食安危機 4
5.
大資料在行的應用 5 • 幫你查即時路況的地理資訊務
6.
電腦不只會選花生,還會選伴侶 6
7.
大資料應用的LIFE CYCLE 7
8.
傳統計算機科學思維 • 有一個問題,找出一個答案 • 傳統的資料處理模式:集中式 •
讓電腦快一千倍,這個問題就解的出來 8 CPU Mem disk CPU Memory disk CPU Memory disk 磁碟陣列
9.
新式計算機科學思維 • 有一堆資料,找出有用的情報 • 給我的資料多一千倍,這個問題才解得出來 •
以電腦翻譯為例: – 傳統方法:字典 + 文法 + 例外 • 干货 vs. 乾貨 or 幹貨… – 統計翻譯:比對同一文章之不同語語版本,建立統計 模式 • 以拼字校正為例: – 傳統方法:建立字典 – Google法:看大家都怎麼打 9
10.
大資料面臨的三個挑戰 10 大資料 的3V Volume: 資料量非常龐大, 單獨的表格、電腦主機 、資料庫無法存放 Velocity: 資料產生的速度太快 ,以致於系統無法即時 提供反應。 Variety: 不同的來源、格式、 類型,資料內容又 包含了不需要的成份。
11.
解決Variety 11 大資料 的3V Volume: 資料量非常龐大, 單獨的表格、電腦主機 、資料庫無法存放 Velocity: 資料產生的速度太快 ,以致於系統無法即時 提供反應。 Variety: 不同的來源、格式、 類型,資料內容又 包含了不需要的成份。
12.
資料來源不夠〝乾淨〞 • 讀取資料、清洗資料 – 非常無趣,且通常要花掉專案80%的時間,但又會影 響到分析的成果 12
13.
無法預期的資料格式與內容 • 使用需事先定義好資料格式的方式不再適合 – 資料庫表格 •
自我描述的資料格式 – Key/value 型式的資料格式 – XML檔案, JSON檔案 – NoSQL HBase資料庫 13
14.
如何透過分散式系統解決Volume 14 大資料 的3V Volume: 資料量非常龐大, 單獨的表格、電腦主機 、資料庫無法存放 Velocity: 資料產生的速度太快 ,以致於系統無法即時 提供反應。 Variety: 不同的來源、格式、 類型,資料內容又 包含了不需要的成份。
15.
計算機科學發展的三個定理 • Moore’s Law –
每18個月晶片效能會提高一倍 • Nielsen Law – 每20個月網路頻寬會增加一倍 • Kryder’s Law – 每13個月相同價格的儲存容量會增加一倍 15
16.
16
17.
樣本 = 母體
時代來臨 • 整體的資料搜集困難,導致統計學的發展 • 抽樣的隨機性決定統計的正確性 • 當樣本 = 母體,要用來處理的資料通常都很大 17
18.
當資料多出1000倍 • 如何儲存這麼多的資料 – 1000億個網頁 –
每個網頁大小20KB – 1000億個網頁 * 20KB = 2000TB • 讀個檔案都要讀到天荒地老 – 硬碟讀取速度:50MB/sec – 讀完全部的網頁:40000000 秒 = 460天 • 更不用想要去處理它 18
19.
一個便當吃不飽,可以吃二個 • 一台機器無法處理,就用多台機器同時處理 – 分散式系統 –
易於橫向擴充,scale-out CPU Memory disk CPU Memory disk CPU Memory disk CPU Memory disk CPU Memory disk CPU Memory disk
20.
分散式系統的挑戰 • CAP定理 – 資料一致性:[C]onsistency –
系統可用系:[A]vailability – 分區容忍性:[P]artition Tolerance • 全世界最大的廣告公司Google – 提出GFS、MapReduce、BigTable等針對大資料應用 的分散式技術 20
21.
自己打造一個分散式系統? • 開發一個分散式系統很難 – 主機間如何溝通 –
系統的可靠性設計 – … – 用人家寫好的很簡單 • Hadoop 生態系 – HDFS – MapReduce – HBase – Hive… 21
22.
分散式檔案系統:HDFS • 在分散式的儲存環境裏,提供單一的目錄系統 • 每個檔案被分割成許多區塊並進行異地備份 22 HDFS檔案1
檔案2
23.
分散式檔案系統:HDFS • 移動運算到資料端比移動資料到運算端來的成本低 – 減少資料搬運,實現在地運算 23 CPU Memory disk 磁碟陣 列
24.
分散式運算系統:MapReduce • 一個問題被分割之後而成的小問題。解決一個問題, 其實就是要解決其所有子問題。 • 分而治之,各個擊破 –
傳統方法 • 分而治之,”同時”各個擊破 – MapReduce • Map:解決每個子問題 • Reduce:將子問題的解答做匯總 • 針對key/value的資料類型做分析 24
25.
台灣最熱衷的全民運動 25 •台北市10個選區,共100萬票,要算出每個候選人的得票數 Id:A151 選2號 Id:B257 選5號 號次 票數 1
1 1 1 3 1 … … 號次 票數 2 1 1 1 … … 號次 票數 3 1 2 1 1 1 號次 票數 1 1 3 1 3 … 號次 票數 3 1 2 1 3 1 監票人1 [負責1區] 監票人2 [負責2區] 監票人3 [負責3區] 監票人4 [負責4區] 監票人5 [負責5區]
26.
號次 票數 1 1 1
1 1 1 1 1 1 … 中選會 [負責 全部的候選人] 號次 票數 5 1 1 1 7 1 … … 號次 票數 2 1 1 1 … … 號次 票數 5 1 2 1 1 1 號次 票數 1 1 5 1 3 … 號次 票數 4 1 2 1 6 1 由各投開票所送到中選會 號次 票數 2 1 2 1 2 1 2 1 2 … 號次 票數 3 1 3 1 3 1 3 1 3 … 26 號次 總票數 1 187532 號次 總票數 2 574821 號次 總票數 3 237647
27.
日誌分析 - Mapper 27 •(k1,
v1) list(k2, v2)
28.
日誌分析 - Reducer 28 •(k2,
list(v2)) (k3,v3)
29.
凡事都有一個BUT • 對已經存在的一大堆資料,提供一個有效的平行運算 機制 – 得到結果所需的時間不夠快 –
通常用在歷史資料分析 – 批次性處理 • 對於快速產生的資料無法立即回應 – 即時性處理 29
30.
如何透過分散式系統解決Velocity 30 大資料 的3V Volume: 資料量非常龐大, 單獨的表格、電腦主機 、資料庫無法存放 Velocity: 資料產生的速度太快 ,以致於系統無法即時 提供反應。 Variety: 不同的來源、格式、 類型,資料內容又 包含了不需要的成份。
31.
即時性資料處理 • 對於即時資訊、訊號需要立馬提供反應 31 步驟1 步驟2
步驟3 步驟4 主機1 主機2 主機3 主機4 主機5
32.
即時處理遇上批次處理 • 由批次處理分析歷史資料 • 由即時處理做出快速回應 32
33.
Yahoo!的PinBall系統 • 結合批次處理與即時處理的優點 – 批次推荐:找出消費者有興趣的產品 –
即時推荐:找出潛在的購買者 33
34.
國網中心提供的服務 • 實體機器Hadoop平台 – HDFS、MapReduce、Hive、HBase •
虛擬機器Hadoop平台:EasyCloud • 建置與開發教育訓練 34
35.
結語 • 大資料應用的重點在資料分析 • 不論是MapRedcue還是Excel,能找出潛在資訊的工 具就是好工具 •
當單一機器無法處理時,可以使用分散式系統的技術 幫助我們 • 國網中心提供Hadoop平台與教育訓練,提供國內學 研界與政府機構使用 35
36.
大資料在衣的應用 • 幫你決定如何如何穿衣的氣象服務 36
37.
大資料在住的應用 • 幫你找房子的地理資訊務 37
Descargar ahora