Enviar búsqueda
Cargar
آشنایی با Hadoop
•
3 recomendaciones
•
500 vistas
nasser rezaei
Seguir
قسمت اول از مجموعه اسلاید های آموزش Hadoop و تکنیک های وابسته
Leer menos
Leer más
Datos y análisis
Denunciar
Compartir
Denunciar
Compartir
1 de 10
Descargar ahora
Descargar para leer sin conexión
Recomendados
Yarn مروری بر
Yarn مروری بر
nasser rezaei
مدل MapReduce
مدل MapReduce
nasser rezaei
ورودی خروجی Hadoop
ورودی خروجی Hadoop
nasser rezaei
سیستم فایل HDFS
سیستم فایل HDFS
nasser rezaei
Introduction to Apache Hadoop in Persian - آشنایی با هدوپ
Introduction to Apache Hadoop in Persian - آشنایی با هدوپ
Mobin Ranjbar
Recovery in gnu/linux
Recovery in gnu/linux
Yashar Esmaildokht
Apache spark
Apache spark
Majid Golghandashti
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
Farafekr Technology
Recomendados
Yarn مروری بر
Yarn مروری بر
nasser rezaei
مدل MapReduce
مدل MapReduce
nasser rezaei
ورودی خروجی Hadoop
ورودی خروجی Hadoop
nasser rezaei
سیستم فایل HDFS
سیستم فایل HDFS
nasser rezaei
Introduction to Apache Hadoop in Persian - آشنایی با هدوپ
Introduction to Apache Hadoop in Persian - آشنایی با هدوپ
Mobin Ranjbar
Recovery in gnu/linux
Recovery in gnu/linux
Yashar Esmaildokht
Apache spark
Apache spark
Majid Golghandashti
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
1st Hadoop Tehran Workshop - اسلاید اولین کارگاه آموزش هدوپ تهران
Farafekr Technology
بیگ دیتا
بیگ دیتا
Hamed Azizi
Redis.
Redis.
ssuser3b04d0
Raid
Raid
Amir hosseinnemat
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
Web Standards School
how upgrade ceph
how upgrade ceph
Yashar Esmaildokht
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Mobin Ranjbar
Image processing
Image processing
soheyl arab
how enable ceph dashboard
how enable ceph dashboard
Yashar Esmaildokht
IranOUG_Oracle_Multitenant
IranOUG_Oracle_Multitenant
Oracle Freelancer
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
aminnezarat
Big Data and select suitable tools
Big Data and select suitable tools
Meghdad Hatami
rbdmap in ceph
rbdmap in ceph
Yashar Esmaildokht
Pg autoscaling in ceph
Pg autoscaling in ceph
Yashar Esmaildokht
Rbdmap ceph realease 0.2
Rbdmap ceph realease 0.2
Yashar Esmaildokht
Big Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing Environments
Farzad Nozarian
cloud services for libraries
cloud services for libraries
mahboubeh ghorbani
Introduction to oracle
Introduction to oracle
Ehsan Hamzei
Disk DBMS
Disk DBMS
Mahmood Neshati (PhD)
Oracle ADF Presentation
Oracle ADF Presentation
Farzad Babamiri
Openstack Overview
Openstack Overview
Farzad M. Zaravand
Más contenido relacionado
Similar a آشنایی با Hadoop
بیگ دیتا
بیگ دیتا
Hamed Azizi
Redis.
Redis.
ssuser3b04d0
Raid
Raid
Amir hosseinnemat
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
Web Standards School
how upgrade ceph
how upgrade ceph
Yashar Esmaildokht
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Mobin Ranjbar
Image processing
Image processing
soheyl arab
how enable ceph dashboard
how enable ceph dashboard
Yashar Esmaildokht
IranOUG_Oracle_Multitenant
IranOUG_Oracle_Multitenant
Oracle Freelancer
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
aminnezarat
Big Data and select suitable tools
Big Data and select suitable tools
Meghdad Hatami
rbdmap in ceph
rbdmap in ceph
Yashar Esmaildokht
Pg autoscaling in ceph
Pg autoscaling in ceph
Yashar Esmaildokht
Rbdmap ceph realease 0.2
Rbdmap ceph realease 0.2
Yashar Esmaildokht
Big Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing Environments
Farzad Nozarian
cloud services for libraries
cloud services for libraries
mahboubeh ghorbani
Introduction to oracle
Introduction to oracle
Ehsan Hamzei
Disk DBMS
Disk DBMS
Mahmood Neshati (PhD)
Oracle ADF Presentation
Oracle ADF Presentation
Farzad Babamiri
Openstack Overview
Openstack Overview
Farzad M. Zaravand
Similar a آشنایی با Hadoop
(20)
بیگ دیتا
بیگ دیتا
Redis.
Redis.
Raid
Raid
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
توسعه نرمافزارهای مقیاسپذیر بر اساس معماری ریزسرویسها (Microservices) و اجر...
how upgrade ceph
how upgrade ceph
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Introduction to Hadoop and Spark - اسلاید کارگاه آموزش هدوپ و اسپارک شیراز
Image processing
Image processing
how enable ceph dashboard
how enable ceph dashboard
IranOUG_Oracle_Multitenant
IranOUG_Oracle_Multitenant
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
06 hpc library_fundamentals_of_parallelism_and_code_optimization-www.astek.ir
Big Data and select suitable tools
Big Data and select suitable tools
rbdmap in ceph
rbdmap in ceph
Pg autoscaling in ceph
Pg autoscaling in ceph
Rbdmap ceph realease 0.2
Rbdmap ceph realease 0.2
Big Data Processing in Cloud Computing Environments
Big Data Processing in Cloud Computing Environments
cloud services for libraries
cloud services for libraries
Introduction to oracle
Introduction to oracle
Disk DBMS
Disk DBMS
Oracle ADF Presentation
Oracle ADF Presentation
Openstack Overview
Openstack Overview
آشنایی با Hadoop
1.
با آشناییHadoop رضاییناصر nasser.rezaei.novin@gmail.com
2.
مقدمه •کنیم می زندگی
اطالعاتعصر در ما. •سال تا شود می بینی پیش2020به الکترونیکی صورت به شده ذخیره اطالعات انزمی44زتابایت(زتابایتهر 1027 ابایترت میلیارد یک یا بایت)برسد. •Facebookمیزبان240ماههر که استتصویر میلیارد7پتابایت(7ابایترت هزار)کند می پیدا افزایش. •اینترنت آرشیو 1 حدود18.5است کرده سازی ذخیره را اطالعات پتابایت. •Hadoopتوسط کهApacheاست شده توزیع پردازشبر مبتنی سیستمی است شده سازی پیاده. 1 www.archive.org
3.
ها داده تحلیل
و سازی ذخیره •ک رشد نرخ ها هارددیسک سازی ذخیره فضای افزایش به نسبت ها هارددیسک خواندن سرعت افزایشمتری است داشته. •است شدهبیشتر بسیار گذشته نسبت به دیسک اطالعات تمام خواندن ایرب نیاز مورد زمان امروزه.حدود از5سال در دقیقه1990تا2.5ایرب ساعت امروزی معمولی های هاردیسک. •است نوشتن و خواندن سرعت افزایش ایرب همزمان صورت به دیسک چند از استفاده شده ارائه راهکار.
4.
همزمان خواندن چالش
دو •1-اریزاف سخت نقص •کند می پیدا افزایشنیز افزاری سخت نقص احتمال استفاده مورد افزارهای سخت تعداد افزایش با. •های دیسک به شبیه چیزی ،تعمدی افزونگی همان یا ها داده از کپی چند از استفاده شده ارائه حل راهRAIDاست. •HadoopازHDFS 1 کند می استفاده. •2-شوند ادغامیکدیگر با طریقی به ها داده که آنند نیازمند تحلیلی های پردازش اغلب •MapReduceمحاسب به دیسک روی نوشتن و خواندن های عملیات از را مساله این که کند می استفاده انتزاعی مدل ازه کلید از ای مجموعه-کند می تبدیل ها مقدار.MapReduceتشکیل شوند می اراج هم دنبال به موارداکثر در که عملیات دو از است شده:MapوReduce. 1 Hadoop Distributed FileSystem
5.
ای دسته پردازش •MapReduceکند
می استفاده ای دسته پردازش مدل از.تمام روی را جو و پرس یکdatasetو دهد می انجام رسد می نتیجه به قبولی قابل زمان در. •پردازش ای دسته ذات دلیل بهMapReduceنیست مناسب ای محاوره های کاربرد ایرب ،.
6.
توسعهHadoop •آفالین دلیل به(ای
محاورهغیر)بودنHadoopتوسط زیادی های توسعه ،Apacheآن روی ها سازمانسایر و است شده انجام. •دیتابیسHBaseکند می اهمرف را آنالین دستیابی که.کلید مدل از-دا سازی ذخیره ایرب که کند می استفاده مقداراز ها ده HDFSکند می استفاده.HBaseبرد می بهره ای دسته پردازش از هم و ها رکورد به آنالین دستیابی از هم. •YARN 1 :کالستر روی اراج امکان شده توزیع های افزار نرم به که استکالستر مدیریت سیستمHadoopدهد می را. 1 Yet Another Resource Negotiator
7.
با شده سازگار
پردازشی الگوهایHadoop •SQLای محاوره •توزیع باMapReduceفعال اختصاصی جوی و جست موتور از استفاده و(مثلImpla)از استفاده یاHiveرویTez. •ای محاوره پردازش •اند شونده اررتک ذاتا ماشینی یادگیری های الگوریتم مانند ها الگوریتم از خیلی.صو در ها آن کارایی اینربنابدستههر که رتی کند می پیدا گیری چشم افزایش ،بگیرد اررق حافظه در نیاز مورد داده.Sparkکند می اهمرف را قابلیت این. •جریانی پردازش 1 مثل جریانی های سیستمStormوSpark StreamingوSamzaکنند می اهمرف را بالدرنگ شده توزیع محاسبات امکان ،. •جو و جست •جوی و جست پلتفرمSolrکالستر یک روی تواند میHadoopشود اراج. 1 Stream Processing
8.
و ای رابطه
داده پایگاهMapReduce 1 Atomicity, Consistency, Isolation, Durability MapReduce پایگاهای رابطه داده پتابایت چند گیگابایت چند اندازهداده دستهای محاورهای دسته و ای دستیابی ،بار یک نوشتنتعدا به خواندنزیاد د زیاد تعداد به نوشتن و خواندن رسانی بروز محدودیت بدون ACID 1 ها اکنشرت قالبخواندن هنگام بندی بندی قالبنوشتن هنگام ساختار کم زیاد جامعیت خطی غیرخطی اندازهتغییر های سیستمHadoopمثلHiveان رفته پیش شدن ای محاوره سمت بهبیشتر ها اکنشرت و ایندکس افزودن باد.
9.
افزونگی و یافتگی
ساختار •یافته ساخت های دادهمثلXMLحوزه در هستند ای شده تعیین پیش از قالب دارای کهRDBMSمی اررق ندرگی. •یافته ساخت نیم های دادهن قدرتمند ها ساختار روی محدودیت اما باشند ساختاری دارای است ممکنیست ها گسترده صفحه مثل. •ساختار بدون های دادهتصاویر یا ساده متنی های فایل مثل. •Hadoopبرخالف و کند می مدیریت را ساختار بدون و یافته ساخت نیم های داده خوبی بهRDBMSروی سنگینی بارگذاری ندارد ها داده. •شود می رعایت ها داده پایگاه افزونگی حذف و کردن کم در معموال سازی نرمال.در که صورتی درHadoop آوریم می پدید عامدانه افزونگی ،ها داده سریع خواندن و محلیغیر دسترسی از جلوگیری ایرب. •درHadoopکند می پیدا افزایش خطی صورت به ها آن پردازش و ها داده.ایرب که صورتی درSQLخطیغیر است.
10.
منابع • White, Tom.
Hadoop: The definitive guide, 4th edition. " O'Reilly Media, Inc.", 2015.
Descargar ahora