Skip to content

Instantly share code, notes, and snippets.

@farukyildiz
Created July 18, 2017 11:28
Show Gist options
  • Save farukyildiz/cf7e899a3335c948b1b295e4b53f0c36 to your computer and use it in GitHub Desktop.
Save farukyildiz/cf7e899a3335c948b1b295e4b53f0c36 to your computer and use it in GitHub Desktop.
Hadoop?
Java ile yazılmış açık kaynak kodlu bir kütüphane olan Hadoop ile büyük veriler üzerinde çalışmalar yapılabilmektedir.
Bu makine birden fazla makine üzerinde verileri saklayıp işlemektedir.
Hadoop büyük verileri HDFS sistemi ile saklamaktadır. İlk olarak sisteme veriler yüklenirken bloklara ayrılmaktadır.
Bloklara ayrılan veriler Hadoop Cluster üzerinden farklı düğümlere (node) yada farklı makinalara dağılmaktadır.
Bu dağıtma işleminde bloklanmış veriler çoğullanmış bir şekilde yani parçalanmış düğümler örnek vermek gerekirse 3. ve 8. düğümde
de bulunabilmektedir. Burada ki amaç herhangi bir beklenmedik durumda veri kaybının yaşanmamasıdır.
Hadoop framework büyük verileri paralel olarak işlemektedir. Bu işlem MapReduce ile yapılmaktadır.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment