У овом водичу водићемо вас кроз корак по корак како бисте инсталирали Апацхе Хадооп на Линук бокс (Убунту). Ово је дводелни процес
- 1. део) Преузмите и инсталирајте Хадооп
- 2. део) Конфигуришите Хадооп
Постоје 2 предуслова
- Морате имати инсталиран и покренут Убунту
- Морате имати инсталирану Јаву.
1. део) Преузмите и инсталирајте Хадооп
Корак 1) Додајте корисника система Хадооп помоћу наредбе испод
sudo addgroup hadoop_
sudo adduser --ingroup hadoop_ hduser_
Унесите лозинку, име и друге детаље.
НАПОМЕНА: Постоји могућност доле поменуте грешке у овом процесу подешавања и инсталације.
"хдусер није у досијеу судоерс-а. Овај инцидент ће бити пријављен."
Ову грешку може решити Пријава као основни корисник
Извршите наредбу
sudo adduser hduser_ sudo
Re-login as hduser_
Корак 2) Конфигуришите ССХ
Да би управљао чворовима у кластеру, Хадооп захтева ССХ приступ
Прво пребаците корисника, унесите следећу команду
su - hduser_
Ова наредба ће створити нови кључ.
ssh-keygen -t rsa -P ""
Омогућите ССХ приступ локалној машини помоћу овог кључа.
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
Сада тестирајте ССХ подешавање повезивањем на лоцалхост као 'хдусер' корисник.
ssh localhost
Напомена: Имајте на уму, ако доле видите грешку као одговор на 'ссх лоцалхост', онда постоји могућност да ССХ није доступан на овом систему-
Да бисте ово решили -
Очистити ССХ користећи,
sudo apt-get purge openssh-server
Добра је пракса очистити пре почетка инсталације
Инсталирајте ССХ помоћу наредбе-
sudo apt-get install openssh-server
Корак 3) Следећи корак је преузимање Хадооп-а
Изаберите Стабле
Изаберите датотеку тар.гз (не датотеку са срц)
Када се преузимање заврши, дођите до директоријума који садржи тар датотеку
Ентер,
sudo tar xzf hadoop-2.2.0.tar.gz
Сада преименујте хадооп-2.2.0 у хадооп
sudo mv hadoop-2.2.0 hadoop
sudo chown -R hduser_:hadoop_ hadoop
2. део) Конфигуришите Хадооп
Корак 1) Измените датотеку ~ / .басхрц
Додајте следеће редове на крај датотеке ~ / .басхрц
#Set HADOOP_HOMEexport HADOOP_HOME=#Set JAVA_HOMEexport JAVA_HOME= # Add bin/ directory of Hadoop to PATHexport PATH=$PATH:$HADOOP_HOME/bin
Сада изворите ову конфигурацију окружења помоћу наредбе испод
. ~/.bashrc
Корак 2) Конфигурације повезане са ХДФС-ом
Подесите ЈАВА_ХОМЕ унутар датотеке $ ХАДООП_ХОМЕ / етц / хадооп / хадооп-енв.сх
Са
У $ ХАДООП_ХОМЕ / етц / хадооп / цоре-сите.кмл постоје два параметра која треба подесити-
1. 'хадооп.тмп.дир' - Користи се за одређивање директоријума који ће Хадооп користити за чување својих датотека података.
2. 'фс.дефаулт.наме' - Ово наводи задати систем датотека.
Да бисте поставили ове параметре, отворите цоре-сите.кмл
sudo gedit $HADOOP_HOME/etc/hadoop/core-site.xml
Копирајте доњи ред између ознака <цонфигуратион> цонфигуратион>
hadoop.tmp.dir /app/hadoop/tmp Parent directory for other temporary directories. fs.defaultFS hdfs://localhost:54310 The name of the default file system.
Идите до директоријума $ ХАДООП_ХОМЕ / етц / Хадооп
Сада креирајте директоријум поменут у цоре-сите.кмл
sudo mkdir -p
Доделите дозволе директоријуму
sudo chown -R hduser_:Hadoop_
sudo chmod 750
Корак 3) Конфигурација смањења мапе
Пре него што започнете са овим конфигурацијама, дозволите да подесимо путању ХАДООП_ХОМЕ
sudo gedit /etc/profile.d/hadoop.sh
И Ентер
export HADOOP_HOME=/home/guru99/Downloads/Hadoop
Следећи ентер
sudo chmod +x /etc/profile.d/hadoop.sh
Изађите из терминала и поново га покрените
Откуцајте ецхо $ ХАДООП_ХОМЕ. Да бисте верификовали путању
Сада копирајте датотеке
sudo cp $HADOOP_HOME/etc/hadoop/mapred-site.xml.template $HADOOP_HOME/etc/hadoop/mapred-site.xml
Отворите мапред-сите.кмл филе
sudo gedit $HADOOP_HOME/etc/hadoop/mapred-site.xml
Додајте доње редове подешавања између ознака <цонфигуратион> и цонфигуратион>
mapreduce.jobtracker.address localhost:54311 MapReduce job tracker runs at this host and port.
Отворите $ ХАДООП_ХОМЕ / етц / хадооп / хдфс-сите.кмл као доле,
sudo gedit $HADOOP_HOME/etc/hadoop/hdfs-site.xml
Додајте доње редове подешавања између ознака <цонфигуратион> и цонфигуратион>
dfs.replication 1 Default block replication. dfs.datanode.data.dir /home/hduser_/hdfs
Направите директоријум наведен у горњем подешавању-
sudo mkdir -p
sudo mkdir -p /home/hduser_/hdfs
sudo chown -R hduser_:hadoop_
sudo chown -R hduser_:hadoop_ /home/hduser_/hdfs
sudo chmod 750
sudo chmod 750 /home/hduser_/hdfs
Корак 4) Пре него што први пут покренемо Хадооп, форматирајте ХДФС помоћу наредбе испод
$HADOOP_HOME/bin/hdfs namenode -format
Корак 5) Покрените Хадооп кластер појединачних чворова помоћу наредбе испод
$HADOOP_HOME/sbin/start-dfs.sh
Излаз горе наведене наредбе
$HADOOP_HOME/sbin/start-yarn.sh
Помоћу алата / команде 'јпс' проверите да ли су сви процеси повезани са Хадооп-ом покренути или не.
Ако је Хадооп успешно започео, онда би излаз јпс требао приказати НамеНоде, НодеМанагер, РесоурцеМанагер, СецондариНамеНоде, ДатаНоде.
Корак 6) Заустављање Хадооп-а
$HADOOP_HOME/sbin/stop-dfs.sh
$HADOOP_HOME/sbin/stop-yarn.sh