Како преузети & амп; Инсталирајте НЛТК на Виндовс / Мац

Преглед садржаја:

Anonim

У овом упутству ћете научити -

  • Инсталирање НЛТК у Виндовс
  • Инсталирање Питхона у Виндовс
  • Инсталирање НЛТК у Мац / Линук
  • Инсталирање НЛТК преко Анацонде
  • НЛТК скуп података
  • Како преузети све пакете НЛТК
  • Покретање НЛП скрипте
  • Како покренути НЛТК скрипту

Инсталирање НЛТК у Виндовс

У овом делу ћемо научити како извршити подешавање НЛТК путем терминала (командна линија у прозору).

Доња упутства се заснивају на претпоставци да немате инсталиран питхон. Дакле, први корак је инсталирање питхон-а.

Инсталирање Питхона у Виндовс:

Корак 1) Иди на повеже хттпс://ввв.питхон.орг/довнлоадс/ , и изаберите најновију верзију за прозоре.

Напомена : Ако не желите да преузмете најновију верзију, можете посетити картицу за преузимање и видети сва издања.

Корак 2) Кликните на преузету датотеку

Корак 3) Изаберите Прилагоди инсталацију

Корак 4) Кликните ДАЉЕ

Корак 5) На следећем екрану

  1. Изаберите напредне опције
  2. Дајте прилагођену локацију за инсталирање. У мом случају је изабрана фасцикла на Ц диску ради лакшег рада
  3. Кликните Инсталирај

Корак 6) По завршетку инсталације кликните на дугме Затвори.

Корак 7) Копирајте путању до своје мапе Сцриптс.

Корак 8) У Виндовс командној линији

  • Дођите до места директоријума пип
  • Унесите команду за инсталирање НЛТК
    pip3 install nltk
  • Инсталацију треба обавити успешно

НАПОМЕНА : За Питхон2 користите наредбупип2 инсталл нлтк

Корак 9) У Виндовс менију Старт претражите и отворите ПитхонСхелл

Корак 10) Можете да проверите да ли је инсталација тачна пружајући наредбу испод

import nltk

Ако не видите грешку, инсталација је завршена.

Инсталирање НЛТК у Мац / Линук

Инсталација НЛТК у Мац / Уник захтева питхон манагер пакета пип да инсталира нлтк. Ако пип није инсталиран, следите упутства у наставку да бисте довршили поступак

Корак1) Ажурирајте индекс пакета тако што ћете откуцати наредбу испод

sudo apt update

Корак 2) Инсталирање пипа за Питхон 3:

sudo apt install python3-pip

Такође можете инсталирати пип користећи еаси_инсталл.

sudo apt-get install python-setuptools python-dev build-essential 

Сада је инсталирана еаси_инсталл. Покрените доњу команду да бисте инсталирали пип

sudo easy_install pip

Корак 3) Користите следећу команду за инсталирање НЛТК

sudo pip install -U nltksudo pip3 install -U nltk

Инсталирање НЛТК преко Анацонде

Корак 1) Инсталирајте анацонду (која се такође може користити за инсталирање различитих пакета) тако што ћете посетити хттпс://ввв.анацонда.цом/продуцтс/индивидуал и изаберите коју верзију питхона треба да инсталирате за анацонду.

Напомена: Погледајте ово упутство за детаљне кораке за инсталирање анацонде

Корак 2) У одзиву Анацонда,

  1. Ентер цомманд
    conda install -c anaconda nltk
  2. Прегледајте надоградњу пакета, пређите на старију верзију, инсталирајте информације и унесите да
  3. НЛТК се преузима и инсталира

НЛТК скуп података

НЛТК модул има на располагању мноштво скупова података које треба да преузмете да бисте их користили. Технички се назива корпус . Неки од примера су стопвордс , Гутенберг , фраменет_в15 , ларге_граммарс и тако даље.

Како преузети све пакете НЛТК

Корак 1) Покрените Питхон интерпретер у оперативном систему Виндовс или Линук

Корак 2)

  1. Унесите команде
import nltknltk.download ()
  1. Отворен прозор преузетог са НЛТК-а. Кликните дугме за преузимање да бисте преузели скуп података. Овај процес ће потрајати, на основу ваше интернет везе

НАПОМЕНА: Место преузимања можете променити тако што ћете кликнути на Филе> Цханге Довнлоад Дирецтори

Корак 3) Да бисте тестирали инсталиране податке, користите следећи код

>>> from nltk.corpus import brown>>>brown.words()

['Тхе', 'Фултон', 'Цоунти', 'Гранд', 'порота', 'рекао', ...]

Покретање НЛП скрипте

Разговараћемо о томе како ће се НЛП скрипта извршавати на нашем локалном рачунару. На тржишту постоје многе библиотеке за обраду природних језика. Дакле, избор библиотеке зависи од ваших потреба. Ево листе НЛП библиотека.

Како покренути НЛТК скрипту

1. корак) У омиљеном уређивачу кода копирајте код и сачувајте датотеку као НЛТКсампле.пи

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Објашњење кода:

  1. Циљ овог програма био је уклонити све врсте интерпункција из датог текста. Увезли смо „РегекпТокенизер“ који је модул НЛТК. Уклања све изразе, симболе, знакове, бројеве или било шта што желите.
  2. Управо сте предали редовни израз модулу „РегекпТокенизер“.
  3. Даље, токенизовали смо реч користећи модул „токенизе“. Излаз се чува у променљивој "филтердТект".
  4. И одштампали их помоћу „принт ().“

Корак2) У командној линији

  • Дођите до локације на којој сте сачували датотеку
  • Покрените наредбу Питхон НЛТКсампле.пи

Ово ће приказати излаз као:

[„Здраво“, „Гуру99“, „Ти“, „имаш“, „градиш“, „а“, „врло“, „добро“, „сајт“, „и„, „Ја“, „волим“, „ посетите ',' иоур ',' сите ']