Skip to content

Учебный проект на Scrapy, парсит PEP, выводит в 2х форматах

Notifications You must be signed in to change notification settings

andmerk93/scrapy_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проект асинхронного парсинга pep

Описание

Учебный проект на Scrapy, позволяет спрасить и сохранить в файл следующее:

  • Список актуальных PEP: номера, названия и статусы
  • Статистику статусов PEP

Требования:

  • Python 3
  • Scrapy
  • lxml
  • и их зависимости (описано в requirements.txt)

Установка и запуск:

  • клонировать репозиторий на машину, с которой будет будет запускаться сервис
git clone https://github.com/andmerk93/scrapy_parser_pep.git
  • На машине должен быть установлен Python актуальной версии (тестировалось на 3.11)
  • развернуть виртуальное окружение python в папке с проектом (scrapy_parser_pep)
python3 -m venv venv
  • активировать виртуальное окружение для linux/unix
source ./venv/bin/activate 
  • для Windows, должно быть разрешено выполнение скриптов Powershell
venv\Scripts\activate
  • с запущенным виртуальным окружением нужно выполнить установку требуемых компонентов
pip install -r requirements.txt
  • затем, выполнить команду
scrapy crawl pep

Файлы с результатами появятся в папке results

About

Учебный проект на Scrapy, парсит PEP, выводит в 2х форматах

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages