Учебный парсер ScrapyPEP

ScrapyPEP-парсер - парсер документов PEP на базе фреймворка Scrapy

Технологии:

Python 3.11
Scrapy 2.5.1

Описание

Парсер собирает информацию с сайтов документации Python и документов PEP.
Информация выводится в виде двух файлов .csv:

первый файл содержит список всех PEP: номер, название и статус.
второй файл содержит сводку по статусам PEP — сколько найдено документов в каждом статусе.

Запуск парсера

$ scrapy crawl pep

После запуска парсера будет создана папка results с двумя csv-файлами.

Как развернуть проект на компьютере:

Клонировать репозиторий c GitHub на компьютер

$ git clone https://github.com/DashaMalva/scrapy_parser_pep.git

Создать и активировать виртуальное окружение

$ python -m venv venv
$ source venv/Scripts/activate

Обновить менеджер пакетов pip

$ python -m pip install --upgrade pip

Установить зависимости из requirements.txt

$ pip install -r requirements.txt

Лицензия

The MIT License (MIT)

Автор проекта

Студент Яндекс.Практикум,
Дарья Матвиевская

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Учебный парсер ScrapyPEP

Технологии:

Описание

Запуск парсера

Как развернуть проект на компьютере:

Лицензия

Автор проекта

About

Releases

Packages

Languages

DashaMalva/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Учебный парсер ScrapyPEP

Технологии:

Описание

Запуск парсера

Как развернуть проект на компьютере:

Лицензия

Автор проекта

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages