JobSpy/src/jobspy/scrapers/__init__.py

from __future__ import annotations

from ..jobs import (
    Enum,
    BaseModel,
    JobType,
    JobResponse,
    Country,
    DescriptionFormat,
)


class Site(Enum):
    LINKEDIN = "linkedin"
    INDEED = "indeed"
    ZIP_RECRUITER = "zip_recruiter"
    GLASSDOOR = "glassdoor"


class ScraperInput(BaseModel):
    site_type: list[Site]
    search_term: str | None = None

    location: str | None = None
    country: Country | None = Country.USA
    distance: int | None = None
    is_remote: bool = False
    job_type: JobType | None = None
    easy_apply: bool | None = None
    offset: int = 0
    linkedin_fetch_description: bool = False
    linkedin_company_ids: list[int] | None = None
    description_format: DescriptionFormat | None = DescriptionFormat.MARKDOWN

    results_wanted: int = 15
    hours_old: int | None = None


class Scraper:
    def __init__(self, site: Site, proxy: list[str] | None = None):
        self.site = site
        self.proxy = (lambda p: {"http": p, "https": p} if p else None)(proxy)

    def scrape(self, scraper_input: ScraperInput) -> JobResponse: ...
format: Apply Black formatter to the codebase (#127) 2024-03-10 21:36:27 -07:00			`from __future__ import annotations`

Description format (#107) 2024-02-14 14:04:23 -08:00			`from ..jobs import (`
			`Enum,`
			`BaseModel,`
			`JobType,`
			`JobResponse,`
			`Country,`
format: Apply Black formatter to the codebase (#127) 2024-03-10 21:36:27 -07:00			`DescriptionFormat,`
Description format (#107) 2024-02-14 14:04:23 -08:00			`)`
- scraper init 2023-07-06 17:12:01 -07:00

			`class Site(Enum):`
			`LINKEDIN = "linkedin"`
			`INDEED = "indeed"`
			`ZIP_RECRUITER = "zip_recruiter"`
add glassdoor (#66) 2023-10-30 17:57:36 -07:00			`GLASSDOOR = "glassdoor"`
- scraper init 2023-07-06 17:12:01 -07:00

			`class ScraperInput(BaseModel):`
enh(linkedin): search by company ids (#99) 2024-02-04 07:21:45 -08:00			`site_type: list[Site]`
			`search_term: str \| None = None`
feat(jobs): filter by is_remote 2023-07-11 03:42:20 -07:00
enh(linkedin): search by company ids (#99) 2024-02-04 07:21:45 -08:00			`location: str \| None = None`
			`country: Country \| None = Country.USA`
			`distance: int \| None = None`
feat(jobs): filter by is_remote 2023-07-11 03:42:20 -07:00			`is_remote: bool = False`
enh(linkedin): search by company ids (#99) 2024-02-04 07:21:45 -08:00			`job_type: JobType \| None = None`
			`easy_apply: bool \| None = None`
add offset param & email extraction (#51) * add offset param * [enh]: extract emails 2023-09-28 16:11:28 -07:00			`offset: int = 0`
Description format (#107) 2024-02-14 14:04:23 -08:00			`linkedin_fetch_description: bool = False`
enh(linkedin): search by company ids (#99) 2024-02-04 07:21:45 -08:00			`linkedin_company_ids: list[int] \| None = None`
Description format (#107) 2024-02-14 14:04:23 -08:00			`description_format: DescriptionFormat \| None = DescriptionFormat.MARKDOWN`
- api/jobs/v1 schema change 2023-07-10 16:04:44 -07:00
feat(jobs): remove pages for results_wanted 2023-07-10 20:07:19 -07:00			`results_wanted: int = 15`
feat: Ability to query by time posted for linkedin, indeed, glassdoor, ziprecruiter (#103) 2024-02-09 12:02:03 -08:00			`hours_old: int \| None = None`
- scraper init 2023-07-06 17:12:01 -07:00

feat(jobs): remove pages for results_wanted 2023-07-10 20:07:19 -07:00			`class Scraper:`
enh(linkedin): search by company ids (#99) 2024-02-04 07:21:45 -08:00			`def __init__(self, site: Site, proxy: list[str] \| None = None):`
- scraper init 2023-07-06 17:12:01 -07:00			`self.site = site`
Proxy support (#44) * add proxy support * return as data frame 2023-09-07 09:28:17 -07:00			`self.proxy = (lambda p: {"http": p, "https": p} if p else None)(proxy)`
- scraper init 2023-07-06 17:12:01 -07:00
feat: Ability to query by time posted for linkedin, indeed, glassdoor, ziprecruiter (#103) 2024-02-09 12:02:03 -08:00			`def scrape(self, scraper_input: ScraperInput) -> JobResponse: ...`