Feat/multiple sites (#12)

* adding multiple search sites * updating docs and postman * threading per scraper type
2026-03-05 12:04:33 -08:00 · 2023-08-26 12:28:02 -07:00
parent d67383f053
commit 4d04bb63e2
6 changed files with 34 additions and 11 deletions
--- a/api/v1/jobs/init.py
+++ b/api/v1/jobs/init.py
@@ -1,9 +1,11 @@
+from concurrent.futures import ThreadPoolExecutor
 from fastapi import APIRouter

 from api.core.scrapers.indeed import IndeedScraper
 from api.core.scrapers.ziprecruiter import ZipRecruiterScraper
 from api.core.scrapers.linkedin import LinkedInScraper
 from api.core.scrapers import ScraperInput, Site, JobResponse
+from typing import List

 router = APIRouter(prefix="/jobs", tags=["jobs"])

@@ -14,11 +16,14 @@ SCRAPER_MAPPING = {
 }


-@router.post("/", response_model=JobResponse)
-async def scrape_jobs(scraper_input: ScraperInput):
-    scraper_class = SCRAPER_MAPPING[scraper_input.site_type]
-    scraper = scraper_class()
+@router.post("/", response_model=List[JobResponse])
+async def scrape_jobs(scraper_input: ScraperInput) -> List[JobResponse]:
+    def scrape_site(site: str) -> JobResponse:
+        scraper_class = SCRAPER_MAPPING[site]
+        scraper = scraper_class()
+        return scraper.scrape(scraper_input)

-    job_response = scraper.scrape(scraper_input)
+    with ThreadPoolExecutor() as executor:
+        resp = list(executor.map(scrape_site, scraper_input.site_type))

-    return job_response
+    return resp