pass test

indeed:remove tpe
2026-03-04 19:44:30 -08:00 · 2024-10-19 18:01:02 -05:00 · 2024-10-19 17:58:26 -05:00 · 2024-10-19 17:55:36 -05:00
3 changed files with 930 additions and 991 deletions
--- a/poetry.lock
+++ b/poetry.lock
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -1,6 +1,6 @@
 [tool.poetry]
 name = "python-jobspy"
-version = "1.1.72"
+version = "1.1.70"
 description = "Job scraper for LinkedIn, Indeed, Glassdoor & ZipRecruiter"
 authors = ["Zachary Hampton <zachary@bunsly.com>", "Cullen Watson <cullen@bunsly.com>"]
 homepage = "https://github.com/Bunsly/JobSpy"
@@ -19,7 +19,7 @@ pandas = "^2.1.0"
 NUMPY = "1.26.3"
 pydantic = "^2.3.0"
 tls-client = "^1.0.1"
-markdownify = "^0.13.1"
+markdownify = "^0.11.6"
 regex = "^2024.4.28"


--- a/src/jobspy/scrapers/indeed/init.py
+++ b/src/jobspy/scrapers/indeed/init.py
@@ -69,8 +69,15 @@ class IndeedScraper(Scraper):
        page = 1

        cursor = None
+        offset_pages = math.ceil(self.scraper_input.offset / 100)
+        for _ in range(offset_pages):
+            logger.info(f"skipping search page: {page}")
+            __, cursor = self._scrape_page(cursor)
+            if not __:
+                logger.info(f"found no jobs on page: {page}")
+                break

-        while len(self.seen_urls) < scraper_input.results_wanted + scraper_input.offset:
+        while len(self.seen_urls) < scraper_input.results_wanted:
            logger.info(
                f"search page: {page} / {math.ceil(scraper_input.results_wanted / 100)}"
            )
@@ -80,12 +87,7 @@ class IndeedScraper(Scraper):
                break
            job_list += jobs
            page += 1
-        return JobResponse(
-            jobs=job_list[
-                scraper_input.offset : scraper_input.offset
-                + scraper_input.results_wanted
-            ]
-        )
+        return JobResponse(jobs=job_list[: scraper_input.results_wanted])

    def _scrape_page(self, cursor: str | None) -> Tuple[list[JobPost], str | None]:
        """
Author	SHA1	Message	Date
Cullen Watson	9c43f82fb1	pass test	2024-10-19 18:01:02 -05:00
Cullen Watson	6ba571f5e4	pass test	2024-10-19 17:58:26 -05:00
Cullen Watson	b43289fa38	indeed:remove tpe	2024-10-19 17:55:36 -05:00