Парсинг (Selenium, Beautiful Soup 4, Scrapy), опыт обхода блокировок по IP/капчи.
БД (SQL, PostgreSQL) — индексы, транзакции, понимание/опыт оптимизации сложных запросов, будет плюсом опыт использования различных ORM (SQLAlchemy и др.).
Знание и понимание алгоритмов сопоставления текстовых данных (fuzzywuzzy).