🕸️ Web Scraping Lab – Introduction avec BeautifulSoup
Bienvenue dans le repository GitHub du Lab 4 d’Algorithmique (Master 1 – 2025). Ce projet illustre les fondamentaux et les bonnes pratiques du web scraping en Python, à travers une série d’exercices progressifs réalisés avec BeautifulSoup.
👨💻 Auteur : DARKQUAD Passionné par le développement, l’automatisation et la data engineering.
📖 Description
Ce laboratoire explore les techniques d’extraction automatisée de données web et leur traitement. Les bibliothèques principales utilisées sont :
Requests → Requêtes HTTP et gestion des sessions
BeautifulSoup (bs4) → Parsing et exploration du DOM
Pandas & NumPy → Manipulation et analyse des données
🎯 Objectifs pédagogiques
Comprendre la structure du HTML et du DOM
Extraire, nettoyer et structurer les données
Respecter les règles d’éthique et les limites techniques
Implémenter des scrapers robustes et réutilisables