Skip to content

DARKQUAD/Webscrapping

Repository files navigation

🕸️ Web Scraping Lab – Introduction avec BeautifulSoup

Bienvenue dans le repository GitHub du Lab 4 d’Algorithmique (Master 1 – 2025). Ce projet illustre les fondamentaux et les bonnes pratiques du web scraping en Python, à travers une série d’exercices progressifs réalisés avec BeautifulSoup.

👨‍💻 Auteur : DARKQUAD Passionné par le développement, l’automatisation et la data engineering.

📖 Description

Ce laboratoire explore les techniques d’extraction automatisée de données web et leur traitement. Les bibliothèques principales utilisées sont :

Requests → Requêtes HTTP et gestion des sessions

BeautifulSoup (bs4) → Parsing et exploration du DOM

Pandas & NumPy → Manipulation et analyse des données

🎯 Objectifs pédagogiques

Comprendre la structure du HTML et du DOM

Extraire, nettoyer et structurer les données

Respecter les règles d’éthique et les limites techniques

Implémenter des scrapers robustes et réutilisables

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages