Skip to content

Commit f986d78

Browse files
committed
update git
1 parent c5c3e9a commit f986d78

39 files changed

+18
-24
lines changed

.gitignore

100644100755
File mode changed.

Prétraitement_ETL/ajout_word_classif.R

100644100755
File mode changed.

Prétraitement_ETL/clean_geocodage.R

100644100755
File mode changed.

Prétraitement_ETL/clean_geocodagev2.R

100644100755
File mode changed.

Prétraitement_ETL/clean_order_all_sujet.R

100644100755
File mode changed.

Prétraitement_ETL/clusterv2.R

100644100755
File mode changed.

Prétraitement_ETL/convert_classif_gtif.sh

100644100755
File mode changed.

Prétraitement_ETL/convert_geotiff.R

100644100755
File mode changed.

Prétraitement_ETL/deplacement_image.R

100644100755
File mode changed.

Prétraitement_ETL/distance_entre_geocdages.R

100644100755
File mode changed.

Prétraitement_ETL/exploration_db.R

100644100755
File mode changed.

Prétraitement_ETL/extraction_adresse_envoi.R

100644100755
File mode changed.

Prétraitement_ETL/extraction_remi.R

100644100755
File mode changed.

Prétraitement_ETL/geocoderalmain.R

100644100755
File mode changed.

Prétraitement_ETL/normalize_adresse.R

100644100755
File mode changed.

Prétraitement_ETL/normalize_adressev2.R

100644100755
+9-6
Original file line numberDiff line numberDiff line change
@@ -136,13 +136,16 @@ table_adresse.shp <- rbind(table_adresse.shp, bob)
136136

137137
geocodage_clb.shp <- sf::st_read("data/sortie_15_04.shp" , stringsAsFactors = FALSE)
138138

139-
geocodage_clbv2.shp$date_start <- parse_date_time(geocodage_clbv2.shp$date_start, orders = c("my", "dmy"))
140-
geocodage_clbv2.shp$date_end_a <- parse_date_time(geocodage_clbv2.shp$date_end_a, orders = c("my", "dmy"))
139+
geocodage_clb.shp$date_start <- lubridate::parse_date_time(geocodage_clb.shp$date_start, orders = c("my", "dmy"))
140+
geocodage_clb.shp$date_end_a <- lubridate::parse_date_time(geocodage_clb.shp$date_end_a, orders = c("my", "dmy"))
141141

142-
geocodage_clbv2.shp <- geocodage_clbv2.shp %>%
143-
dplyr::select(ID_CARTO, Loc_name, Commune, CP, nb_rue_p, rue_p, compl_add_, pt_remarq_, lieudit_p ) %>%
144-
tidyr::unite("Adresse", nb_rue_p, rue_p, sep = " ", na.rm = TRUE) %>%
145-
tidyr::unite("Info_sup", lieudit_p, compl_add_, pt_remarq_, na.rm = TRUE)
142+
geocodage_clb.shp <- geocodage_clb.shp %>%
143+
sf::st_drop_geometry() %>%
144+
dplyr::select(ID_CARTO, date_start, date_end_a )
145+
146+
table_adresse.shp <- dplyr::left_join(table_adresse.shp, geocodage_clb.shp, by = c("ID_CARTO" = "ID_CARTO"))
147+
148+
sf::st_write(table_adresse.shp, "data/envoi/clean_adressev1.geojson")
146149

147150
# %>%
148151
# select(-c(date_start, date_end, commune, adresse, cp, info_sup, nb_cluster, nb_bigcluster)) %>%

Prétraitement_ETL/precision_differente_mais_proche.R

100644100755
File mode changed.

Prétraitement_ETL/precision_geocodage.R

100644100755
File mode changed.

Prétraitement_ETL/reassemblage_geocodage_mains.R

100644100755
+9-18
Original file line numberDiff line numberDiff line change
@@ -1,9 +1,10 @@
1-
### reassemblage des fichier géocoder verifier après la mesure de distance entre les desux geocodages.
1+
### reassemblage des fichier géocoder verifier après la mesure de distance entre les deux geocodages.
22
# objectif recupérer l'ensemble des adresses qui avant le geocodages était a plus de 5 m
33

4-
library(sf)
54
library(dplyr)
5+
library(sf)
66

7+
# on va charger les différentes addresses verifiées
78
part_oli <- sf::st_read("data/verif/adresse_olivier.geojson")
89
part_oli$geocodeur <- "olivier"
910
# 1299
@@ -15,34 +16,24 @@ part_matt_a$geocodeur <- "matthieu"
1516
part_matt_b <- sf::st_read("data/verif/adresse_matthieu_bisbok.geojson")
1617
part_matt_b$geocodeur <- "matthieu"
1718

18-
# # on en a 7 en commun
19-
# verif_ecart.shp %>%
20-
# dplyr::group_by(ID_CARTO) %>%
21-
# mutate(count = n()) %>%
22-
# ungroup() %>%
23-
# filter(count > 1)
24-
# il y avait 7 identiques j'ai pris ceux de matthieu
19+
# il y avait des doublons
2520
part_oli <- part_oli[!part_oli$ID_CARTO %in% part_matt_a$ID_CARTO,]
2621

22+
# on agregge puis supprime
2723
verif_ecart.shp <- rbind(part_oli, part_matt_a, part_matt_b)
2824
rm(part_matt_a, part_matt_b, part_oli)
2925

30-
dim(verif_ecart.shp)
31-
32-
table(verif_ecart.shp$geocodage_main)
33-
3426
## ce qui avait deja éte geocodé à la main
35-
adresse <- sf::st_read("data/verif/distance.geojson")
36-
adresse_filtre <- sf::st_drop_geometry(adresse)
37-
adresse_filtre$distance <-as.numeric(adresse_filtre$distance)
38-
rm(adresse)
27+
adresse <- sf::st_read("data/verif/distance.geojson") %>%
28+
sf::st_drop_geometry()
29+
adresse$distance <-as.numeric(adresse$distance)
3930

4031
geocoder_main <- sf::st_read("data/geocodage_main_total.geojson")
4132

4233
# on en a 93 qui avaient déja été fait ...
4334
geocoder_main[geocoder_main$adresse_id %in% verif_ecart.shp$ID_CARTO, ]
4435

45-
deja_fait <- geocoder_main[geocoder_main$adresse_id %in% adresse_filtre$ID_CARTO ,]
36+
deja_fait <- geocoder_main[geocoder_main$adresse_id %in% adresse$ID_CARTO ,]
4637

4738
ce_qui_manque <- deja_fait[!deja_fait$adresse_id %in% verif_ecart.shp$ID_CARTO, ]
4839

Prétraitement_ETL/verif_naissance.R

100644100755
File mode changed.

README.md

100644100755
File mode changed.

analysis/amelioration_geocodage.R

100644100755
File mode changed.

analysis/identiques_entre_geocodeurs.R

100644100755
File mode changed.

analysis/repartition_adresse.R

100644100755
File mode changed.

analysis/tempo_adresse.R

100644100755
File mode changed.

analysis/un_seul_geocodage.R

100644100755
File mode changed.

createtable.sql

100644100755
File mode changed.

fonctions_gouramic.R

100644100755
File mode changed.

gouramic-db-analyses.Rproj

100644100755
File mode changed.

rapport/donneeconsolide.Rmd

100644100755
File mode changed.

rapport/geocodage_sujet.Rmd

100644100755
File mode changed.

rapport/geocodage_sujet_partb.Rmd

100644100755
File mode changed.

rapport/modeledonnee.Rmd

100644100755
File mode changed.

rapport/prepa_publi.Rmd

100644100755
File mode changed.

rapport/sankeydata.R

100644100755
File mode changed.

rapport/traitementsdonnéesadresses.Rmd

100644100755
File mode changed.

setupbase.sql

100644100755
File mode changed.

structuredesdossiers.R

100644100755
File mode changed.

sujet_gouramic_eda.R

100644100755
File mode changed.

0 commit comments

Comments
 (0)