Le lavage des mains est une pratique très courante de nos jours. Avec les temps qui courent, il devient un réflexe pour plus d'un. Pourtant, cela n'a pas eté toujours ainsi. Que nous révèlent l'expérience du Dr Ignaz Semmelweis avec les femmes suite aux accouchements? Pour cela, nous allons utiliser des données disponibles sur le site de Wikipédia.
Les librairies suivantes seront utilisées pour l'extraction et la visualisation des donnnées. en particulier rvest pour l'extraction et ggplot pour la visualisation.
library(rvest)
library(httr)
library(dplyr)
library(zoo)
library(ggplot2)
site<-"https://en.wikipedia.org/wiki/Historical_mortality_rates_of_puerperal_fever"
xpath='//*[@id="mw-content-text"]/div[1]/table[1]'
Cette fonction permet d'extraire le premier tableau des données de l'experience du Dr Ignaz Semmelweis.
extractTable<-function(site,xpath)
{
tableau.site <-content(html_session(site)$response)%>%
html_nodes(xpath=xpath)%>%
html_table(fill=TRUE)
return(tableau.site)
}
monthly<-extractTable(site,xpath)
monthly<-as.data.frame(monthly)
for (i in 1:dim(monthly)[1])
{
monthly[i,7]<-unlist(strsplit(monthly[i,2],'[" "]'))[2]
}
En voici un extrait du tableau. On a comme variables pertinentes l'année et le mois, le nombre de naissance, le nombre de femmes mortes.
head(monthly)
Nous allons retenir uniquement les variables qui seront utilisées dans le cadre de notre analyse. On retient le mois et l'année, les naissances et la quantité de femmes mortes suite aux accouchements.
monthly<-monthly[,-c(1,5,6)]
names(monthly)[4]<-"Year"
monthly<-monthly[,c(1,4,2,3)]
head(monthly)
Il n'y a pas de données diisponibles le mois de décembre 1841, on enlève cette ligne.
which(is.na(monthly$Births))
monthly[12,]
On constate aussi que les variables année mois, naisssance et femmes mortes ne sont pas dans le bon format. On procède à la conversion du format de ces variables.
monthly<-monthly[-12,]
monthly$Births<-as.numeric(monthly$Births)
monthly$Deaths<-as.numeric(monthly$Deaths)
monthly$Month<-as.yearmon(monthly$Month,format="%B %Y")
head(monthly)
Il est important de calculer la proportion de femmes mortes par rapport aux naissances.
monthly<-monthly%>%
mutate(proportion_deaths =Deaths/Births)
head(monthly)
La proportion de femmes mortes de 1841 à 1846 a majoritairement été suprérieure à 20%. Elle a connu une baisse considérable et continue à partir de 1847. Que s'est-il passé?
options(repr.plot.width=20, repr.plot.height=10)
ggplot(monthly,aes(Month,proportion_deaths))+
labs(x='Année',y='Proportion de femmes mortes')+
theme(text = element_text(size=20))+
geom_line(size=2)+
geom_vline(xintercept=as.numeric(monthly$Month[which(monthly$Month=="May 1847")]),linetype=1,color='blue',size=1.5)
Le lavage des mains devient obligatoire dans tous les hopitaux participant à l'expérience à partir de Mai 1947. Ceci a substantiellement contribué à une réduction du nombre de femmes mortes suite à l'accouchemnent.
handwashing_start = as.yearmon('May 1847')
monthly<-monthly%>%
mutate(handwashing_started=Month>=handwashing_start)
head(monthly)
Ce graphique montre à quel point la proportion de femmes mortes a chuté suite à l'obligation qui est faite au personnel médical de se laver les mains avant les accouchements.
ggplot(monthly,aes(Month,proportion_deaths,color=handwashing_started))+
theme(text = element_text(size=20))+
labs(x='Année',y='Proportion de femmes mortes')+
geom_line(size=1.5)
Le lavage des mains n'a pas toujours été une pratique connue et suivie. Les découvertes en sciences médicales ont permis de mieux appréhender son importance dans la transmission de certains germes. Alors, limitons la propagations des bactéries et compagnie, LAVONS nos mains!!!!!