Chapitre 3 Obtention des données pour les travaux pratiques
Les données utilisées pour les TP sont obtenues à partir du site web du livre Veterinary Epidemiologic Research (Dohoo et al., 2009). Choisissez: ZIP file of all datasets – Excel format. Une fois téléchargés sur votre ordinateur et décompressés, les tableaux de données en format xlsx sont disponibles avec l’appel suivant (remplacer le chemin d’accès avec le chemin approprié vers votre répertoire ou copiez-les dans un Projet R
que vous aurez créé):
#Importation de la table Daisy2.xlsx
#Vous pouvez importer en format XLSX comme suit:
#library(readxl) #Ouvrir le package qui lit les fichiers excel
#daisy2 <- read_excel("C:/Users/dufours/Documents/DiskD/Enseignement UdM/Cours/PTM 6675-Epi 2/Labo R/Data/ver2_data_excel/Daisy2.xlsx") #Indiquez votre chemin d'accès. Notez les 'forward slash' plutôt que les 'backslash'
#Ou en format CSV
<-read.csv(file="daisy2.csv", header=TRUE, sep=",")
daisy2 #Pour voir les premières 6 lignes d'un jeu de données (afin de mieux comprendre sa structure):
head(daisy2)
## region herd cow study_lact herd_size mwp parity milk120 calv_dt cf fs cc
## 1 1 1 1 1 294 26 5 3505.8 1996-11-11 80 NA NA
## 2 1 1 2 1 294 26 5 3691.3 1997-01-12 64 NA NA
## 3 1 1 3 1 294 26 5 4173.0 1997-01-17 71 0 93
## 4 1 1 4 1 294 26 5 3727.3 1997-02-11 35 1 35
## 5 1 1 5 1 294 26 5 3090.8 1997-06-26 47 0 87
## 6 1 1 6 1 294 26 4 5041.2 1996-10-16 NA NA NA
## wpc spc twin dyst rp vag_disch h7
## 1 NA 6 0 0 0 0 1
## 2 NA 3 0 0 0 0 1
## 3 67 2 0 0 0 0 1
## 4 9 1 0 0 0 0 1
## 5 61 2 0 0 0 0 1
## 6 NA NA 0 0 1 0 1