Garrett Grolemund is a statistician, teacher and R developer who currently works for RStudio. He sees data analysis as a largely untapped fountain of value for both industry and science. Garrett received his Ph.D at Rice University in Hadley Wickham's lab, where his research traced the origins of data analysis as a cognitive process and identified how attentional and epistemological concerns guide every data analysis.
Garrett is passionate about helping people avoid the frustration and unnecessary learning he went through while mastering data analysis. Even before he finished his dissertation, he started teaching corporate training in R and data analysis for Revolutions Analytics. He's taught at Google, eBay, Axciom and many other companies, and is currently developing a training curriculum for RStudio that will make useful know-how even more accessible.
Outside of teaching, Garrett spends time doing clinical trials research, legal research, and financial analysis. He also develops R software, he's co-authored the lubridate R package--which provides methods to parse, manipulate, and do arithmetic with date-times--and wrote the ggsubplot package, which extends the ggplot2 package.
dashboard
Serie
Blanche
|
Les data sciences constituent une discipline fascinante, qui vous servira à transformer des données brutes en idées et connaissances
aisément compréhensibles. L’objectif de ce livre est de vous aider à maîtriser les outils essentiels qui vous permettront d’utiliser R dans la pratique des data sciences. Après l’avoir lu, vous pourrez faire face à la plupart des situations que vous rencontrerez dans vos projets, en exploitant au mieux les fonctionnalités de R.
Mais avant de devenir un expert en R, vous devrez tout d’abord importer vos données, c’est-à-dire les lire, en général depuis un fichier, une base de données ou une API web, et les charger dans un cadre de données dans R. Si vous ne pouvez pas transférer vos données dans R, vous ne pourrez pas les analyser ! Une fois vos données importées, vous gagnerez beaucoup à les ranger. Une fois vos données rangées, vous passerez bien souvent par une étape de transformation. Une fois vos données rangées avec les variables dont vous avez besoin, la génération de connaissances reposera principalement sur deux moteurs : la visualisation et la modélisation. Leurs forces et faiblesses sont complémentaires, et toute bonne analyse doit tenir compte des deux.
Inutile d’être un programmeur expert pour être un bon analyste de données, mais apprendre à programmer
Título : R pour les data sciences
EAN : 9782212731514
Editorial : Eyrolles
El libro electrónico R pour les data sciences está en formato ePub
¿Quieres leer en un eReader de otra marca? Sigue nuestra guía.
Puede que no esté disponible para la venta en tu país, sino sólo para la venta desde una cuenta en Francia.
Si la redirección no se produce automáticamente, haz clic en este enlace.
Conectarme
Mi cuenta