Create Your First Project
Start adding your projects to your portfolio. Click on "Manage Projects" to get started
Project overview - Descripción general del proyecto
Bootcamp
Github
EN:
Project part of the Tripleten bootcamp.
This project aims to explore, clean, and analyse data from the Instacart delivery platform to discover patterns in the purchasing habits of its users. The dataset, originally published for a competition on Kaggle, was modified to suit the learning environment: the volume was reduced, and missing and duplicate values were introduced, respecting the actual distributions.
Instacart enables individuals to order groceries online and have them delivered to their homes, similar to other platforms like Uber Eats. The database includes detailed information on millions of orders, products, aisles, departments, and shopping habits. This project allows you to apply data analysis skills to generate informative graphs, work with complex structures, and use Python and Pandas for processing.
Key tasks include verifying data types, handling missing and duplicate values, visualizing data with clear graphs, and analyzing behavior by hour, day of the week, product, and customer. Upon completion of the project, you will have a clear understanding of consumer behaviour on the platform and be prepared to communicate relevant findings effectively.
ES:
Proyecto parte del bootcamp Tripleten.
Este proyecto tiene como finalidad explorar, limpiar y analizar datos de la plataforma de entregas Instacart, con el propósito de descubrir patrones en los hábitos de compra de sus usuarios y usuarias. El conjunto de datos, originalmente publicado para una competencia en Kaggle, fue modificado para adaptarse al entorno de aprendizaje: se redujo el volumen y se introdujeron valores ausentes y duplicados, respetando las distribuciones reales.
Instacart permite a las personas realizar pedidos de víveres en línea y recibirlos a domicilio, de manera similar a otras plataformas como Uber Eats. La base de datos incluye información detallada de millones de pedidos, productos, pasillos, departamentos y hábitos de compra. Este proyecto permite aplicar habilidades de análisis de datos para generar gráficos informativos, trabajar con estructuras complejas y utilizar Python y Pandas para el procesamiento.
Entre las tareas principales se encuentra la verificación de tipos de datos, tratamiento de valores ausentes y duplicados, visualización de datos con gráficos claros, y el análisis de comportamiento por hora, día de la semana, producto y cliente. Al finalizar el proyecto, se espera tener una visión clara del comportamiento del consumidor en la plataforma y estar preparado para comunicar hallazgos relevantes de forma efectiva.