Inicio Tarea: Pandas, KNN y Regresión Lineal
Artículo
Cancelar

Tarea: Pandas, KNN y Regresión Lineal

Entrega y presentación

La entrega será en formato ZIP. Leer Entrega y presentación de tareas.

Ejemplo de entrega
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
mruizg_t05.zip
├───mruizg_t05.pdf
├───mruizg_a01_pandas
│       Manipulacion_datos_pandas.ipynb
│       tools_pandas_con_preguntas.ipynb
│
├───mruizg_a03_eda
│       Ejercicio_EDA.ipynb
│
├───mruizg_a04_knn
│       Ejercicio_k-NearestNeighbor.ipynb
│       reviews_sentiment.csv
│
├───mruizg_a05_knn
│       films.png
│       knn.ipynb
│       reviews_sentiment.csv
│
├───mruizg_a06_reg_lineal
│       articulos_ml.csv
│       Ejercicio_Regresion_Lineal.ipynb
│
└───mruizg_a07_reg_lineal
        heights.csv
        housing.csv
        reg_lineal.ipynb

El ejemplo de entrega solo es una referencia de entrega, si se necesita eliminar o crear algún fichero o carpeta siéntete libre de hacerlo.

Calificación y duración

La tarea se calificará con una nota de 0 a 10.

Duración

Actividades

Descarga el fichero enunciado-tarea-pandas-knn-reg-lineal.zip y realiza las siguientes actividades.

Pandas

Dado el fichero tools_pandas_con_preguntas.ipynb, lee, ejecuta en tu máquina local y responde a las preguntas que aparecen a lo largo del mismo.

También te dejo el cuaderno Manipulacion_datos_pandas.ipynb sobre manipulación de datos con Pandas por si te quedas con ganas de más.

(Voluntaria) 7 pasos del ML para construir tu máquina

Lee el artículo 7 pasos del Machine Learning para construir tu máquina y responde a las siguientes preguntas sobre el mismo:

  1. ¿Cuáles son los 7 pasos del ML para construir tu máquina?
  2. ¿Qué es el web scrapping?
  3. ¿En qué proporción se suelen dividir los datos?
  4. ¿El ajuste de los hiperparámetros de un modelo es considerado más un arte o una ciencia?

(Voluntaria) EDA con Pandas en Python

Lee el artículo Análisis Exploratorio de Datos con Pandas en Python y responde a las siguientes preguntas sobre el mismo:

  1. ¿Qué significan las siglas EDA?
  2. ¿Qué es el EDA en ML?
  3. ¿Qué librería de Python podemos usar para llevar a cabo el EDA?
  4. Dada la siguiente matriz de correlación del artículo, ¿hay una alta o baja correlación entre los datos?
  5. ¿Qué es un outlier?
  6. ¿Es importante tener en cuenta cuál es el propósito que buscamos lograr cuando llevamos a cabo el EDA?

(Voluntaria) Clasificar con KNN en Python

Lee el artículo Clasificar con K-Nearest-Neighbor ejemplo en Python y responde a las siguientes preguntas sobre el mismo:

  1. ¿KNN es un algoritmo de regresión o clasificación?
  2. ¿Qué significa la K en el algoritmo KNN? ¿Y en el algoritmo K-Means?
  3. ¿Qué pros tiene KNN?
  4. ¿Hay alguna solución al gran uso de memoria y CPU que tiene el algoritmo KNN? ¿Cuál?
  5. En general ¿es más conveniente elegir un valor de K par o impar? ¿Por qué?
  6. ¿Es siempre mejor elegir un valor de K más alto?
  7. ¿Qué 2 maneras existen para medir la cercanía?

KNN

Dado el fichero knn.ipynb , lee, ejecuta en tu máquina local y responde a las preguntas que aparecen a lo largo del mismo.

(Voluntaria) Regresión Lineal en español con Python

Lee el artículo Regresión Lineal en español con Python y responde a las siguientes preguntas sobre el mismo:

  1. Sobre la fórmula de la recta $Y = mX + b$, ¿como se denomina la $m$? ¿Y la $b$?
  2. Cuando hablamos de regresión lineal simple, el resultado es una recta pero cuando hablamos de regresión lineal múltiple, ¿cuál es el término que se utiliza?
  3. ¿Cuál es la fórmula general de un plano? ¿Y de un hiperplano?

Regresión Lineal

Dado el fichero reg_lineal.ipynb, lee, ejecuta en tu máquina local y responde a las preguntas que aparecen a lo largo del mismo.

Bibliografía

Este artículo está licenciado bajo CC BY 4.0 por el autor.

Tarea: XSD

Tarea: Legislación sobre protección de datos