Sobre mí

Bienvenido a mi web personal. Me llamo Manuel Torres, y soy Full Stack Data Scientist. ¿Qué es un Full Stack Data Scientist? Un perfil capaz de desarrollar proyectos relacionados con la ciencia de datos de principio a fin.

Partes del proceso en un proyecto de ciencia de datos

En ésta web encontrarás aplicaciones interactivas, artículos interesantes y algunos proyectos que he ido desarrollando a lo largo de los años.

Contenido en la web

¿Qué es Nextcloud?

Nextcloud es una solución que nos permite tener nuestra propia nube. Proporciona una alternativa a servicios como Google Drive y OneDrive, con la ventaja de que nosotros mismos controlamos los servidores que gestionan nuestros datos, con todas las ventajas que ello implica para la Privacidad y seguridad de nuestros datos.

Aplicaciones Productividad

Árboles de decisión

Los árboles de decisión son algoritmos que generan reglas que nos permiten asignarle etiquetas a una serie de observaciones de forma automática. Vemos cómo utilizar éstos modelos en Python.

Machine Learning Análisis de Datos Aprendizaje supervisado

Prueba T para una media

Prueba T para una media

Vemos cómo se aplica la prueba T para una media con R, comprobando el cumplimiento de los supuestos. Además, presentamos una función que automatiza el proceso, aplicando la alternativa no paramétrica en caso de que no se cumplan.

Estadística Estadística para las ciencias sociales y de la salud

Dashboard desempleo

Dashboard que muestra la evolución del desempleo a lo largo de los años en España y en el mundo. Los datos de España aparecen desglosados por comunidad autónoma, grupo de edad y sexo.

Flexdashboard Economía R plotly INE

SELECT en SQL

Vemos cómo utilizar el comando SELECT en SQL, así como las claúsulas WHERE para aplicar filtros y ORDER BY para ordenar los resultados. Explicamos también los principales operadores lógicos en SQLite para crear condiciones que se pueden utilizar para filtrar los datos

Bases de Datos Bases de Datos Relacionales

¿Qué es la investigación cualitativa?

Vemos en qué consiste la Investigación Cualitativa, y hablamos de las diferencias con otras técnicas de procesamiento de información no numérica.

Minería de Texto

Primeros pasos con SQL

Primer artículo en la serie de tutoriales de SQL desde cero. Ponemos en marcha el entorno de desarrollo para ejecutar consultas y creamos nuestra primera base de datos.

Básico SQLite Bases de Datos Bases de Datos Relacionales

Visualizar correlaciones

Visualizar correlaciones

Aprende a crear Gráficos a partir de matrices de Correlaciones con R para visualizar las relaciones entre varias variables. Utilizamos el paquete corrplot y la librería igraph para ver la matriz como una red.

Generador números aleatorios

Genera uno o varios números aleatorios entre un mínimo y un máximo.

Utilidades

Normalización de datos

Explicamos un concepto fundamental de las Bases de Datos Relacionales: la normalización de datos.

Bases de Datos

Escalamiento multidimensional con R

Escalamiento multidimensional con R

Utilizamos R para aplicar la técnica del escalamiento multidimensional sobre un fichero que contiene las distancias entre algunas ciudades españolas. Vemos cómo es capaz de organizar las ciudades en el espacio para reconstruir el mapa de España.

Estadística Aprendizaje no supervisado

¿Qué es SQL?

Primer artículo en la serie de Bases de Datos Relacionales. Hablamos sobre el estándar SQL, que define entre otras cosas la sintaxis para interactuar con éstas Bases de Datos. Vemos que es un gestor de bases de datos y algunos otros conceptos relacionados con éstas tecnologías.

Básico Postgres SQLite MySQL MariaDB

TFG Minería de Texto

TFG Minería de Texto

Trabajo de Fin de Grado sobre el análisis bibliométrico en Psicología. El objetivo del proyecto era estudiar la evolución de la investigación en psicología a partir de los datos disponibles de forma libre en Scopus, una base de datos de artículos científicos. Para ello, en primer lugar tenía que descargar los artículos de la base de datos, lo que implicaba interactuar con la API. Ésta tarea la desarrollé en Python. Los datos se almacenaban en una base de datos de SQLite y el análisis de los datos lo hice con R, presentando los resultados mediante Gráficos gráficos interactivos de plotly.

Estadística R markdown Bases de Datos Aprendizaje no supervisado

Crear páginas web con python

Hablamos sobre las tecnologías que he usado para crear la página y el papel que tiene cada una. Al final hay un pequeño rant...

Python Desarrollo Web uwsgi R markdown HTML CSS nginx

Práctica TRI (Ítems dicotómicos)

Práctica TRI (Ítems dicotómicos)

En éste informe se aplica un modelo TRI para ítems con dos opciones de respuesta (acierto/fallo). Ajustamos los modelos de 1, 2 y 3 parámetros, evaluando el ajuste relativo y absoluto de cada modelo. Comparamos las mediciones de la TRI con las de la TCT y comprobamos si efectivamente conseguimos la invarianza de medida.

Psicometría Fiabilidad Consistencia interna

Práctica TCT

Analizamos las propiedades psicométricas de un instrumento psicométrico mediante la óptica clásica: discriminación de los ítems, comportamiento de los distractores, Consistencia interna y Fiabilidad.

Psicometría TCT ggplot

Práctica TRI (Ítems politómicos)

En éste informe se aplica un modelo TRI para ítems con varias opciones de respuesta (una escala graduada).

Psicometría R

Simulación factorial confirmatorio

Otra práctica de simulación de temática libre, en éste caso para el Análisis Factorial Confirmatorio. Estudié el cambio en los indicadores de ajuste/desajuste a medida que se van introduciendo errores de especificación en el modelo. La segunda parte de la práctica consistía en realizar un Análisis Factorial multigrupo para determinar si existe invarianza de medida en un instrumento.

Psicometría Correlaciones lavaan R

Simulación factorial exploratorio

En ésta práctica teníamos que estudiar el comportamiento del Análisis Factorial Exploratorio realizando algunas simulaciones de temática libre. Yo escogí estudiar el efecto del tamaño muestral y el valor de los pesos factoriales simulados sobre la calidad de la recuperación de los pesos y los valores del MSA (de la técnica KMO).

Estadística Psicometría Correlaciones Análisis Factorial R

Práctica TDS

Práctica TDS

Una práctica sobre la detección de señales mediante la cual estudiamos el patrón de respuesta de varios observadores. Ésta técnica puede utilizarse también para evaluar el rendimiento de modelos de clasificación dicotómica.

Estadística Técnicas de Clasificación R ggplot

Práctica detección de contornos

En ésta práctica de Tecnología del Conocimiento conseguimos marcar los contornos de algunas imágenes. También se realizan algunas tareas de procesamiento de las imágenes comunes en la Visión Artificial. En principio el material estaba pensado para realizar los ejercicios con Matlab, pero se podía utilizar cualquier otra herramienta. En mi caso, decidí trabajar con R.

Ventas target

Utilicé unos datos ficticios para crear un informe de Ventas con estética de la marca Target. Todos los elementos del informe utilizan los colores de la marca, incluidos los Gráficos de ggplot.

Análisis de Datos HTML CSS R

Práctica árboles de decisión

Una práctica en la que se ajusta un árbol de decisión con R.

Intermedio Programación Machine Learning Ciencia de Datos Aprendizaje supervisado

Comunicado accionistas LVMH

En la página del grupo Louis Vuitton encontré un comunicado para accionistas, y me gustó la estética de la página. Por tanto, intenté replicar la estética del documento utilizando HTML y CSS.

Desarrollo Web

Prueba API json

Ésta página devuelve un archivo JSON en vez de una página web (documento HTML). Con django es muy fácil desarrollar una API.

demo

Saludo

Una sencilla app que muestra las capacidades de django para generar contenido de forma dinámica.