Matemáticas, primer pilar de la ciencia de datos

Hola, aquí te presento a uno de los pilares de cualquier Ciencia de Datos, ya sea la Inteligencia Artificial, el Aprendizaje Automático, Los Macrodatos, o cualquier otra.

Pero, por favor, no salgas corriendo todavía…!! Verás que no se necesita profundizar tanto en ella, sino aprender a razonar según ciertos patrones..

Confía en mí… te espero al final de la lectura.


Introducción al pensamiento matemático para la Ciencia de Datos

Murtaza Ali

Medium, 2022


Cuando tomé mi primera clase de matemáticas en la universidad, estaba desesperadamente perdido. Parecía que el profesor hablaba en un idioma diferente, y me encontraba constantemente confundido en las tareas y los exámenes.

Escribí frenéticamente los apuntes, asistí a todas las horas de clase que pude y estudié durante horas y horas, pero todo fue en vano.

Más tarde me di cuenta de que el problema no era el material de la clase.

No importaba lo mucho que me esforzara en los temas específicos (era cálculo multivariable), porque la parte fundamental del conocimiento que me faltaba era más amplia. No tenía ni idea de cómo pensar matemáticamente.

En el Secundario, sólo había aprendido a introducir números en fórmulas o a resolver ecuaciones básicas que seguían los mismos patrones. Los problemas en mis clases de matemáticas en la universidad -y en los puestos asociados de postgrado- eran mucho más difíciles.

Al final tomé una clase que enseñaba el pensamiento matemático desde cero y eso influyó enormemente en mi visión de los problemas técnicos.

En este artículo, presentaré tres cosas:

  1. el significado del pensamiento matemático,

  2. una discusión de por qué es importante para la Ciencia de Datos, y

  3. un ejemplo detallado de la aplicación de esta forma de pensamiento para resolver un problema.

¿Qué es el pensamiento matemático?


El pensamiento matemático está estrechamente ligado a lo que muchos matemáticos llaman madurez matemática.

En palabras del profesor de la UC Berkeley Anant Sahai, dicha madurez se refiere a "la comodidad en la resolución de problemas paso a paso y el mantenimiento de la confianza en tu trabajo, incluso mientras das pasos adelante".

En la mayoría de los problemas matemáticos, la solución no es inmediatamente clara, sino que debe ser elaaborada.

A una persona matemáticamente madura le parece razonable -e incluso satisfactorio- ir progresando poco a poco y llegar finalmente a una solución, aunque no tenga ni idea de cuál puede ser cuando empieza.

En términos generales, el pensamiento matemático es un enfoque de resolución de problemas que hay que aprender a aplicar para adquirir madurez matemática.

A menudo se reduce a desarrollar pruebas, que es un término elegante para una serie de pasos lógicos que establecen que un hecho afirmado es verdadero.

Por ejemplo, el teorema de Pitágoras se suele enseñar a los estudiantes en las clases de matemáticas desde la escuela primaria:

Aquí, a, b y c se refieren al primer lado, al segundo lado y a la hipotenusa de un triángulo rectángulo, respectivamente.

Las preguntas estándar de los deberes y los exámenes consisten en utilizar la ecuación para resolver el lado que falta de un triángulo.

Sin embargo, una pregunta más complicada -que requiera pensamiento matemático- podría pedir a alguien que demuestre que esta afirmación es cierta mediante una serie de pasos lógicos.

Esto se llamaría una demostración del Teorema de Pitágoras.

A un alto nivel, se puede pensar que hacer una demostración es como resolver una especie de rompecabezas.

Requiere cierto nivel de astucia e ingenio que, en contra de la opinión popular, puede cultivarse con la práctica.

También hay algunas técnicas de demostración comunes que puede aprender una persona para iniciarse en el pensamiento matemático.

El aprendizaje de estas técnicas puede ayudar a reforzar tu madurez matemática.

No me centraré en ninguna técnica en particular, pero utilizaré una demostración de nivel introductorio en una sección posterior.

Mi objetivo con esta demostración es enfatizar que el pensamiento matemático no requiere conocimientos avanzados de dicha materia ni se refiere a un conjunto de técnicas específicas: es una habilidad general que cualquiera puede aprender.

Pero primero vamos a dedicar un momento para hablar de por qué un científico de datos debe preocuparse por el pensamiento matemático.


¿Por qué es importante el pensamiento matemático para la Ciencia de Datos?

Los fundamentos matemáticos de esta ciencia provienen de la estadística teórica.

Muchas de las técnicas utilizadas habitualmente en la ciencia de datos moderna -como el aprendizaje automático, las pruebas de hipótesis y el muestreo de datos representativos- se basan en métodos estadísticos.

Es cierto que la ciencia de datos es un campo muy amplio, y no todos los científicos de datos necesitan saber cómo desarrollar teóricamente un algoritmo de aprendizaje automático de vanguardia para hacer bien su trabajo.

Ese no es el argumento que estoy esgrimiendo aquí.

Sin embargo, es importante que cualquier persona que trabaje en la ciencia de los datos tenga al menos una cierta comprensión del enfoque de resolución de problemas que se está llevando a cabo para abordar el trabajo en cuestión.

Como analogía, consideremos a un gestor de proyectos y a un desarrollador de software de una nueva empresa tecnológica.

El trabajo del gestor de proyectos no consiste en escribir el código real del producto, sino en actuar como interfaz entre los consumidores y los desarrolladores y, por tanto, gestionar el proyecto a alto nivel.

Sin embargo, un gestor de proyectos que tenga algunos conocimientos de desarrollo de software será más capaz de entender el proyecto y navegar por las complejidades de equilibrar los deseos de los consumidores con las limitaciones de los desarrolladores (hay una razón por la que muchos gestores de proyectos también estudiaron informática en la escuela).

Del mismo modo, puede que el gestor no sea un científico de datos teórico.

Tal vez su talento reside en la codificación, por lo que incorpora los paquetes de gestión de datos existentes en su flujo de trabajo, sin estudiar los aspectos técnicos.

O tal vez sea un experto en la materia que no codifica modelos ni realiza pruebas estadísticas, sino que ayuda a los programadores y estadísticos a entender el contexto del que proceden los datos.

En ambos casos, la capacidad de pensar matemáticamente le dará una visión más profunda de las complejidades de los datos y de cómo se está resolviendo el problema.

Es posible que el gestor del proyecto se encuentre reordenando lógicamente un programa para hacerlo más eficiente, o analizando una técnica específica de obtención de datos para obtener una muestra que se ajuste a los métodos estadísticos existentes.

Al hacerlo, ampliará su repertorio y contribuirá así a mejorar el flujo de trabajo de la ciencia de datos.

Ahora bien, veamos cómo se crea realmente el pensamiento matemático.


¿Cuál es un ejemplo de aplicación del pensamiento matemático?


Veamos un problema sencillo que ilustra cómo abordar un problema mediante dicho pensamiento.

No implica ninguna matemática más allá del cálculo algebraico estándar y se centra en el proceso lógico de resolver un problema paso a paso.

Demostraremos el siguiente enunciado estadístico fundamental: para cualquier colección de números, la suma de todas las desviaciones de la media es 0.

Esto es válido para cualquier lista de números, que podemos representar de la siguiente manera:

Podemos escribir la afirmación anterior matemáticamente:

Aquí, la letra griega mu representa la media, y cada subíndice i diferencia entre los diferentes números de nuestra lista.

Ahora, viendo esto, no está claro por qué debería ser cierto.

Empecemos a hacer algunas pequeñas maniobras en el lado izquierdo de la ecuación para ver si podemos llegar a alguna parte.

Podemos empezar escribiendo lo siguiente:

Lo que hemos hecho arriba es separar los dos términos dentro de la suma.

El lado izquierdo de la ecuación significa que se suma todo lo que hay entre los paréntesis n veces.

Sin embargo, hay que tener en cuenta que la variable mu no tiene subíndice, lo que significa que estamos sumando -mu un total de n veces.

Así, podemos escribir esa parte de la suma manualmente y eliminarla de la suma, obteniendo la ecuación del lado derecho.

Para nuestro siguiente paso, vamos a pensar detenidamente en el valor de mu.

Recordemos que arriba especificamos que usamos mu para referirnos a la media de nuestra lista de números.


¿Cómo se calcula la media?


Tomando la suma de todos los números y dividiéndola por la longitud de la lista.

Así, podemos reescribir mu:

Entonces, sustituyendo esto por mu y reescribiendo la división por no como multiplicación por (1/n), podemos ampliar la ecuación completa:

En este punto, es conveniente recordar nuestro objetivo original, que a veces puede perderse en el mar de pasos (especialmente a medida que los problemas se vuelven más avanzados): queremos demostrar que esta ecuación es igual a 0.

Ya casi hemos llegado, ¿ves la solución?

Te animo a que te detengas un momento aquí y veas si puedes terminar la prueba.

Fíjate en que n multiplicado por su recíproco (1/n) es sólo 1. Así, se anulan entre sí, y obtenemos lo siguiente:

Y voilà, ¡hemos terminado! Llegados a este punto, un buen ejercicio sería repasar los pasos anteriores uno a uno y ver si puedes rehacerlos sin mirar.


Algunos consejos


Si nunca te has enfrentado a este tipo de problemas, puede ser confuso y desalentador cuando empiezas.

A veces, puede parecer una habilidad innata que no se puede aprender.

Sin embargo, esto no es cierto: tómelo de alguien que ha pasado por ello.

A continuación se ofrecen algunos consejos que me resultaron muy útiles cuando aprendí esta habilidad por primera vez, y espero que también puedan serlo para ti.


Repasa un libro de texto de matemáticas discretas


Me reafirmo en mi argumento anterior de que el pensamiento matemático no es necesariamente específico de una rama de las matemáticas, o incluso de las propias matemáticas, sino que es más bien un paradigma o marco para la resolución de problemas.

Dicho esto, las matemáticas discretas son un buen punto de partida: te enseñarán algunos conceptos matemáticos básicos y la notación, además de repasar algunas técnicas de demostración que podrás aplicar en cualquier lugar.

Es la clase que toman los estudiantes de introducción a las matemáticas para perfeccionar su madurez matemática.


Imita patrones


Si no tienes ni idea de cómo enfocar un problema, una de las mejores formas de aprender es encontrar una solución, entenderla en profundidad e intentar reescribirla desde cero sin mirar.

Esto le expondrá a una mayor variedad de técnicas e identificará problemas que parecen diferentes en la superficie, pero que requieren técnicas subyacentes similares.


Practicar, practicar y practicar.


Con mucho, lo que más contribuye a cultivar el pensamiento matemático es la determinación y el esfuerzo sinceros.

Hay que resolver toneladas de problemas y trabajar en ello, como con cualquier otra habilidad. Se trata de pequeños segmentos de práctica consistente, en contraposición a grandes trozos de estudio infrecuente.

Si aplicas estos consejos, podrás mejorar tu capacidad de pensamiento matemático y estarás en camino de convertirte en un científico de datos más profundo. "


Aquí estoy. Espero no haberte defraudado.

Creo que, en el fondo, para poder gestionar este tipo de proyectos se necesita el Sentido Común Organizado (OCS), más que el conocimiento matemático en sí.

Obviamente, se debe contar con una base mínima de nociones pero, de ningún modo, ser un especialista un in matemático teórico.

Este Sentido Común será el producto de la adquisición y práctica de las operaciones básicas, más el ejercicio y la disposición para seguir aprendiendo durante toda la carrera profesional.

Ahora me gustaría conocer tu honesta opinión con respecto a este artículo.

Gracias por tu colaboración.

1 visualización0 comentarios

Entradas relacionadas

Ver todo