Se terminan estas "improvisadas" vacaciones de mayo. Unos días a los que un castellano-leonés no está tan acostumbrado ya que se juntan días propios de la comunidad de Madrid pero que, con una buena planificación, cunden tanto como la semana santa. Vamos que en un alarde de evitar viajes de ida y vuelta en el tren he optado por aprovechar la semana entera.
Eso si, el hecho de que uno vuelva a recuperar la curiosidad perdida hace un tiempo, el interés por hacer las cosas bien y por aprender nuevas técnicas lleva a que los días de vacaciones no se traduzcan en eso que mucha gente parece preferir. En mi caso no he podido por menos que mantener activa la cabeza con algunos cursos que me permitan profundizar en las técnicas de reducción de dimensionalidad, extracción de vectores propios, identificar grupos a priori dispersos, etc...
Y es que yo no aplico cosas simplemente porque lo sugiera una web de internet. He de comprender las motivaciones, beneficios y problemas que puede acarrear el uso de una técnica u otra. Sinceramente creo que no vale con ejecutar una serie de instrucciones sin mayor planteamiento que si cumplen las reglas sintácticas del lenguaje. La semántica también importa y más cuando lo que se pretende es extraer información de un conjunto de datos.
Es posible que, al final del proceso, se terminen ejecutando las mismas instrucciones y en el mismo orden. Que en el conjunto de datos objeto de análisis el mejor proceso sea ese que describen los tutoriales. Y que, de haberlo aplicado sin entender lo que se hace, el resultado final sea prácticamente el mismo. Pero entonces ¿qué nos diferenciaría de las máquinas?
Y más importante aún ¿cómo podríamos estar seguros de que es el proceso correcto? ¿Cómo podríamos explicar qué se está haciendo? Y no, no vale con soltar una ristra de nombres de algoritmos seguidos de un "como todo el mundo". Si cambian los datos de partida ¿cómo nos ajustamos a ellos? Y, sobre todo, ¿cómo seríamos capaces de mejorar el proceso?
Sí, entiendo que para mucha gente es suficiente con terminar con un mapa de colorines que poder enseñar, pero en eso no consiste la ciencia, y mucho menos la ciencia de los datos. Al final, si aceptamos como verdades universales, y sin planeamiento crítico, los procesos preestablecidos ¿cómo generaremos nuevo conocimiento? No en vano esa búsqueda por entender los procesos es lo que diferencia a los científicos del resto de las personas. No sólo querer responder una pregunta concreta, no, también entender cómo haces esa pregunta, qué respuestas estás obteniendo, si realmente son apropiadas para la conclusión a la que se llega. No es tan sencillo.
Por tanto no, para mi las vacaciones no son para "tirarse en el sofá y no hacer nada". Sinceramente, tampoco podría hacer simplemente eso. Aprovecho para incrementar mi "navaja suiza" de utilizades para un mejor análisis, para unas conclusiones que aporten más información y de las que pueda estar más seguro si cabe.
¿Soy idiota por no "vaguear"? ¿por no aprovechar, con los ojos vendados y la nariz tapada lo que se hace "por defecto"? ¿por poder explicar los pasos que voy dando en cada análisis? Probablemente para el mundo en el que estamos, sumido en la ley del mínimo esfuerzo y de "cualquier chapuza con colorinchis es válida", sí. Pero yo no sigo las enseñanzas de La Chapuza Total de Shery Bobbins en Los Simpsons.
Además, dudo mucho que la mayoría de las grandes mentes, de los gigantes, que nos han traído hasta aquí se conformasen con hacer lo que estaba establecido, sin preguntarse el porqué. Y con ello no me quiero comparar, ni mucho menos, con esas personalidades. Simplemente se que si, en algún momento quiero acercarme mínimamente a lo que consiguieron tengo que actuar como lo habrían hecho, no con el "todo vale".
No hay comentarios:
Publicar un comentario