El machine learning y su creciente uso en las geociencias

Tiempo estimado de lectura: 5 minutes Escuchar esto

Hooman Hosseinpour Member Name

Ingeniero Jefe en Geomecánica

Morgan Warren Member Name

Geoquímico de Proyectos

Últimamente se ha dado un gran debate en torno a los macrodatos, o big data, dentro de diversas industrias, ya que las mejoras en tecnología, poder de computación y servicios basados en la nube les han permitido a las industrias recopilar y acceder a más datos, y analizarlos de manera más eficiente y a un menor costo. Pero las mejoras en las técnicas de recolección de datos no solo inciden en el sector de las tecnologías de la información (TI), sino que también proporcionan grandes beneficios, como por ejemplo, al sector de las manufacturas. Esto se debe principalmente a la llegada de la cuarta revolución industrial (4.0), del Internet de las Cosas, a una mejora de la robótica, de la tecnología de sensores y de las capacidades de monitoreo, y a que la inteligencia artificial se está implementando en fábricas de todos los sectores.

Naturalmente, todos estos datos son extremadamente valiosos, pero también crean un nuevo desafío: ¿cómo los analizamos? Aquí es donde entra en juego el machine learning. El aprendizaje automático, o machine learning, tiene el poder de develar las ideas y los conocimientos escondidos dentro de enormes cantidades de datos, los que de otra manera permanecerían ocultos para los seres humanos.

¿Qué es el machine learning y cuáles son sus beneficios?

El machine learning (ML) es la ciencia de aplicar las tecnologías informáticas de la programación y de la estadística para analizar enormes juegos de datos y, como resultado, develar nuevos conocimientos. Es un subsector especializado de la inteligencia artificial (IA), la cual agrupa a un conjunto más grande de herramientas de modelación predictivas que le permiten a los programas informáticos aprender por medio de la generalización a partir de ejemplos.

Todo negocio puede adquirir ventajas competitivas al acceder a sus datos de manera eficaz y descubrir ideas invaluables, ocultas hasta ahora. La evolución de la tecnología del hardware y del software la ha convertido en una de las inversiones más importantes del siglo XXI.

Sin embargo, informarse sobre el uso del ML en las diferentes áreas de una empresa es el primer paso antes de invertir en él. La simple recolección de grandes cantidades de datos y su procesamiento ciego no le entrega ningún valor a una organización. Es esencial consultar a expertos en la materia, quienes usarán su especialización y sus habilidades de análisis de datos para evaluar los riesgos y las oportunidades de invertir en el ML desde las primeras etapas.

Los siguientes son algunos beneficios del uso exitoso del ML:

  • A medida que juegos de datos cada vez más grandes se hacen parte del día a día, las herramientas y técnicas del ML permiten manejarlos de forma eficaz para develar ideas valiosas que una persona no podría ver debido al enorme volumen de información.
  • Permite tomar decisiones en tiempo real a partir de grandes conjuntos de datos que se actualizan constantemente.
  • Permite aplicar el enfoque de mejora continua de la calidad sobre la base de sistemas de datos dinámicos, grandes y complejos.
  • Permite automatizar tareas ejecutadas manualmente gracias al uso de modelos predictivos.
  • Las técnicas de ML han demostrado su gran valor al optimizar muchos aspectos de las prácticas comerciales e industriales, lo que se ha traducido en significativos ahorros de tiempo y dinero.

¿Es una tecnología nueva?

A pesar de la gran confusión que rodea a este término, el ML no es una tecnología nueva. Las redes neuronales artificiales fueron desarrolladas por primera vez en la década de 1950 para modelar sistemas computacionales basados en el cerebro humano. Un ejemplo notable de esta idea es la mundialmente famosa prueba de Turing, introducida por Alan Turing en 1950. Para pasar esta prueba, una computadora debe imitar a un ser humano de tal manera que logre engañar a humanos reales.

Los primeros usos del ML se dieron en los sectores de las finanzas, telecomunicaciones y el ejército, e iban desde el reconocimiento de cheques escritos a mano y la predicción de fraude financiero hasta la optimización de sistemas de telecomunicaciones y la planificación de logística militar a gran escala. Posteriormente, el ML ha sido adoptado por industrias como la analítica deportiva, las grandes empresas farmacéuticas y del cuidado de la salud, y, por supuesto, Microsoft, Google y Amazon, quienes lo usan tanto para sus procesos internos como para ofrecerlo a sus clientes.

ML para la práctica de las geociencias

Los geocientistas están descubriendo rápidamente los beneficios del ML. Los siguientes son algunos ejemplos de proyectos que utilizan ML para potenciar el valor de los juegos de datos:

  • Optimizar la ubicación de pozos. El uso de ML permite analizar datos de muestreo de manera que se pueda predecir cuál es la mejor tasa de bombeo y la mejor ubicación del pozo para extraer la mayoría de la pluma de contaminación de manera eficiente.
  • Optimizar el uso del suelo en la agricultura. Al usar ML para analizar los resultados de los análisis de laboratorio de suelo se pueden predecir las áreas con niveles óptimos de macronutrientes agrícolas, tales como: nitrógeno (N), fósforo (P) y potasio (K).
  • Predecir las propiedades de los materiales con análisis de imágenes hiperespectrales. Con el ML se puede combinar la información de imágenes hiperespectrales con datos de las propiedades mecánicas y químicas provenientes del muestreo de rocas, y con ello obtener las relaciones entre ellos, con el fin de predecir las propiedades de los materiales como el índice RQD y la lixiviabilidad.
  • Optimizar la determinación de la secuencia litológica en la minería. En la minería se puede usar ML para predecir el contenido de azufre en las litologías con una base de datos de ensayos, y con esto ayudar a definir mejor las unidades litológicas y a reducir la cantidad de análisis de laboratorio que se necesitan.

La mayoría de los datos de muestras que se usan en proyectos de geociencias se pueden clasificar en dos categorías principales:

Amplios: relativamente pocas muestras, pero con muchas variables.

Profundos: relativamente pocas variables, pero con muchas muestras.

Se puede crear un modelo informático predictivo, usando aproximadamente un 80% de los datos disponibles y datos sustitutos o suplementarios. Con él se pueden predecir futuros resultados, siempre y cuando los algoritmos de ML encuentren relaciones dentro de los datos. En el caso de necesitar más datos es posible complementar con datos de otras fuentes como los juegos de datos químicos, las bases de datos de ensayos y los registros de sondajes geológicos.

¿Qué le depara el futuro al ML?

La transformación digital ha ganado un impulso importante en los últimos años y ha llegado a variados segmentos de la industria, gracias al rápido crecimiento de la nube y del poder de sus aplicaciones. Además de la evolución del hardware y del software, la rápida transformación digital de las empresas también se ha debido a que sus líderes tienen una mayor conciencia de su importancia. Esto augura un promisorio futuro en donde la tasa de uso del ML en las industrias será cada vez mayor.

En Golder, hemos observado un importante aumento de clientes que piden apoyo para hacer análisis con ML, con el fin de aumentar la eficiencia y encontrar una solución a sus problemas más desafiantes. Al aplicar nuestra especialización y experiencia técnica a los datos de nuestros clientes, estos han podido usar el análisis predictivo para tomar decisiones inteligentes y más precisas de manera oportuna. El resultado final ha sido un ahorro importante y continuo de costos para muchos clientes.

A medida que crece la popularidad del ML, es evidente que los científicos de datos recién están empezando a conocer sus posibilidades. Prevemos que más personas comprenderán cómo funciona el ML y, en consecuencia, aprenderán a aplicar estas herramientas. Anticipamos que más sectores y empresas adoptarán las técnicas del ML para analizar datos estructurados en hojas de cálculo, así como datos no estructurados de imágenes capturadas desde drones, análisis espectral, satélites, etc. A medida que aumenta el uso de imágenes obtenidas a través de computadoras, se crearán nuevos algoritmos para analizarlas. Las empresas continuarán innovando e invirtiendo en ML para obtener mejores resultados a medida que la tecnología evoluciona.

 

MÁS INFORMACIÓN SOBRE GOLDER DIGITAL

 

SOBRE LOS AUTORES

Hooman Hosseinpour Member Name

Ingeniero Jefe en Geomecánica

Morgan Warren Member Name

Geoquímico de Proyectos

DESCUBRIR MÁS

Golder usa cookies para asegurarse de entregarle la mejor experiencia en el sitio web. Al continuar usando este sitio web, suponemos que usted entrega su consentimiento para recibir todas las cookies de este sitio web.

Aceptar Conocer más