AgusDelga2 / YPF_bolsa

0 stars 0 forks source link

Explicación de web scraping #2

Open AgusDelga2 opened 1 year ago

AgusDelga2 commented 1 year ago

El web scraping es una técnica utilizada para extraer datos de sitios web de forma automatizada. Consiste en escribir un código que navega por las páginas web, interactúa con los elementos y extrae la información deseada.

En el presente proyecto, hemos utilizado la biblioteca Selenium para llevar a cabo el web scraping. Selenium es una biblioteca de automatización de navegador que nos permite controlar un navegador web de manera programática.

Los pasos seguidos en este proyecto han sido los siguientes:

  1. Configuración: Se instaló Selenium y se descargó el controlador del navegador ChromeDriver para Google Chrome.
  2. Creación de una instancia del navegador: A través de Selenium, se inició el navegador web y se creó una instancia que permitió controlarlo mediante código.
  3. Navegación y búsqueda de elementos: Utilizamos los métodos proporcionados por Selenium para navegar por las páginas web y buscar elementos específicos. En este caso, hemos utilizado el método find_element() para encontrar elementos basados en su ruta XPath. Este fué el único método que nos permitió acceder a los datos en esta página, lo cual fue un problema al momento de repetir la tarea, ya que las rutas XPath cambian constantemente.
  4. Extracción de datos: Una vez que se localizaron los elementos deseados en la página web, se utilizó Selenium para extraer su contenido.
  5. Procesamiento de datos: Los datos extraídos se procesaron y luego se almacenaron en una base de datos SQL utilizando SQLite y posteriormente se guardaron en un archivo CSV para su posterior análisis.