CEEINF-UTFSM / ceeinf-web-backend

Backend para la web del CEEINF
MIT License
8 stars 0 forks source link

Recopilar información de carrera - Calendario de charlas, becas, fondos y actividades extracurriculares #10

Open FelipeGuicharrousse opened 4 years ago

FelipeGuicharrousse commented 4 years ago

Busqueda de informacion de carrera

FelipeGuicharrousse commented 4 years ago

https://usm.cl/admision/becas/ Informacion de becas https://www.usm.cl/admision/beneficios/ Beneficios estudiantiles de la universidad https://www.rree.usm.cl/beneficios/becas-y-creditos-usm/ Fondos solidarios https://eventos.usm.cl/ Charlas de la universidad Las actividades extracurriculares del DEFIDER: https://defider.usm.cl/campus-san-joaquin/areas-san-joaquin/extension-sanjoaquin/ Extension con el medio https://defider.usm.cl/campus-san-joaquin/areas-san-joaquin/deportes-sanjoaquin/ Deportes

FelipeGuicharrousse commented 4 years ago

`

Importar las librerias beautifulsoup4 y requests

from bs4 import BeautifulSoup import requests

Deportes. Busca los diversos deportes que hay.

url = 'https://defider.usm.cl/campus-san-joaquin/areas-san-joaquin/deportes-sanjoaquin/' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser')

dep = soup.findall('h2', class='category-title') deportes = list()

for i in dep: deportes.append(i.text)

Extension con el medio.

url = 'https://defider.usm.cl/campus-san-joaquin/areas-san-joaquin/extension-sanjoaquin/' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser')

ex = soup.findall('h2', class='category-title') extension = list()

for i in ex: extension.append(i.text)

Becas. Busca solo los nombres de las becas, no encuentra en que consisten.

url = 'https://usm.cl/admision/becas/' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser')

be = soup.find_all('h2') becas = list()

for i in be: becas.append(i.text)

Charlas. Crea una lista de tuplas con las diferentes charlas que hay, además de un archivo de texto .csv para analizar mejor los datos.

url = 'https://eventos.usm.cl/' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser')

fe = soup.findall(class='date') fecha = list()

for i in fe: fecha.append(i.text)

ch = soup.find_all('h3') charlas = list()

count = 0 for i in ch: if count >= 2: charlas.append(i.text) count += 1

del charlas[-1]

lista_final = list() for i in range(len(charlas)): lista_final.append((charlas[i], fecha[i]))

plantilla = '{};{}' archivo_de_texto = open('Charlas.csv', 'w') for i in range(len(charlas)): linea = plantilla.format(charlas[i], fecha[i]) archivo_de_texto.write(linea + '\n')`