silviaegt / dudas

un espacio para compartir preguntas que tengo
MIT License
1 stars 1 forks source link

Extraer título y autor con strcapture #1

Closed sicabi closed 3 years ago

sicabi commented 3 years ago

Hola Silvia: Vi que colocaste esta duda en Twitter y quise intentar resolverla. Esto es lo que pude hacer. Colapsé las líneas en una cadena para facilitar la detección de los patrones, y luego usé str_extract_all() para detectar las cadenas previas a "\\nAuthor:" (hay 14 casos en los que "Author:" no está precedido por saltos de línea y no los capturé), luego use strcapture() de rbase para colocar solo los patrones que me interesaban en su respectiva columna. Finalmente, convertí el data.frame en tibble de 100 obs x 2 columnas: autor y título. Muchos saludos.

silviaegt commented 3 years ago

¡Muchísimas gracias por la ayuda @sicabi! No conocía strcapture() y aprendí muchísimo viendo tu solución.

sicabi commented 3 years ago

De nada! Me pareció un ejercicio interesante y lograble, y el resultado final también me enseñó cosas. Gracias por la idea de subirlo por GitHub porque también estoy aprendiendo a usarlo y todavía no entiendía bien las diferencias entre pulls e issues, y las otras respuestas ya me ayudaron a entenderlo.