scottleibrand / gpt-summarizer

Extract text from PDF, summarize each section w/ GPT, and provide a summarized outline of the paper
MIT License
188 stars 27 forks source link

Update summarize.py #4

Closed okneze closed 1 year ago

okneze commented 1 year ago

I tried to implement the "output language selector" raised (by me :D ) in #3 .

As this is my absolute first commit/PR ever, I am more than thankful for any feedback on what to change or improve :)

The script now takes an additional optional parameter: "language" Default is still english, so without parameter the current querys are untouched. if language is specified, at the end of the querys a sentence is added that output should be in specified language.

In my tests, "german" or "deutscher" as parameter has better results than "deutsch"....

scottleibrand commented 1 year ago

Testing on https://arstechnica.com/science/2022/12/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft/: No language specified correctly results in an English summary:

./summarize.py "https://arstechnica.com/science/2022/12/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft/"
cat /tmp/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft.overall_summary.txt

The article discusses the damage to the Soyuz spacecraft caused by a debris strike, which resulted in a 0.8 mm hole and the loss of coolant in the external loop. Russian specialists are working with NASA to assess the issue and decide on future actions, which could include flying the three crew members back to Earth in the Soyuz MS-22 or autonomously flying the next Soyuz in line, Soyuz MS-23, up to the station for the return flight. The crew of Soyuz MS-22 had been due to return to Earth in March before the coolant leak, and there are concerns about the interior of the Soyuz spacecraft overheating. The work over the next week will likely be conducted to understand how the spacecraft's internal temperature will change once it departs from the space station. The biggest risk will come if there is a health emergency with the crew or if there is some station issue that forces an emergency evacuation. The article also provides links to various pages on the Ars Technica website, including the Store, Subscriptions, Videos, Features, Reviews, RSS Feeds, Mobile Site, About Ars, Staff Directory, Contact Us, Advertise with Ars, and Reprints.

Deleting the overall summary, leaving the cached English section summaries, and re-running w/ Spanish correctly results in an overall summary in Spanish:

rm russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft.overall_summary.txt
./summarize.py "https://arstechnica.com/science/2022/12/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft/" Spanish
cat /tmp/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft.overall_summary.txt

El artículo trata sobre el daño causado al vehículo espacial Soyuz por un impacto de desechos, que resultó en un agujero de 0.8 mm y la pérdida de refrigerante en el bucle externo. Los especialistas rusos están trabajando con la NASA para evaluar el problema y decidir las acciones futuras, que podrían incluir el regreso de los tres miembros de la tripulación a la Tierra en el Soyuz MS-22 o el vuelo autónomo del próximo Soyuz en línea, el Soyuz MS-23, hasta la estación para el vuelo de regreso. La tripulación del Soyuz MS-22 estaba programada para regresar a la Tierra en marzo antes de la fuga de refrigerante, y hay preocupaciones sobre la temperatura interior del vehículo espacial Soyuz una vez que abandone la estación espacial. La mayor parte del trabajo de la próxima semana se realizará para comprender cómo cambiará la temperatura interna del vehículo una vez que abandone la estación espacial. El mayor riesgo vendrá si hay una emergencia de salud con la tripulación o si hay algún problema con la estación que obligue a una evacuación de emergencia. La última sección proporciona enlaces a varias páginas del sitio web de Ars Technica, como la tienda, suscripciones, videos, características, reseñas, fuentes RSS, sitio móvil, acerca de Ars, directorio de personal, contáctenos, anuncie con Ars y reimpresiones.

Deleting all summaries and running with Spanish correctly re-generates all section summaries in Spanish and an overall summary in Spanish:

rm /tmp/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft.*
summarize.py "https://arstechnica.com/science/2022/12/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft/" Spanish
cat /tmp/russia-says-it-will-take-no-immediate-action-on-damaged-soyuz-spacecraft.overall_summary.txt

El lunes, la corporación espacial rusa Roscosmos publicó una declaración en la que anunció que no tomarían ninguna acción inmediata sobre la nave espacial Soyuz dañada. Esto se debe a que una pequeña pieza de basura había roto un bucle de enfriamiento externo que radia el calor desde el interior de la Soyuz al espacio. Esto ha retrasado dos salidas al espacio a bordo de la Estación Espacial Internacional mientras los astronautas trabajan con los controladores de tierra para evaluar los daños en el Soyuz.

Sin un radiador externo funcional, hay preocupaciones sobre la temperatura interior de la nave espacial Soyuz. Esto podría dañar los sensibles computadores de vuelo, lo que requeriría una entrada manual a la atmósfera de la Tierra. Gran parte del trabajo de la próxima semana probablemente se realizará para comprender cómo cambiará la temperatura interna de la nave espacial una vez que abandone la estación espacial.

En realidad, el Soyuz es una nave espacial resistente, construida para resistir varias fallas. Ciertamente, los funcionarios rusos estarán ansiosos por usar la nave espacial existente para volver a casa si es posible. Esto se debe a que habrá un costo financiero sustancial si el vehículo Soyuz MS-23, que estaba programado para llevar a tres nuevos pasajeros a la estación en marzo, debe ser reutilizado para este vuelo de regreso. Por ahora, el mayor riesgo surgirá si hay una emergencia de salud con los cosmonautas Sergey Prokopyev y Dmitri Petelin y el astronauta de la NASA Frank Rubio, o si hay algún problema en la estación que obligue a una evacuación de emergencia. En este momento, no está claro si el Soyuz MS-22 es un bote salvavidas capaz.