Deadwood-ai / deadwood-api

Main FastAPI application for the deadwood backend
GNU General Public License v3.0
0 stars 0 forks source link

Update License selection #82

Closed JesJehle closed 4 weeks ago

JesJehle commented 4 weeks ago

Instead of the different available licenses offered at the moment:

Let's simplify the selection into:

1. Open Access

2. View-Only Access

3. Restricted Access

Note: All data will be used to train our models to improve our services.

@cmosig @tejakattenborn What do you think?

cmosig commented 4 weeks ago

We can't simplify all the licenses to CC-BY as there specifically user supplied or the datasets were originally published in that license.

I would maybe entirely remove the option for users to choose between licenses in the UI and default to CC-BY.

Option (2) and (3) are not licenses. Licenses need to be defined somewhere afaik.

While we need some attribute representing (2) and (3) somewhere in the backend, I would not expose these options to users while uploading, only on request.

tldr, by suggested changes:

JesJehle commented 4 weeks ago

Hmm, das Problem ist, wenn wir die Daten visualisieren, d.h. als COGs verfügbar machen, ist es sehr einfach, sie komplett herunterzuladen. Einfach in den Netzwerk-Tab gehen, URL kopieren und herunterladen. Also, was machen wir?

cmosig commented 4 weeks ago

Haha, stimmt. Hab gerade keine Minute gebraucht das zu finden.

halb gebackene Ideen die mir einfallen:

JesJehle commented 4 weeks ago

Das sollten wir auf jeden Fall mit Teja besprechen. Wäre schon schade, die Option viewonly nicht zu haben ..

cmosig commented 4 weeks ago

Schon... man könnte es auch offen kommunizieren und sagen das man theoretisch das generierte COG aus dem Netzwerk Tab herunterladen kann. Theoretisch kann man sich ja auch einen Screenshot machen und mit ein bisschen tricksen das in ein GeoTiff umwandeln. Die website zeigt ja auch genau an wo das orthophoto ist. Weiß nicht ob es technisch überhaupt 100% möglich ist zu verhinden sich die Daten zu ziehen.

Warum wollten wir nochmal viewonly? Dafür gibts doch nur eine Person, aka Schwarzwald Zeitserie.

tejakattenborn commented 4 weeks ago

Generell mit allen Antworten von Clemens (1st reply). Der Punkt mit dem view only sollte aber schon möglich sein und ist auch für das Projekt aus dem Schwarzwald zwingend erforderlich. Hier meine Idee:

Kategory "not open". Bei diesen Daten zeigen wir nur die Geolocation an als Punkt an und addieren da noch nen random Fehler von 10 km drauf. Kategory "view only". Hier gibts einfach kein Download-Button. Wenn sich einer das Bild irgendwie hackt, dann hat er es halt. Da seh ich kein Drama. Wir haben aber vom Schwarzwald-NP das okay, dass wir die Bilder anzeigen dürfen (aber sie sollen nicht runterladbar sein).

Okay für Euch so?

cmosig commented 4 weeks ago

@tejakattenborn das "Problem" ist das es wirklich extrem einfach ist sich die tif zu extrahieren. Es ist nur F12 -> Netzwerk Tab und dann auf den Dateinamen klicken.

Wir haben effektiv einen offenen File Server mit den COGs und das Frontend/Visualisierung ließt daraus.

Ich hab kein gutes Bauchgefühl damit offiziell eine view-only Variante anzubieten. Ggf dann nur für den Schwarzwald Datensatz; das musst ihr verantworten. Weiß nicht ob/was ihr unterschrieben habt.

cmosig commented 4 weeks ago

@JesJehle kann man eigentlich alle COGs zugreifen sobald man den Namen kennt?

Für die privaten datasets darf das dann auf keinen Fall möglich sein. Da muss es noch ein authentication layer geben. Da hängen mehrere NDAs dran.

tejakattenborn commented 4 weeks ago

Ja, ich weiß, dass es einfach ist die Daten zu ziehen. Das war oben mit "view only" so gemeint, dass das bisher nur für den Schwarzwalddatensatz in Frage kommt. Mit anderen Daten würde ich das NICHT machen :-)

mmaelicke commented 4 weeks ago

kurz meine 50cent: Ich glaube die grundsätzliche Frage ist hier: Sollen die Schwarzwalddaten nicht technisch nicht runterladbar sein, weil die Daten nicht 'geleakt' werden dürfen, oder soll man sie nur nicht runterladen dürfen. Denn am Ende des Tages darf man bilder auf einer Webseite nur für den privaten gebrauch runterladen. Wenn wir also auch nochmal klar darauf hinweisen (evtl. mit watermark), dass diese Daten nicht runtergeladen werden dürfen sind wir meines Erachtens 'rechtlich' auf der sicheren Seite. vgl. hier seiten wie shutterstock, da kann ich alles sehr einfach laden, aber ich darfs nicht. die erkennen ihre unbezahlten daten wieder und schicken dir ne abmahnung wenn du es trotzdem machst. Watermarks können übrigens sichtbar oder unsichtbar sein...

Die privaten Daten nur über authentication zu laden, da müssen wir noch ein wenig rumprobieren, wie sich das sinnvoll realisieren lässt, denn dieser prozess wird das laden der Daten deutlich behindern und im vergleich zu den offenen daten langsamer sein.

tejakattenborn commented 4 weeks ago

Genau, die Schwarzwalddaten "dürfen" nicht runtergeladen werden. Wenn es jemand sich da durchhackt dann ist das nicht unser Bier. Watermark ist eine gute Idee. Aber ihr braucht da auch keinen großen Aufwand machen wenn das umständlich ist. hauptsache da ist kein Download-Button :-) bzw. ausgegraut.

JesJehle commented 4 weeks ago

Also gilt das dann auch für alle weiteren viewonly Daten?

tejakattenborn commented 4 weeks ago

Nein; nur Schwarzwald weil es Projektbezogen ist. Sonst würde ich glaube ich garkein View-Only machen.

JesJehle commented 4 weeks ago

@JesJehle kann man eigentlich alle COGs zugreifen sobald man den Namen kennt?

Für die privaten datasets darf das dann auf keinen Fall möglich sein. Da muss es noch ein authentication layer geben. Da hängen mehrere NDAs dran.

Nur wenn sie über einen fileserver offen bereitgestellt werden. Das ist mit dem cogs Ordner der Fall. Wenn wir die privaten Daten auch irgendwie für eine bestimmte Nutzergruppe visualisieren wollen, müssen wir das über einen zusätzlichen Autorisierung-Layer mit einem Proxyserver oder so was machen.

JesJehle commented 4 weeks ago

Nein; nur Schwarzwald weil es Projektbezogen ist. Sonst würde ich glaube ich garkein View-Only machen.

Ok, aber dann würde ich die Option weglassen und nur public und private anbieten, oder?

cmosig commented 4 weeks ago

Nein; nur Schwarzwald weil es Projektbezogen ist. Sonst würde ich glaube ich garkein View-Only machen.

Ok, aber dann würde ich die Option weglassen und nur public und private anbieten, oder?

Klingt gut :+1:

Aber private muss wirklich private sein, s.o. :)

JesJehle commented 4 weeks ago

83

cmosig commented 14 hours ago

@JesJehle

bzgl private data auf der Website. Ist da noch eine Änderung in Planung oder im fertigen Zustand?

Auf private Daten kann man im Moment einfach direkt über den link zugreifen. Da es ja einfach eine fortlaufende ID ist, ist das ein recht großer security leak. Das imo zu unsicher. Manche Kollegen haben uns Daten sogar Passwordgeschützt geschickt weil da wohl viel dranhängt das die nicht öffentlicht werden.

E.g.: https://deadtrees.earth/dataset/3713