paneldata / twinlife

Eine genetisch informative, längsschnittliche Studie zur Entstehung von sozialer Ungleichheit
0 stars 3 forks source link

Nicht nachvollziehbare Suchergebnisse #53

Open kkrell opened 5 years ago

kkrell commented 5 years ago

Ein inhaltliches Problem bei der Suchfunktion ist uns aufgefallen:

Sucht man beispielsweise nach "behavior problems", kommen einige Ergebnisse die gar nichts mit den Begriffen zu tun haben, z.B. https://ddionrails.soep.de/twinlife/inst/twinlife-2014-f2f_modul1_zygk1k2/zyg0703 - hier spielt weder "behavior" noch "problems" eine Rolle, wie kommt das als Suchergebnis zustande?

Auch wenn man etwas abstraktes wie "Social capital of individuals" [Angabe aus unserer Study info zu den Inhalten der Studie] sucht, kommt eine lange, recht merkwürdige Liste von Variablen zustande, bei der ich keinen Zusammenhang zu den Suchbegriffen erkennen kann.

Verstehe ich sie Suchmaschine ansonsten richtig, dass bei der Stichwortsuche nur Ergebnisse angezeigt werden, die an irgendeiner Stelle (also Label oder Filter (oder auch Description?)) Teile des Suchbegriffs enthalten? Hast du insgesamt ein paar Hinweise dazu, wie intelligent oder abstrakt die Suche funktioniert? Damit wir ggf. Anpassungen machen können, um die Suche für die Nutzer zu erleichtern.

afuetterer commented 5 years ago

Bei "zyg0703" steckt in der Datei questions.csv bspw. das hier mit drin ""Adapted from: Goldsmith, H. H. (1991). A Zygosity Questionnaire for Young Twins: A Research Note. Behavior Genetics, 21 (3), 257-269 (for K1/K2)". Es wird sicher auf "behavior" gematcht.

Hast du einige Beispiele für Variablen, die nicht mit "Social capital of individuals" matchen sollen?

kkrell commented 5 years ago

Alles klar, dann kann bei vielen Suchergebnissen nachvollziehen, wie diese zustande kommen. Da müssen wir mal im Team überlegen, wie wir damit umgehen.

Eine Frage wird z.B. angezeigt, wenn man nach "social capital" sucht: https://ddionrails.soep.de/twinlife/inst/twinlife-2014-F2F_Modul1_ZygK1K2/zyg0109 Das ist die berechnete Eiigkeit der Zwillinge. Ich vermute, hier matcht auch ein Wort in der Quelle.

kkrell commented 5 years ago

Hallo Alex, noch eine Frage dazu: Könnt ihr denn im System beeinflussen, in welchen csv's die Suche stattfindet? Standardmäßig sucht die Suchmaschine ja offenbar in ALLEN csv's und allen Spalten nach Matches. Evtl. könnte man die Quellen (bzw. description-Spalte, die bei uns die Quellen enthält) dabei ausschließen? Das würde wahrscheinlich einen Großteil der für uns unsinnigen Suchergebnisse beseitigen.

Viele Grüße, Kristina

afuetterer commented 5 years ago

Wir schrauben gerade an der Suche.

Vermutlich ist bei der Frage zyg0109 das "Project TwinLife Genetic and social causes of life chances" mit dem "social" für den Treffer verantwortlich.

Bei fast allen Objekten gibt es "name", "label", "description". Darüber soll auch gesucht werden.

afuetterer commented 5 years ago

Suche nach Fragen im neuen Suchinterface: https://paneldata.org/search/questions?Search=%22social+capital%22&Study=%5B%22TwinLife%22%5D