Open ladamczy opened 11 months ago
czy zostawić cięcia na fiducial region i jakość tracków ?
Przygotowując program do badania przypadków 3 ToF + 1 nie-ToF warto zacząć pisanie programu (to może być osobny projekt) do badania wydajności ToF.
Opisze główne kroki tej procedury (która moze jeszcze ulec zmianie):
wybieramy przypadki które maja 1 werteks i przynajmniej trzy sladu z ToF zmaczowane z tym werteksem (DCA < 3 cm)
co powinnam zrobić z przypadkami gdzie mam 4 z TOF, ale jeden z nich nie ma DCA < 3 cm?
Teraz robimy petle po wszsytkich parach sladów stowarzyszonych z tym werteksem (DCA<3cm i sama ładunków 0) rozumiem że ta pętla jest robiona dla trzech śladów z TOF - wybieram podpróbkę która spełnia powyższy warunek.
ale wtaki sposób że przynajmniej jeden jest z ToF (będziemy go nazywać tagiem) a drugi ślad jest probem . Jesli oba slady sa z ToF to mamy dwa przypadki (kazdy ze sladów jest raz tagiem a raz probem).
teraz zawsze będę miała dwa przypadki ze względu na warunek nTOFmatchedTracks = 3 or 4
Dla par które maja DCA(pomiędzu soba z algorytmu V0) < 1cm. histogramujemy ich masę niezmienniczą . Robimyd a oaobne histogramy jeden gdy probe jest z ToF i druhi gdy jest bez ToF. Potem podam co dalej. To zalezy od tego czy tam będziemy cos widzieć czy nie.
upewnię się - dla wymogu 3 lub 4 z TOF i 1 vtx - histogram gdzie probe jest z Tof będzie wypełniany 3 razy, a bez ToF raz ( 3 tracki )lub 4 z i 0 bez Tof (4 tracki)
I jeszcze mam pytanie czy ślad do 3 z TOF dobrać dla najmnieszjej odległości od masy kaonu, tak jak poprzednio
czy zostawić cięcia na fiducial region i jakość tracków ?
jakość traków pozostaje, natomiast ciecia fiducial (na protony) mozna usunąć. W zasadzie interesuja nas tylko K0. Obojetne z jakiego procesu pochodzą.
czy zostawić cięcia na fiducial region i jakość tracków ?
jakość traków pozostaje, natomiast ciecia fiducial (na protony) mozna usunąć. W zasadzie interesuja nas tylko K0. Obojetne z jakiego procesu pochodzą.
czyli tę analizę robić na pełnych danych, a nie z preselekcji ?
Przygotowując program do badania przypadków 3 ToF + 1 nie-ToF warto zacząć pisanie programu (to może być osobny projekt) do badania wydajności ToF. Opisze główne kroki tej procedury (która moze jeszcze ulec zmianie): wybieramy przypadki które maja 1 werteks i przynajmniej trzy sladu z ToF zmaczowane z tym werteksem (DCA < 3 cm)
co powinnam zrobić z przypadkami gdzie mam 4 z TOF, ale jeden z nich nie ma DCA < 3 cm?
Mogą zostać, ale pewnie te dodatkowe ślady nie będą tworzyć dobrych K0
Teraz robimy petle po wszsytkich parach sladów stowarzyszonych z tym werteksem (DCA<3cm i sama ładunków 0) rozumiem że ta pętla jest robiona dla trzech śladów z TOF - wybieram podpróbkę która spełnia powyższy warunek. to dotyczy wyboru par sladów. Jak mamy cztery slady np. 1+2+3 -(TOF) 1- ( nieToF)
to mamy cztery pary (dwie sa w dwóch kombinacjach więc razem 6) 1+3-(TOF) 3-1+(T0F) 2+3-(TOF) 3-2+(T0F) 1+(TOF) 1-(nie TOF) 2+(TOF) 1-(nie TOF) W każdej parze mamy jeden tag (ten pierwszy) i jeden probe (ten drugi) Oczywiście niektóre pary wypadna vo nie beda spełniały warunku DCA(pipi)<1.ale wtaki sposób że przynajmniej jeden jest z ToF (będziemy go nazywać tagiem) a drugi ślad jest probem . Jesli oba slady sa z ToF to mamy dwa przypadki (kazdy ze sladów jest raz tagiem a raz probem).
teraz zawsze będę miała dwa przypadki ze względu na warunek nTOFmatchedTracks = 3 or 4
nie rozumiem
Dla par które maja DCA(pomiędzu soba z algorytmu V0) < 1cm. histogramujemy ich masę niezmienniczą . Robimyd a oaobne histogramy jeden gdy probe jest z ToF i druhi gdy jest bez ToF. Potem podam co dalej. To zalezy od tego czy tam będziemy cos widzieć czy nie.
upewnię się - dla wymogu 3 lub 4 z TOF i 1 vtx - histogram gdzie probe jest z Tof będzie wypełniany 3 razy, a bez ToF raz ( 3 tracki )lub 4 z i 0 bez Tof (4 tracki) To zalezy od sumy ładunków i spełnienia warunku dca(pipi0<1 cm . Ale tak , tyle jest potencjalnych kandydatów na probe z ToF i bez toF
I jeszcze mam pytanie czy ślad do 3 z TOF dobrać dla najmnieszjej odległości od masy kaonu, tak jak poprzednio
nie , robimy rozkłady po wszystkich możłiwych sladach bez ToF.
czy zostawić cięcia na fiducial region i jakość tracków ?
jakość traków pozostaje, natomiast ciecia fiducial (na protony) mozna usunąć. W zasadzie interesuja nas tylko K0. Obojetne z jakiego procesu pochodzą.
czyli tę analizę robić na pełnych danych, a nie z preselekcji ?
może Pani zacząć od danych po preseleksji (będzie szybciej) ale ostatecznie użyjemy wszytskich aby zmniejszyć fluktuacje.
wydaje mi sie że zbytnio komplikujemy analize. Wydaje mi się to dość proste:
W Exclusive_Analysis dodałam kod TofEfficiency.cxx. W skrócie: 1) wybieram przypadki z 1 vtx 2) wybieram ślady z DCA < 3 cm. Jeżeli wśród nich są przynajmniej 3 ślady z TOF to akceptuję przypadek 3) w pętli po parach - a) sprawdzam czy przynajmniej jeden track z pary ma hit w TOF b) sprawdzam czy para ma zerowy ładunek c) jeżeli kaon.dcaDaughters < 1.0 cm - wypełniam odpowiedni histogram -jeden histogram jest wypełniany kaonami, które mają dwa ślady w TOF, a drugi, gdzie tylko jeden.
Poniżej przesyłam wyniki dla MC i danych.
HistKaonMassProbeWithTofMC.pdf HistKaonMassProbeWithTofData.pdf
Pytanie czy na tak dużym tle jest Pani w stanie dofitowac K0+tło . Chcemy z fitu wyznaczyć ilość K0 z probem z ToF(N_T) i z probem bez ToF (N_B). Wydajność ToF to
N_T/(N_T+N_B)
Jesli nie to trzeba będzie wyczyscić próbkę (np. ciecie na R_K0>....)
W kolejnym kroku będziemy wyznaczać wydajności w funkji ładunku, pT, eta probu i może Z_K0, R_K0. Zacznijmy od ładunku czyli robimy osobne histogramy dla dodatniego probu i ujemnego probu.
Jeszcze nie dodałam cięcia na Nfit i NdEdx i mam pytanie czy dodać cięcie na eta i pT. Teraz nie robiłam rozgraniczenia pomiędzy tag a probe - czyli histogram z dwoma śladami z TOF wypełniłam raz - jeżeli będę je rozróżniała to histgram masy będzie dwuktrotnie większy.
Dopóki nie używamy dE/dx to nie powinniśmy używać ciecia na NdEdx. Może go Pani usunąć. Odnośnie pT, eta to korzystamy ze standardowych cięć.
a czy przypadki z dwoma śladami z TOF powinnam traktować jako oddzielne przypadki , gdzie raz jeden track jest tag a innym razem drugi i wypełniać histogram dwukrotnie tą samą masą?
tak , dwukrotnie.
Jeżeli wypełniam histogram dwukrotnie to dla MC mam więcej przypadków z TOF niż bez... Rozdzieliłam przypadki z dodatnim i ujemnym ładunkiem probe oraz dodałam warunek na ete i pT pionu. Poniżej przesyłam wyniki dla MC i danych. Zaktualizowałam kod w git.
HistKaonMassProbeWithTofData.pdf HistKaonMassProbeWithTofNegProbeData.pdf HistKaonMassProbeWithTofPosProbeData.pdf
HistKaonMassProbeWithTofMC.pdf HistKaonMassProbeWithTofNegProbeMC.pdf HistKaonMassProbeWithTofPosProbeMC.pdf
Dla danych też ma Pani więcej z ToF niz bez. Tylko musi tam Pani dofitowć K0+tło i wyciągnąc ilość K0. W MC nie ma tła. Wydajność ToF jest rzedu 70% zatem spodziewamy sie dwa razy więcej z ToF niz bez ToF.
Będziemy badać wydajność ToF w funkcji wielu zmiennych.
Prosze do tych badać zrobić cieiice na |v_z|<80
Przesyłam wyniki, na ten moment bez numeru fillu i 2D eta-pT TOF-6.pdf
Strona 1
policzyła Pani niewydajność (25-30%) . Wydajność to 70-75% . Czy dla MC ilość K0 pochodzi z fitu czy liczy Pani ile jest kaonów w oknie masy?
W przypadku danych jesteśmy zdominowai przez tło. Musi Pani zrobić fit do rozkładu masy K0-tło . Już to Pani robiła. Wydajność liczymy tylko z ilości K0 a nie z ilości kandydatów na K0.
Przy liczeni wydajności w funcji jakieś wilkości (np. pT probu ) to musi Pani narysować rozkład masy niezmienniczej K0 w każdym binie tej wielkości ( np. 0.2<pT<0.3) i zrobić fit K0+tło. Takich fitów będzie tyle ile jest binów pT (np. 7-8) To samo dla eta, V_z, numer fillu, ...
Strona 1
policzyła Pani niewydajność (25-30%) . Wydajność to 70-75% . Czy dla MC ilość K0 pochodzi z fitu czy liczy Pani ile jest kaonów w oknie masy?
Tak, wiem że się pomyliłam - później podmieniłam PDF, ale może się nie zakualizował.
Wydajności na pierwszej stronie są policzone dla danych - policzyłam całkę z fitu od 0.48 do 0.51 GeV - liczby na pierwszej stronie powinny być podzielone przez 0.03 GeV.
W przypadku danych jesteśmy zdominowai przez tło. Musi Pani zrobić fit do rozkładu masy K0-tło . Już to Pani robiła. Wydajność liczymy tylko z ilości K0 a nie z ilości kandydatów na K0.
tak zrobiłam, nie mam wydajności dla MC, jak napisałam nie znormalizowałam liczb na pierwszej stronie.
Przy liczeni wydajności w funcji jakieś wilkości (np. pT probu ) to musi Pani narysować rozkład masy niezmienniczej K0 w każdym binie tej wielkości ( np. 0.2<pT<0.3) i zrobić fit K0+tło. Takich fitów będzie tyle ile jest binów pT (np. 7-8) To samo dla eta, V_z, numer fillu, ...
Dobrze, postaram się to na jutro zrobić.
Nie wiem czy zrozumiałem. Liczby na pierwszej stronie to wyniki fitów dla danych (?)
Jakie jest chi2? Czy masa K0 jest fitowana czy ustalona. Tam jest duza statystyka wieć można zrobić więcej binów.
Rozumiem ze reszta plotów to już nie sa wyniki fitów (?) Niech Pani plotuje wydajność czyli zamiast hist1 i hist2 hist1/(hist1+hist2) trzeba dobrze policzyć błędy z prawa przenoszenia błedów.
Tak, liczby z pierwszej storny pochodzą z danych. Zrobiłam fit.Integral(0.49,0.51) - żeby mieć liczbę kaonów trzeba jeszcze wyniki podzielić przez 0.02 GeV, ale to nie wpływa na wydajność.
Masa K0 jest fitowana. zwiększe dwukrotnie liczbę binów. Reszta histogramów nie jest wynikiem fitów.
Całke numerycznie prosze robić od 0.48 do 0.52. A najlepiej użyć znanej analitycznie całki z Gaussa od -/infty do +/infty
przesyłam wyniki wydajności dla vtx_z Efficiency_as_a_function_of_z.pdf
Przesyłam wyniki wydajności dla pT, eta i vtx_z. W przypadkach gdzie miałam problem z dopasowaniem przynajmniej jednego z dwóch histogramów to ustawiałam efektywność na zero.
Efficiency_as_a_function_of_z.pdf Efficiency_as_a_function_of_eta.pdf Efficiency_as_a_function_of_pT.pdf
Binowanie V_z, eta, pT powinno być dość gęste ale z drugiej strony takie aby była statystyka potrzebna do fitowania. Proponuje
pT. 0.1-0.2-0.3-0.5-0.7-1.0-1.5-2.5 eta 0.0-0.2-0.4-0.6-0.8-1.0-1.2. i tak samo po ujemnej stronie ety v_z - 100-80-60-50-40-30-20-10-0. i tak samo po ujemnej stronie v_z
Fity są często bardzo złe - miała Pani podawać chi2/ndf na rysunkach. W niektórych przypadkach być może pomogłoby ograniczenie zakresu fitowania Gaussa. Również liczba binów nie musi być taka sama ma każdym rozkładzie masy. Jeśli fity nie wychodzą dobre, to nie można tej procedury fitowania puszczać zupełnie swobodnie - dobrze by bylo zeby Pani mogla zmieniac parametry fitu i powtarzac fit. Wniąż nie ma błędów na wydajności. Na rozkładach wydajności, tam gdzie ona spada z 70-80% do zera, dobrze by bylo dodac jeszcze jeden punkt pośredni.
Przesyłam rozkład pT dla nowego binowania z chi2/ndf.
myśle, ze jeszcze można to troche poprawić
0.2-0.3-0.4-0.5-0.6-0.7-0.8-1.0-1.5-2.5
Poniżej 0.2 nie ma schodzić. Rozumiem, ze do wydajności w funkcji pT ma Pani selekcje |vz|<80 i |eta_probe|<0.1 Czy dla MC jest Pani w stanie cos dofitować (najlepiej embedding) Trzeba będzie jeszcze policzyć wydajność ToF z MC w sposób bezpośredni: Czyli robimy rozkład pT sladów TPC zmaczowanych z poziomem true i patrzymy jak często taki ślad ma zmaczowany hit w ToF.
Zmieniłam binowanie. W każdym przypaku wymagam.
nie mam warunku na eta_probe.
nie możemy tego pokazać na zebraniu bez wyznaczenia błędów które trzeba policzyć z prawa przenoszenia błędów
wydajność = ( T ) / ( T+N). gdzie T to probe w ToF a N to probe bez ToF.
Tutaj mamy kilka problemów:
generalnie chcielibyśmy zrobić ploty takie jak na Fi. 4.5
https://drupal.star.bnl.gov/STAR/system/files/DiffractiveAnalyses_AnalysisNote_ver2p0.pdf
To jest inna metoda tag&probe (tę robi Truhlar)
Chi2/NDF chyba najlepiej byloby liczyć tylko dla tych binów z których wyznaczamy liczbę K0. Tło fluktuuje wokół linii prostej, ale nie leży dokładnie na tej linii, więc daje duży wkład do Chi2.
Dlatego prosiłem o ograniczenie zakresu fitu tak aby założenie liniowości było dość dobrze spełnione. Ewentualnie można sprawdzić czy wielomiany wyższych rzędów dla tła poprawi istotnie Chi2/NDF. Liczenie chi2 tylko z binów gdzie jest sygnał np. +- 3 sigma troche mi sie nie podoba.
Duży wkład do Chi2/ndf daje nie tyle jakieś wyraźne odstępstwo tła od linii prostej, co znaczące fluktuacje wokół tej linii. Obawiam się, że wielomian wyższego rzędu nie poprawi wkladu do Chi2/ndf z obszaru poza pikiem (chyba, że będzie to wielomian bardzo wysokiego rzędu), a może w sposób dowolny (zmieniający się od fitu do fitu) zaburzyć oszacowanie liczby K0 w piku. Trzeba by w każdym ficie dokładnie przyjrzeć się jak wygląda fit tła w obszarze piku.
Nie zgadzam się z tą opinią.
Patrzymy na Chi2/NDF więc fluktuacje zgodne z modelem statystycznym nie zmieniają Chi2/NDF.
Chi2/NDF się pogarsza tylko jak model nie odpowiada rzeczywistości.
Przyglądanie się każdemy fitowi (z dzisiątków które tam się pojawią) chyba nie jest warte zachodu.
Nie mówimy o ficie jakiegoś ważnego parametru. Popatrzmy jakie będa błędy na wydajność może tego
zaniżenia błędów nie bedzie tak widać. Jesli bedzie widac to skalujmy przez sqrt(Chi2/NDF) a dopiero jak
to nie pomoże to będziemy robić bardziej czasochłonne procedury.
Popatrzmy np. na Fig 2 zakres pT 0.4-0.5 GeV w/o TOF: w zakresie piku wszystkie punkty leżą na ficie w granicach 1sigma. Chi2/ndf byloby bardzo dobre. Ponizej piku mamy fluktuacje z binu do binu czesto rzedu 2sigma albo wiecej i to na przemian. Czy to oznacza, że model tła jest zły? Być może nie uwzględnia czegoś, ale z naszego punktu widzenia założenie że tło jest liniowe jest moim zdaniem uzasadnione. Natomiast twierdzenie, że fit jako całość jest zły, bo ma duże Chi2/ndf, nie jest uzasadnione w kontekście wyznaczania wydajności. Może trzeba by przyjąć jakiś większy błąd na oszacowanie tła przed jego odejmowaniem, ale nie ma sensu zmieniać modelu tła na jakiś nieliniowy.
W przykładzie który podajesz fakt że w zakresie piku wszystkie punkty leżą na ficie w granicach 1sigma jest równie podejrzane jak to że poniżej piku są troche wieksze fluktuacje nawet rzedu 2 czy 3 sigma. Fakt że sa na przemian a nie systematycznie w któryms kierunku jest normalnym zachowaniem i właśnie świadczy o tym ze sa to fluktuacje. To nie świadczy o tym że model jest zły natomiast duże Chi2/NDF świadczy o tym że model jest zły. A jedną z możliwych wad modelu jest założenie, że tło jest liniowe w bardzo szerokim zakresie masy. Aby było ciekawiej powołujesz sie na histogram niebieski a ma on lepsze chi/NDF niż wizualnie lepszy histogram czerwony. Bo właśnie duże Chi2/NDF nie bieże sie z kilku dużych fluktuacji tylko wielu systematycznie w jedną stronę. Moim zdaniem to własnie widac na czerwonych histogramach poniżej piku zaczynamy widzieć odchylenia od liniowości. Wystarczy ograniczyć dolna granicę fitu i zobaczymy. Twierdzenie że fit jako całość jest zły, bo ma duże Chi2/ndf jest generalnie uzasadnione. Nie wiem co kontekst wyznaczania wydajności cos tutaj zmienia. I uważam że jeśłi martwi nas chi2/NDF to trzeba zmienić model lub ograniczyć zakres jego stosowania a nie wyklucząć w sposób uznaniowy binów gdzie akurat sa duże fluktuacje. Takie podejście obciąża wyniki.
Myslę, że dyskusja jest bardziej akademicka niż praktyczna. Proponuje aby przyjęla Pani że błąd na ilość K0 jest sqrt(N) gdzie N jest ilością K0. To praktyczne i szybkie rozwiązanie. A jak poprawić Chi2/ndf to się zastanowimy później.
Dodałam błędy pomiarowe do poprzednich wyników.
Dla MC mam mało przypadków i często nie jestem w stanie dopasować gausa do histogramu
A jak te błedy zostały w końcu policzone ?
Zalezność. od pT jest słaba. Myśle, ze dla MC wystarczy narazie jedna liczba dla każdego znaku. dla 0.2<pT<1.5 Może ja Pani narysowac na plotach jako poziomą linie.
Pozostaje jeszcze policzenie wydajności w MC z "definicji" (bez metody tag&probe)
prosze wykorzystać nowa klase StUPCV0 i nowe sugerowane ciecia do tej analizy.
tutaj mozemy dość mozna przyciąc na decayLengthHypo() np (>1 cm) aby pozbyć sie tła.
przesyłam porównanie fitów tła: liniowego i kwadratowego dla różnych zakresów fitu ComparisonTOF.pdf
przesyłam porównanie fitów tła: liniowego i kwadratowego dla różnych zakresów fitu ComparisonTOF.pdf
tutaj użyłam wcześniejszej klasy i cięć
Coś jest dziwnego ze w wąskim zakresie fit kwadratowy ma gorsze chi2/NDF niż liniowy . To jest możliwe tylko wtedy gdy parametr odpowiedzialny za człon kwadratowy jest rowny 0. Może to Pani sprawdzić?
Dodatkowo chi2/NDF to tylko orientacyjna wielkość może Pani sprawdzić jakie jest p-value ?
Wydaje mi się że wyniki dla nowej i sraej klasy są takie same.
p0 - amplituda gausa, p1-średnia, p2 - std, p3, p4, p5 - współczynniki odpowiednio przy 0,1 i 2 potędze x.
szerokie okno
EDM=9.9295e-08 STRATEGY= 1 ERROR MATRIX UNCERTAINTY 1.2 per cent
EXT PARAMETER STEP FIRST
NO. NAME VALUE ERROR SIZE DERIVATIVE
1 p0 1.32457e+03 3.95596e+01 -2.00088e-02 1.61974e-04
2 p1 4.96887e-01 1.07894e-04 -4.16472e-06 -3.09315e-02
3 p2 3.38821e-03 1.18966e-04 3.04564e-06 5.43951e-02
4 p3 1.11849e+03 2.28129e+02 -1.22478e-01 2.17415e-04
5 p4 3.06560e+03 1.72035e+02 -3.21214e-02 7.25219e-05
6 p5 -3.26422e+03 8.87579e+02 5.84487e-01 5.44890e-05
FCN=22.3263 FROM MIGRAD STATUS=CONVERGED 788 CALLS 789 TOTAL
wąskie okno: 1 p0 3.84302e+02 4.99445e+01 -4.94318e-01 1.65643e-06 2 p1 4.98063e-01 7.62645e-04 -2.87869e-04 -6.51748e-04 3 p2 4.12444e-03 9.29813e-04 -4.41668e-05 1.52496e-02 4 p3 3.04110e+03 3.98232e+02 -6.18665e-01 1.97473e-05 5 p4 3.08367e+03 2.99226e+01 4.80292e-02 5.87770e-06 6 p5 3.30315e+02 1.55606e+03 2.62957e+00 5.01883e-06
No Właśnie w wąskim oknie p5 = 300+-1500. Zbyt waskie okno aby człon kwadatowy był potrzebny. Albo wąskie okno albo człony wyższych rzedów.
Przesyłam fit kwadratowy. Użyłam nowej klasy i cięć.
Przesyłam wyniki wydajności TOF dla pT i eta z cięciami na kaony: dca_daughters, dca_beamline, pointingAngleHypo - w zip dodałam fity
Czy aby napewno dobrze Pani liczy błędy ( z prawa przenoszenia błędów) eff = T/(N+T) błąd na T. sqrt(T) , błąd na N. sqrt(N) błąd na eff z prawa przenoszenia błędów ?
Błąd nie powinien wychodzić ponad 100%.
tak, błędy są liczone poprawnie z prawa przenoszenia - prosze nie patrzec na skrajne przypadki w eta - nie mioglam dofitowac histogramu dla probu bez tof
Przygotowując program do badania przypadków 3 ToF + 1 nie-ToF warto zacząć pisanie programu (to może być osobny projekt) do badania wydajności ToF.
Opisze główne kroki tej procedury (która moze jeszcze ulec zmianie):
wybieramy przypadki które maja 1 werteks i przynajmniej trzy sladu z ToF zmaczowane z tym werteksem (DCA < 3 cm) Teraz robimy petle po wszsytkich parach sladów stowarzyszonych z tym werteksem (DCA<3cm i sama ładunków 0) ale wtaki sposób że przynajmniej jeden jest z ToF (będziemy go nazywać tagiem) a drugi ślad jest probem . Jesli oba slady sa z ToF to mamy dwa przypadki (kazdy ze sladów jest raz tagiem a raz probem). Dla par które maja DCA(pomiędzu soba z algorytmu V0) < 1cm. histogramujemy ich masę niezmienniczą . Robimy dwa oaobne histogramy jeden gdy probe jest z ToF i druhi gdy jest bez ToF. Potem podam co dalej. To zalezy od tego czy tam będziemy cos widzieć czy nie.