ladamczy / STAR-Analysis

Repository for AGH-STAR analysis code
2 stars 0 forks source link

Wyznaczanie wydajności ToF metodą tag&probe #13

Open ladamczy opened 11 months ago

ladamczy commented 11 months ago

Przygotowując program do badania przypadków 3 ToF + 1 nie-ToF warto zacząć pisanie programu (to może być osobny projekt) do badania wydajności ToF.

Opisze główne kroki tej procedury (która moze jeszcze ulec zmianie):

wybieramy przypadki które maja 1 werteks i przynajmniej trzy sladu z ToF zmaczowane z tym werteksem (DCA < 3 cm) Teraz robimy petle po wszsytkich parach sladów stowarzyszonych z tym werteksem (DCA<3cm i sama ładunków 0) ale wtaki sposób że przynajmniej jeden jest z ToF (będziemy go nazywać tagiem) a drugi ślad jest probem . Jesli oba slady sa z ToF to mamy dwa przypadki (kazdy ze sladów jest raz tagiem a raz probem). Dla par które maja DCA(pomiędzu soba z algorytmu V0) < 1cm. histogramujemy ich masę niezmienniczą . Robimy dwa oaobne histogramy jeden gdy probe jest z ToF i druhi gdy jest bez ToF. Potem podam co dalej. To zalezy od tego czy tam będziemy cos widzieć czy nie.

PatrycjaMalinowska commented 5 months ago

Powyższe rozkłady zostały przedstawione dla bardziej rygorystycznych cięć na piony absEta < 0.9, pT > 0.2, Nhit > 20 ( w analizie: 1.1, 0.15, 15)

PatrycjaMalinowska commented 5 months ago

Przykład matchowania w eta-phi:

a.pdf

ladamczy commented 5 months ago

Przykład matchowania w eta-phi:

a.pdf

Pozostałe ploty skomentuje później. Teraz szybkie pytanie . Troche dziwi ze "inne" slady sa tak skoncentrowane dla jednego phi. Czy może Pami sprawdzić inne przypadki czy tak zawsze jest ? Czy te inne ślady sa bez ToF czy niektóre maja ToF ?

f1pmpr commented 5 months ago

I proponuje rozciagnac zakres eta od -2 do 2 dla tych studiow. Protony, wiemy ze gdzies tam sa...

PatrycjaMalinowska commented 5 months ago

Powyższy przypadek ma dokładnie 4 tracki TPC z TOF, które są dobrej jakości (pT,eta,Nhit)

a3.pdf - przypadek gdzie jeden track TPC nie spełnia przynajmniej jednego warunku na jakość. a4,a5, a6 , a7,a8,a9 losowe przypadki

a3.pdf a4.pdf a5.pdf a6.pdf a8.pdf a9.pdf a7.pdf

PatrycjaMalinowska commented 5 months ago

Przykład matchowania w eta-phi: a.pdf

Pozostałe ploty skomentuje później. Teraz szybkie pytanie . Troche dziwi ze "inne" slady sa tak skoncentrowane dla jednego phi. Czy może Pami sprawdzić inne przypadki czy tak zawsze jest ? Czy te inne ślady sa bez ToF czy niektóre maja ToF ?

zielone kółka nie mają śladu w TOF i raczej zawsze są skoncentrowane wokół podobnych wartości Phi

ladamczy commented 5 months ago

W zasadzie większość śladów bez tof ma 0<phi<1. to bardzo dziwne. Czy może Pani sprawdzić czy dla danych 4ToF też wszystkie dodatkowe slady bez ToF sa skoncentrowane w tym rejonie phi? Jesli tak to mozna próbowac wykluczyć region 0<phi<1 z poczukiwań śladów bez ToF w przypadakch 3 a szczególnie 2 ToF.

ladamczy commented 5 months ago

Do policzenia wydajności:

1. wybieram 4 pierwsze piony z pętli po MCParticles, o ładunku równym 0 - parę tworzą piony o tej samej wartości GetFirstMother() i przeciwnym znaku.

2. 1SC:  Jeżeli liczba takich pionów !=4 odrzucam przypadek

3. 2SC: odrzucam przypadki któere mają liczbę śladów TPC < 4 (tu moje pytanie: dlaczego mamy przypadki bez śladów TPC  upcEvt->getNumberOfTracks() = 0 ?)

4. pętla po 4 pionach , a wewnątrz pętla po śladach TPC

* wybieragm najmniejszą możiwą odległośc w eta-phi, o tym samym znaku (np. jeżeli PDG_ID = -211, to ładunek tracku TPC musi być -1)  - track TPC jest odrzucany z wektora wszystkich śladów TPC.

5. 3SC: jeżeli liczba tracków TPC spełniająca powyższy wymóg < 4 - odrzucam przypadek - to występuje  dla przypadków gdzie mam N śladów TPC,  a N-1 ma ten sam ładunek.

6. 4SC:Dla 4 tracków  TPC sprawdzam zakres eta, pT, i Nhit i matchowanie z TOF

* jeżeli wszystkie przypadki spełniają powyższy wymóg to przechodzę do liczenia wydajności

Nevt = całkowita liczba przypadków która przeszła powyższe cztery cięcia jest brana do liczenia wydajności.

Rozkłady: perf.pdf

HistCorr1.pdf HistDcaBeamlineLeadingKaon.pdf HistMassLeadingK0.pdf HistNumOfClusters.pdf HistDcaDaughtersLeadingKaon.pdf HistDiffProtonX.pdf HistNumTofTracks.pdf HistPointingAngleLeadingKaon.pdf HistDistR.pdf HistEtaCorrelation.pdf HistPtMiss.pdf HistKsi1.pdf HistKsiCorrelation.pdf HistHypoLengthLeadingKaon.pdf

Nie da sie wygenerowac DiMe tak aby wszystkie cztery piony (albo przynajmniej jeden) był w obszarze akceptancji. Generujemy K0 w pewnym zakresie pt, eta. Rozpad na piony może byc taki że nic nie trafia do detektora.

Wydaje mi się że na zbiorczym plocie ma Pani pomylone biny "klastry ToF" i "DCA daugthers", ale to szczegół.

Poluzowanie niektórych cieć np. pT lub zakres masy zaowocuje natychmiast wzrostem tła. Widzimy również te 40% startę przez ciecie <= 4 slady z ToF o której od początku mówiłem. Pytnie czy jesteśmy w stanie z tych czasem nawet 15 śladów wybrać te cztery "dobre"? Zawsze mozna spróbowac zrobić petle po wszystkich parach i sprawdzić czy znajdziemy przypadki gdzie będą tylko dwaj kandydaci na K0. Zanim jednak do tego przejdziemy to jest jeszcze jeden problem. W MC nie mamy sumulacji trygera a w szczególności veta na BBCL. To weto odrzuci nam część przypadków o które chcemy trochę powalczyć. One sa nie do uratowania w danych z trygerem BBCLveto. Będą tylko w próbce z trygerem bez veta. Czy Pabi analizuje próbka bez weta? Jesli tak to ile tam jest przypadków?

Teraz nie wiem czy BBC jest poprawnie kopiowane w embedingu. Niech Pani popatrzy na rozkłady energii w BBCL. Adam w issue "tło przypadkowe" pokazał takie ploty. W żadnej sekcj BBCLarge energia musi być <52. Taki warunek trzeba by dać na samym poczatku do Nevt.

Pytanie jescze jedno ile z tych Nevent przechodzi wszystkie ciecia. A ile będzie jak zrezygnuje Pani z patrzenia na poziom true. Nadwyżka to fałszywe przypadki w MC.

To jest to o co prosiłem nie wiem czy w tym czy w innym issue. Dodac kolejny histogram (ten z maczowaniem z poziomem true) . Czyli dodatkowe histogramy dla przypadków gdy wszystkie cztery piony które wybraliśmy do K0K0 sa zmaczowane z poziomem true. Dotyczy to Analizy 4,3,2 ToF i później 5+.

ladamczy commented 5 months ago

No i pozostaje jeszcze odrzucanie przypadków przez aktywność w RP. Wiem że teraz ignoruje Pani contener z protonami. Protony mamy z poziomu true. Jednak w embedingu powinniśmy mieć protony przypadkowe. Prosze sprawdzić czy widzi Pani tutaj jakieś protony.

PatrycjaMalinowska commented 5 months ago

W zasadzie większość śladów bez tof ma 0<phi<1. to bardzo dziwne. Czy może Pani sprawdzić czy dla danych 4ToF też wszystkie dodatkowe slady bez ToF sa skoncentrowane w tym rejonie phi? Jesli tak to mozna próbowac wykluczyć region 0<phi<1 z poczukiwań śladów bez ToF w przypadakch 3 a szczególnie 2 ToF.

Kilka przykładowych eventów z dokładnie 4 śladami z TOF które są dobrej jakości. W tych zdarzeniach występują eventy z TOF, które są w regione 0<phi<1.

a11.pdf a12.pdf a13.pdf a14.pdf

f1pmpr commented 5 months ago

Niech Pani zrobi rozklad sladow bez TOF w funkcji Phi vs Eta (histogram 2D) i rzuty na obie osie.

A jak wyglądają przypadki w których są co najmniej cztery slady zmaczowane z TOF, ale nie wszystkie piony z poziomu true sa zmaczowane z tymi sladami?

ladamczy commented 5 months ago

W zasadzie większość śladów bez tof ma 0<phi<1. to bardzo dziwne. Czy może Pani sprawdzić czy dla danych 4ToF też wszystkie dodatkowe slady bez ToF sa skoncentrowane w tym rejonie phi? Jesli tak to mozna próbowac wykluczyć region 0<phi<1 z poczukiwań śladów bez ToF w przypadakch 3 a szczególnie 2 ToF.

Kilka przykładowych eventów z dokładnie 4 śladami z TOF które są dobrej jakości. W tych zdarzeniach występują eventy z TOF, które są w regione 0<phi<1.

a11.pdf a12.pdf a13.pdf a14.pdf

Nie chodziło mi o to aby stwierdzic czy sa dobre ślady w regionie 0<phi<1 . Prosiłem o paptrzenie do danych rzeczywistych czy dla dobrych przypadków 4 T0F wiekszość śladów bez ToF jest skoncentrowana w regionie 0<phi<1 ? Czy to wygląda podobnie jak w symulacji MC ?

PatrycjaMalinowska commented 5 months ago

Zaraz to sprawdzę. Poniżej przesyłam plik zip dla MC z rozkładami eta-phi dla wszysztkich przypadków które przeszły 4 cięcia matchowania (230)

etaphi.zip

f1pmpr commented 5 months ago

To jest chyba niemożliwe, żeby out-of-time pile-up dawal tylko slady z zakresu 0<phi<1.2

Co oznaczaja czarne kropki - other TPC tracks with TOF?

Leszek: rozumiem, ze out-of-time pile-up nie moze dac TPC tracks with TOF; czy w MC oprocz czterech pionów są inne cząstki ktore moga dac TPC tracks with TOF?

PatrycjaMalinowska commented 5 months ago

W zasadzie większość śladów bez tof ma 0<phi<1. to bardzo dziwne. Czy może Pani sprawdzić czy dla danych 4ToF też wszystkie dodatkowe slady bez ToF sa skoncentrowane w tym rejonie phi? Jesli tak to mozna próbowac wykluczyć region 0<phi<1 z poczukiwań śladów bez ToF w przypadakch 3 a szczególnie 2 ToF.

Kilka przykładowych eventów z dokładnie 4 śladami z TOF które są dobrej jakości. W tych zdarzeniach występują eventy z TOF, które są w regione 0<phi<1. a11.pdf a12.pdf a13.pdf a14.pdf

Nie chodziło mi o to aby stwierdzic czy sa dobre ślady w regionie 0<phi<1 . Prosiłem o paptrzenie do danych rzeczywistych czy dla dobrych przypadków 4 T0F wiekszość śladów bez ToF jest skoncentrowana w regionie 0<phi<1 ? Czy to wygląda podobnie jak w symulacji MC ?

Poniżej przeysyłam pliki zip: pierwszy zawiera 200 pierwszych eventów z danych. Drugi - 200 eventów z warunkiem na dokładnie 4 ślady TOF dobrej jakości.

data_etaphi.zip data_eta_phi_4TOF.zip

Później podeślę rozkłady śladów TPC bez TOF w eta-phi, z zutami: dla MC przed i po matchingu, natomiast dla danych bez cięć i po warunku na dobre 4 TOF.

PatrycjaMalinowska commented 5 months ago

To jest chyba niemożliwe, żeby out-of-time pile-up dawal tylko slady z zakresu 0<phi<1.2

Co oznaczaja czarne kropki - other TPC tracks with TOF?

czarne kropki oznaczają tracki z TOF, ale niespełniające przynajmniej jednego warunku na jakość pionu (eta,pt,Nhit)

Leszek: rozumiem, ze out-of-time pile-up nie moze dac TPC tracks with TOF; czy w MC oprocz czterech pionów są inne cząstki ktore moga dac TPC tracks with TOF?

f1pmpr commented 5 months ago

W pliku data_etaphi.zip sa np. przypadki 24 i 67 w ktorych nakladaja sie chyba po dwa slady z TOF - w przypadku 67 sa az trzy takie sytuacje - wnioskuje z koloru kropki. Czy tak jest rzeczywiscie?

ladamczy commented 5 months ago

Wydaje mi się, ze plik data_etaphi zawiera przypadki bez selekcji i tam są tylko dwa slady z ToF.

ladamczy commented 5 months ago

To jest chyba niemożliwe, żeby out-of-time pile-up dawal tylko slady z zakresu 0<phi<1.2 Co oznaczaja czarne kropki - other TPC tracks with TOF?

czarne kropki oznaczają tracki z TOF, ale niespełniające przynajmniej jednego warunku na jakość pionu (eta,pt,Nhit)

Leszek: rozumiem, ze out-of-time pile-up nie moze dac TPC tracks with TOF; czy w MC oprocz czterech pionów są inne cząstki ktore moga dac TPC tracks with TOF?

out-of-time pileup nie może dać ToF ale in-time pile-up może mieć ToF dodatkowo może być przypadkowa koincydencja off-time TPC i in-time ToF które przypadkowo maczuja.

ladamczy commented 5 months ago

Ale generalnie w danych również widać, że off-time TPC koncentruja sie w przedziale 0<phi<1 . Pierwszy raz to widze (ale nigdy nie patrzyłem). Nie słyszałem również w STAR aby któś cos takiego pokazał.

Nie zmenia to faktu że możemy to wykorzystać i dopuszczać w analizie ślady bez ToF tylko z poza zakresu 0<phi<1.

f1pmpr commented 5 months ago

Powinnismy wcześniej zobaczyć jak to wygląda w pełnych danych, nie tylko w pierwszych 200 przypadkach.

ladamczy commented 5 months ago

wizualizacje mozna tylko zrobić dla ograniczonej ilosci przypadków (np. 200) o to Pani Patrycja miala. Dlatego jest to wcześniej niz pelne dane które wymagaja zrobienia histogramów i puszczenia na całej próbce, ...

Więc chyba nic złego nikt nie zrobił.

f1pmpr commented 5 months ago

Nie mowie, ze ktos zrobil cos zlego.

Zgadzam sie, ze trzeba po prostu zrobic histogram z pelnych danych pokazujacy phi vs eta sladow bez TOF. Nie chce mi sie wierzyc, ze wszystkie takie slady beda mialy 0<phi<1, bo to raczej wygladaloby na jakis dziwny szum niz na pile-up. Z drugiej strony rozumiem, ze w MC takie slady sa tylko dla 0<phi<1, a przeciez do embedingu jest wykorzystywana probka reprezentatywna dla pelnych danych.

ladamczy commented 5 months ago

Embedding jest reprezentatywny. Liczyłem na błąd w embedding i że w danych zobaczymy cos innego. Ale to tak chyba jest. Ale nie rozumem dlaczego. Te ladunku oczywiście dyfunduja ale liczyłbym raczej na jakieś dziwne zachowanie w rapidity a nie w phi. Bo ładunki w drutach dla z>0 dyfunduja w prawo a te z<0 w lewo.

Jakie te slady bez Toń maja ciecia jakościowe (ilość hitów ?)

ladamczy commented 5 months ago

Ten efekt rożnego kierunku dyfuzji powoduje dzielenie śladu na dwa i generalnie te off-time ślady częstó sa krótkie. Nie wiem jakie tam jest ciecie na Nhits (15 ?) może wystarczy dla śladów bez ToF wymagać nHits>25.

Oczywiście to bnie wyjasnia skupienia o<phi<1 ale powinno pomóż w odrzuceniu śladów off-time.

ladamczy commented 5 months ago

Dobrze by było aby plotów porównujących dane i MC dodać rozkład krotności Nhits osobno dla sladów z ToF i bez ToF.

PatrycjaMalinowska commented 5 months ago

Muszę przyznać się do pomyłki - rozkąd phi jest jednorodny od -pi do pi - popełniłam błąd przy rysowaniu używając złej tablicy...

f1pmpr commented 5 months ago

Dlatego wielokrotnie powtarzam jak wazne jest sprawdzenie rozkladow roznych wielkosci w phi. Jesli nie sa plaskie to to jest powazny problem, ktory trzeba zrozumiec. Prosze tez zwrocic uwage, ze jesli Pani odejmuje od siebie dwa katy phi, oba z przedzialow od -Pi do Pi, to tez trzeba zadbac zeby roznica DeltaPhi byla od -Pi do +Pi. W szczegolnosci roznica moze wyjsc bliska 2Pi, co efektywnie oznacza, ze jest bliska zero.

PatrycjaMalinowska commented 5 months ago

dodam warunek przypisujący abs(deltaPi), abs(abs(deltaPi)-2*pi) dla abs(deltaPi) > 6.1,

ladamczy commented 5 months ago

Nie ma potrzeby liczenia samemu róznicy phi. Pisałem juz na ten temat dwa razy w tym i jeszcze jednym issue. W root jest metoda która poprawnie liczy delta_phi dla obiektów klasy TLorentzVector i TVector. Warto korzystać z tego co jest w root. Czy mase niezmienniczą, rapidity, pseudorapidity, ... też Pani liczy sama czy korzysta z metod wbudowanych w klasy root'a ? Odnośnie błędu to się zdarza . Rozkład jest w miare płaski i bład nie wpłynął (?) na żadne dotychczasowe wyniki oprócz wizualizacji topologi śladów.

PatrycjaMalinowska commented 5 months ago

Korzystam z TLorentzVectroe DistR, a błąd pojawił się jedynie podczas wizualizacji.

ladamczy commented 5 months ago

DeltaR . Jest jeszcze metoda DeltaPhi jak któs chce mieć tylko phi.

PatrycjaMalinowska commented 5 months ago

Poniżej przesyłam rozkład Ntof - przed i po matchowaniu.

Rozkład przed matchowaniem został zrobiony przed jakąkolwiek selekcją - ale przed ( i oczywiście po ) matchowaniu histogram jest wypełniany tylko, gdy spełniony jest warunek na liczbę pionów true == 4. Stosunek jest bardzo mały, nawet dla 4 TOF

ntof.pdf

ladamczy commented 5 months ago

ja nie rozumiem jak ten plot był zrobiony. Co to znaczy przed matcowaniem przed jakąkolwiek selekcją ?

PatrycjaMalinowska commented 5 months ago

Niebieski histogram przedstawia rozkład liczby śladów z hitem w TOF (Ntof) dla pełnej próbki MC, ale po upewnieniu się, że przypadek ma 4 piony true.

W analizie zanim przechodzę do wybierania par pionów sprawdzam m.in.:

Każdy z tych punków wygląda inaczej dla różnych Ntof. np. dla 4 TOF wystarczy sprawdzenie ładunku i jakości śladów z hitem w TOF. Natomiast dla 2 TOF , w zależności od tego czy mam sumaryczny ładunek tracków z hitem w TOF równy 2, -2 lub 0, upewniam się że istnieją przynajmniej 2 tracki bez TOF o ładunkach równych odpowiednio: -1 i -1, 1 i 1, 1 i -1, które są dobrej jakości.

Teraz pytanie, jak chcemy zbadać wydajność - tak jak teraz, czyli względem pełnej próbki MC (z warunkiem na 4 piony true) - czy po upewnieniu się, że istnieją warunki na dokonanie wyboru 4 tracków TPC (dobra jakość i ładunek )

Selekcja pionów na kaony z CEP jest wybierana przez najmniejszą odległość od masy PDG dla 2,3,4 TOF i na podstawie cięć topologicznych dla 5 TOF (w przypadku gdy więcej niż 1 kombinacja przejdzie cięcia topologincze wybieram najmniejszą odległość od masy)

Po wyborze par sprwadzam zgodność z poziomem true na podstawie delta(eta,phi) < 0.15. Jeżeli wszyskie piony przeszły to cięcie, wypełniam histogram (czerwony)

PatrycjaMalinowska commented 5 months ago

Dla metody tag & probe zawęziłam warunki na jakość tracków, a także na DCA beamline i daughters z 2.5 na 1.5 cm, ale dalej dla danych mam duże tło dla probu bez TOF. Obecnie na kaon mam nałożone warunki: DCA bealmine, daughters oraz cos(pointing angle). Czy dodać cięcie na odległość pionów od beamlinu? - jeszcze nie używałam tego cięcia w analizie 2,3,4,5 TOF.

obraz

ladamczy commented 5 months ago

Niebieski histogram przedstawia rozkład liczby śladów z hitem w TOF (Ntof) dla pełnej próbki MC, ale po upewnieniu się, że przypadek ma 4 piony true.

W analizie zanim przechodzę do wybierania par pionów sprawdzam m.in.:

* jakość tracków TOF

* zgodność ładunku

* odpowiednią liczbę tracków bez TOF, które są dobrej jakości

Każdy z tych punków wygląda inaczej dla różnych Ntof. np. dla 4 TOF wystarczy sprawdzenie ładunku i jakości śladów z hitem w TOF. Natomiast dla 2 TOF , w zależności od tego czy mam sumaryczny ładunek tracków z hitem w TOF równy 2, -2 lub 0, upewniam się że istnieją przynajmniej 2 tracki bez TOF o ładunkach równych odpowiednio: -1 i -1, 1 i 1, 1 i -1, które są dobrej jakości.

Teraz pytanie, jak chcemy zbadać wydajność - tak jak teraz, czyli względem pełnej próbki MC (z warunkiem na 4 piony true) - czy po upewnieniu się, że istnieją warunki na dokonanie wyboru 4 tracków TPC (dobra jakość i ładunek )

Selekcja pionów na kaony z CEP jest wybierana przez najmniejszą odległość od masy PDG dla 2,3,4 TOF i na podstawie cięć topologicznych dla 5 TOF (w przypadku gdy więcej niż 1 kombinacja przejdzie cięcia topologincze wybieram najmniejszą odległość od masy)

Po wyborze par sprwadzam zgodność z poziomem true na podstawie delta(eta,phi) < 0.15. Jeżeli wszyskie piony przeszły to cięcie, wypełniam histogram (czerwony)

Taka "wydajność" niewiele nam mówi. Przede wszystkim prosze pamietać, że "wydajność" ma killka składowych i każdą z nich trzeba niezależnie sprawdzić.

  1. Pierwszym co trzeba ustalić to zakres kinematyczny do którego będziemy poprawiać nasze dane. Najlepiej aby zakres kinematyczny pokrywał sie z zakresem mierzonym. Wtedy nie ma poprawek polegających na odtworzeniu tego co sie nie da zmierzyć nawet za pomoca idealnego detektora. Z tego punktu widzenia zakresem do którego poprawiamy powinnien być wymóg że wszystkie cztery piony sa w zakresie |eta|< ?? i pT>??
    ?? jest do optymalizacji. Ale proponuje zacząć od tego co mieliśmy w poprzedniej analizie. |eta|<0.7 pt>0.2
  2. Powyższa reguła ma pewien problem. W zasadzie aby porównać tak opublikowane dane z jakimś modelem to musimy dysponować generatorem w którym model produkcji K0K0 jest zaimplementowany aby sprawdzić jakie powstaja piony. Aby tego uniknąć czasami definiujemy zakres kinematyczny wyrazony w zmiennych bardziej fizycznych . W naszym wypadku było by to eta i pT ale nie pionów tylko K0 albo nawet w funkcji masy i rapidity calego stanu K0K0 a nie osobnych K0 . Myśmy jeszcze nie zdecydowali co ostatecznie zrobimy. Niemniej jednak pewnie chcielibyśmy zachowac obie mozliwości aby mieć pewna swobodę ostatecznego rozwiązania. Obojetne co zrobimy powinniśmy wyznaczyć tak zwaną wydajność (akceptancję) geometryczną. Czyli prawdopodobieństwo że K0 rozpadnie się na piony w zakresie akceptancji TPC (czyli |eta)<0.7 i pT>0.5 ) taka wydajność powinna być w 2D w funkcji eta i pT K0. Na tej podstawie możemy wyznaczyć zakres kinamtyczny naszego pomiaru w funkcji et i pT K0. Dodatkowo możemy w ten sam sposob wyznaczyć wydajność geometryczną w fukcji masa, eta stanu K0K0.

To wszystko powyżej robimy na poziomie true. Potem przechodzimy do wyznaczenie wydajności detektora. Czyli prawdopodobieństwo że przypadek który przechodzi przez akceptancję geometryczną będzie ostatecznie zmierzony w detektorze. Wydajność detektora zatem mierzymy względem przypadków które sa w akceptancji geometryczej, czyli wybieramy tylko przypadki które maja na poziomie true cztery piony (z dwóch K0) o pT>0.2 i |eta|<0.7. Tutaj nalezy jeszcze zażądać aby |v_z_true|<80 cm . Możemy też powiedzieć że przypadki z |v_z_true|>80 cm sa poza zakresem geometrycznym detektora.

Pierwszą wydajnością jest wydajność TPC, czyli prawdopodobieństwo że nasze cztery piony w zakresie geometrycznym będą zmierzone w TPC. Tej wydajności nie bedziemy mierzyć, badać z naszego MC ponieważ Tomas generuje miliony pionów z których wyznaczymy wydajność TPC . My tylko użyjemy tej wydajności do poprawy naszych przypadków.

Dlatego do dalszych badań wydajności wybieramy przypadki które sa w akceptancji geometrycznej detektora i mają zmierzone ślady w TPC (zmaczowane w przestrzeni eta-phi).

Drugą wydajnością jest wydajność ToF. Tutaj sytuacja jest podobna . To Tomas dokładnie wyznaczy z innego MC wydajność ToF. Dodatkowo wykorzystamy metode tag & probe do wydajności ToF. Dodatkowo w analizie 3ToF i 2ToF nie będziemy wymagać aby wszystkie slady miały ToF. Dlatego z tego MC też nie będziemy wyznaczać wydajności ToF.

Zatem punktem wyjscia do tego co mozemy zrobić z tego MC to wybieramy przypadki gdy wszystkie cztery piony sa w akceptancji detektorej (|eta_true|<0.7 , p_true>0.2 . |V_z_true|< 80 maamy cztery ślady w TPC zmaczowane z poziomem true. Taka próbke dzielimy na trzy klasy: 4ToF, 3ToF, 2ToF i badamy wydajności wszystkich pozostałych cieć jakie mamy w analizie w szczególności chcemy zobaczyć jaka jest wydajność ciecia NTof, czyli

dla analizy 4ToF. NToF==4 dla analizy 3ToF NToF==3 dla analizy 2ToF , NToF== 2

Jesli strata jest duża to czy możemy zachować przypadki

dla analizy 4ToF. NToF>=5 dla analizy 3ToF NToF>=4 dla analizy 2ToF , NToF>= 3

Czy będzie Pani wstanie dobrze wybrać przypadki 4ToF jak mamy np 7 śladów z ToF ?

ale również dla innych cieć trzeba wyznaczyć wydajność ciecia i może zoptymalizaowć wartość na której tniemy. Ale optymalizacje zostawmy na boku. Ważne aby wyznaczyć te wydajności .

Mam nadzieje ze to troche wyjasni Pani co nalezy zrobic.

ladamczy commented 5 months ago

Dla metody tag & probe zawęziłam warunki na jakość tracków, a także na DCA beamline i daughters z 2.5 na 1.5 cm, ale dalej dla danych mam duże tło dla probu bez TOF. Obecnie na kaon mam nałożone warunki: DCA bealmine, daughters oraz cos(pointing angle). Czy dodać cięcie na odległość pionów od beamlinu? - jeszcze nie używałam tego cięcia w analizie 2,3,4,5 TOF.

obraz

niech Pani jeszcze podzieli próbke tag & probe na dwie klasy przypadków decayLength<3 i decayLength>3.

Na razie nie mamy w klasie V0 metody do liczenia DCA między pionami o beamlinem. Postaram sie to dodać.

PatrycjaMalinowska commented 5 months ago

Niebieski histogram przedstawia rozkład liczby śladów z hitem w TOF (Ntof) dla pełnej próbki MC, ale po upewnieniu się, że przypadek ma 4 piony true. W analizie zanim przechodzę do wybierania par pionów sprawdzam m.in.:

* jakość tracków TOF

* zgodność ładunku

* odpowiednią liczbę tracków bez TOF, które są dobrej jakości

Każdy z tych punków wygląda inaczej dla różnych Ntof. np. dla 4 TOF wystarczy sprawdzenie ładunku i jakości śladów z hitem w TOF. Natomiast dla 2 TOF , w zależności od tego czy mam sumaryczny ładunek tracków z hitem w TOF równy 2, -2 lub 0, upewniam się że istnieją przynajmniej 2 tracki bez TOF o ładunkach równych odpowiednio: -1 i -1, 1 i 1, 1 i -1, które są dobrej jakości. Teraz pytanie, jak chcemy zbadać wydajność - tak jak teraz, czyli względem pełnej próbki MC (z warunkiem na 4 piony true) - czy po upewnieniu się, że istnieją warunki na dokonanie wyboru 4 tracków TPC (dobra jakość i ładunek ) Selekcja pionów na kaony z CEP jest wybierana przez najmniejszą odległość od masy PDG dla 2,3,4 TOF i na podstawie cięć topologicznych dla 5 TOF (w przypadku gdy więcej niż 1 kombinacja przejdzie cięcia topologincze wybieram najmniejszą odległość od masy) Po wyborze par sprwadzam zgodność z poziomem true na podstawie delta(eta,phi) < 0.15. Jeżeli wszyskie piony przeszły to cięcie, wypełniam histogram (czerwony)

Taka "wydajność" niewiele nam mówi. Przede wszystkim prosze pamietać, że "wydajność" ma killka składowych i każdą z nich trzeba niezależnie sprawdzić.

1. Pierwszym co trzeba ustalić to zakres kinematyczny do którego będziemy poprawiać nasze dane. Najlepiej aby zakres kinematyczny pokrywał sie z zakresem mierzonym. Wtedy nie ma poprawek polegających na odtworzeniu tego co sie nie da zmierzyć nawet za pomoca idealnego detektora. Z tego punktu widzenia zakresem do którego poprawiamy powinnien być wymóg że wszystkie cztery piony sa w zakresie |eta|< ?? i pT>??
   ?? jest do optymalizacji. Ale proponuje zacząć od tego co mieliśmy w poprzedniej analizie. |eta|<0.7 pt>0.2

2. Powyższa reguła ma pewien problem.  W zasadzie aby porównać tak opublikowane dane z jakimś modelem to musimy dysponować generatorem w którym model produkcji K0K0 jest zaimplementowany aby sprawdzić jakie powstaja piony.
   Aby tego uniknąć czasami definiujemy zakres kinematyczny wyrazony w zmiennych bardziej fizycznych . W naszym wypadku było by to eta i pT ale nie pionów tylko K0 albo nawet w funkcji masy i rapidity calego stanu K0K0 a nie osobnych
   K0 . Myśmy jeszcze nie zdecydowali co ostatecznie zrobimy. Niemniej jednak pewnie chcielibyśmy zachowac obie mozliwości aby mieć pewna swobodę ostatecznego rozwiązania. Obojetne co zrobimy powinniśmy wyznaczyć tak zwaną
   wydajność (akceptancję) geometryczną. Czyli prawdopodobieństwo że K0 rozpadnie się na piony w zakresie akceptancji TPC (czyli |eta)<0.7 i pT>0.5 ) taka wydajność powinna być w 2D w funkcji eta i pT K0.  Na tej podstawie możemy wyznaczyć zakres kinamtyczny naszego pomiaru w funkcji et i pT K0. Dodatkowo możemy w ten sam sposob wyznaczyć wydajność geometryczną w fukcji masa, eta stanu K0K0.

To wszystko powyżej robimy na poziomie true. Potem przechodzimy do wyznaczenie wydajności detektora. Czyli prawdopodobieństwo że przypadek który przechodzi przez akceptancję geometryczną będzie ostatecznie zmierzony w detektorze. Wydajność detektora zatem mierzymy względem przypadków które sa w akceptancji geometryczej, czyli wybieramy tylko przypadki które maja na poziomie true cztery piony (z dwóch K0) o pT>0.2 i |eta|<0.7. Tutaj nalezy jeszcze zażądać aby |v_z_true|<80 cm . Możemy też powiedzieć że przypadki z |v_z_true|>80 cm sa poza zakresem geometrycznym detektora.

Pierwszą wydajnością jest wydajność TPC, czyli prawdopodobieństwo że nasze cztery piony w zakresie geometrycznym będą zmierzone w TPC. Tej wydajności nie bedziemy mierzyć, badać z naszego MC ponieważ Tomas generuje miliony pionów z których wyznaczymy wydajność TPC . My tylko użyjemy tej wydajności do poprawy naszych przypadków.

Dlatego do dalszych badań wydajności wybieramy przypadki które sa w akceptancji geometrycznej detektora i mają zmierzone ślady w TPC (zmaczowane w przestrzeni eta-phi).

Drugą wydajnością jest wydajność ToF. Tutaj sytuacja jest podobna . To Tomas dokładnie wyznaczy z innego MC wydajność ToF. Dodatkowo wykorzystamy metode tag & probe do wydajności ToF. Dodatkowo w analizie 3ToF i 2ToF nie będziemy wymagać aby wszystkie slady miały ToF. Dlatego z tego MC też nie będziemy wyznaczać wydajności ToF.

Zatem punktem wyjscia do tego co mozemy zrobić z tego MC to wybieramy przypadki gdy wszystkie cztery piony sa w akceptancji detektorej (|eta_true|<0.7 , p_true>0.2 . |V_z_true|< 80 maamy cztery ślady w TPC zmaczowane z poziomem true. Taka próbke dzielimy na trzy klasy: 4ToF, 3ToF, 2ToF i badamy wydajności wszystkich pozostałych cieć jakie mamy w analizie w szczególności chcemy zobaczyć jaka jest wydajność ciecia NTof, czyli

dla analizy 4ToF. NToF==4 dla analizy 3ToF NToF==3 dla analizy 2ToF , NToF== 2

Jesli strata jest duża to czy możemy zachować przypadki

dla analizy 4ToF. NToF>=5 dla analizy 3ToF NToF>=4 dla analizy 2ToF , NToF>= 3

Czy będzie Pani wstanie dobrze wybrać przypadki 4ToF jak mamy np 7 śladów z ToF ?

ale również dla innych cieć trzeba wyznaczyć wydajność ciecia i może zoptymalizaowć wartość na której tniemy. Ale optymalizacje zostawmy na boku. Ważne aby wyznaczyć te wydajności .

Mam nadzieje ze to troche wyjasni Pani co nalezy zrobic.

Dziękuję za wyjaśnienie, jeszcze się upewnię, czy chcemy zachować cięcia na piony z poziomu detektora, tj. wybieramy tylko tracki o pT>0.2, |eta| < 0.9 i Nhit > 20/25 ?

PatrycjaMalinowska commented 5 months ago

Dla metody tag & probe zawęziłam warunki na jakość tracków, a także na DCA beamline i daughters z 2.5 na 1.5 cm, ale dalej dla danych mam duże tło dla probu bez TOF. Obecnie na kaon mam nałożone warunki: DCA bealmine, daughters oraz cos(pointing angle). Czy dodać cięcie na odległość pionów od beamlinu? - jeszcze nie używałam tego cięcia w analizie 2,3,4,5 TOF. obraz

niech Pani jeszcze podzieli próbke tag & probe na dwie klasy przypadków decayLength<3 i decayLength>3.

Na razie nie mamy w klasie V0 metody do liczenia DCA między pionami o beamlinem. Postaram sie to dodać.

Data1.root - warunek (kaon.pointingAngleHypo()>0.925 or kaon.pointingAngleHypo() <= 3.0) Data2.root - warunek (kaon.pointingAngleHypo()>0.925 or kaon.pointingAngleHypo() > 3.0)

Histogramy z probem bez TOF mają duże tło dla obydwu przypadków tagAndProbe.zip

PatrycjaMalinowska commented 5 months ago

Przesyłam wydajności dla 2,3,4 TOF: 1SC: Jeżeli liczba pionów true !=4 ( o pT_true > 0.2 i |eta| < 0.7) odrzucam przypadek 2SC:matchowanie na podstawie ładunku i najmniejszej odległości w eta-phi. Tracki TPC muszą leżeć w zakresach: pT_det > 0.2 && |eta_det| < 0.7 && Nfit > 20 - drzucam przypadek jeżeli liczba takich tracków TPC !=4.

Nevt (NTOF) = całkowita liczba przypadków która przeszła powyższe cięcia dla danej liczby śladów TOF.

Wydajności są liczone jako: N_cut(NTOF)/Nevt (NTOF)

perf.pdf

HistCorr1_4.pdf HistCorr2_4.pdf HistDcaBeamlineLeadingKaon_4.pdf HistDcaDaughtersLeadingKaon_4.pdf HistDiffProtonX_4.pdf HistDiffProtonY_4.pdf HistEtaCorrelation_4.pdf HistHypoLengthLeadingKaon_4.pdf HistKsi1_4.pdf HistKsi2_4.pdf HistKsiCorrelation_4.pdf HistMassLeadingK0_4.pdf HistNumOfClusters_4.pdf HistNumTofTracks_4.pdf HistPointingAngleLeadingKaon_4.pdf HistPtMiss_4.pdf

PatrycjaMalinowska commented 5 months ago

Przesyłam poprawione rozkłady wydajności. Po matchowaniu mam 532 przypadki, których używam do policzenia wydajności.

effVtxZlowerThan80.zip

PatrycjaMalinowska commented 5 months ago

w zip przesłałam zły rozkład tracków z TOF. Poniżej przesyłam właściwy rozkład: HistNumTofTracks_4.pdf

ladamczy commented 5 months ago

Nie wiem czy dobrze zrozumiałem Pani informacje. Czy powyższe ploty chce Pani aby zostały skomentowane czy planuje Pani dzisiaj jakiś update tych plotów?

ladamczy commented 5 months ago

Komentarz nie jest długi z mojej strony:

  1. Wszsytko wydaje sie poprawne/logiczne
  2. mamy 10% przypadków z NTOF>=5 moim zdanie nie warto tutaj inwestować więcej czasu aby te przypadki zachować
  3. mamy 20% przypadków z NTOF==2 i tutaj warto o nie jeszcze powalczyć

Jedno czego brakuje to wymogu trygera (trygera w MC nie ma) trzeba go samemu zrekonstruwać. Tryger to dwa hity w ToF (to mamy z definicji) ale również weto w BBCL. Czy próbowała Pani popatrzeć na rozkłady w BBC jak juz o tym pisałem wcześniej , pozostają jeszcze RP, ale o tym później

ladamczy commented 5 months ago

Brakuje jeszcze wydajności weta na dodatkowe slady w RP. Jak rozumiem w MC wymaga Pani protonu z poziomu true i nie ma Pani zadnego innego cięcia. To jest poprawne bo w MC nie mamy symulacji protonów sygnałowych ale powinniśmy mieć protony z embeddingu. Prosze sprawdzić czy tam mamy dane z RP. Jesli nie to będzie Pani musiała popatrzyć na dane zero bias które analizował Pan Adam.

ladamczy commented 5 months ago

Troche jednak żle zinterpretowałem udział NTOF=>5. Mamy jeszcze problem przypadków: Dla dwóch true śladów NTOF>=3 Dla trzech sladów true NTOF>=4

więc tych przypadków jest troche więcej. Dalsze decyzje pzostawiam do momentu zastosowania weta BBCL i weta na protony w RP bo to może zmienić konkluzje.

PatrycjaMalinowska commented 5 months ago

Dodałam veto na BBCL large: liczba przypadków po matchingu i vecie jest równa 263, przed vetem miałam 532 przypadki. W MC z embeddingiem nie ma tracków protonów, tylko clustry.

SCeff.pdf

PatrycjaMalinowska commented 5 months ago

Czy te klastry w evencie są sygnałami ADC? chyba z tej informacji mogłabym zrekonstruować warunek na weto? Najpierw musiałabym w obrębie jestnej stacji RP sprawdzić czy dla danej orientacji clustry są położone w obręcie dwóch odległości pomiędzy paskami (?). Wiedząc że mam po jednym hicie dla każdej orientacji mogę mieć tylko jedną kobinację na track point. Jeżeli w tej samej gałęzi (east lub west) mam po jednym track point dla górnych lub dolnych stacji - to mam tylko jeden RP track. Następnie żądałabym tylko jednego tracku na gałąź.

PatrycjaMalinowska commented 5 months ago

Przesyłam tag and probe - dodałam cięcie na NDeDx > 15, Zvtx < 80 cm oraz przede wszystkich usunęłam podział na ładunek probu i zmiejszyłam cięcie na DCA beamline i DCA daughters na 1 cm.

tagAndProbe_eta.pdf tagAndProbe_pt.pdf