Open GoogleCodeExporter opened 9 years ago
Increasing the priority as I get a timeout if I extract these jobs with
parents=2 for all codebook fields
Original comment by vanatteveldt@gmail.com
on 23 Apr 2013 at 5:08
(het gekke is, hij trekt de CPU op de webserver helemaal dicht, je zou zeggen
dat als er een probleem is, het de database zou moeten zijn...)
Original comment by vanatteveldt@gmail.com
on 23 Apr 2013 at 5:11
OK, er is zowel een CPU probleem als een (kleiner) db probleem.
Ik heb trace prints gemaakt met daarin het aantal queries van de job ervoor.
Jobs zonder coderingen geven 6 queries. Jobs met coderingen ( en niet eens heel
veel, job 409 bv heeft 7 (!) gecodeerde artikelen hebben honderden queries:
wva@amcat3:~$ python extract.py > /tmp/data2.csv
[2013-04-23 20:58:05 extract.py:39 INFO] Job 0/103: 407, nqueries=2
[2013-04-23 20:58:05 extract.py:39 INFO] Job 1/103: 408, nqueries=6
[2013-04-23 20:58:06 extract.py:39 INFO] Job 2/103: 409, nqueries=248
[2013-04-23 20:58:07 extract.py:39 INFO] Job 3/103: 411, nqueries=414
[2013-04-23 20:58:07 extract.py:39 INFO] Job 4/103: 412, nqueries=6
[2013-04-23 20:58:07 extract.py:39 INFO] Job 5/103: 413, nqueries=6
[2013-04-23 20:58:07 extract.py:39 INFO] Job 6/103: 414, nqueries=6
[2013-04-23 20:58:09 extract.py:39 INFO] Job 7/103: 415, nqueries=399
Er is ook een cpu probleem, elke keer dat ik kill zat hij in de get_parents.
Dit ga ik nu workarounden met wat memoisatie en moet een keer opgelost worden.
File "/home/wva/amcat/amcat/models/coding/codebook.py", line 267, in _get_parent
for child, parent in hierarchy.iteritems():
Original comment by vanatteveldt@gmail.com
on 23 Apr 2013 at 7:47
Scaling back to medium priority.
CPU issue was an infinite loop in getting the parent with a cyclical hierarchy,
resolved by adding a loop detector.
Still too many queries, but performance on the set we're using (~100 jobs, ~500
coded articles) is acceptable.
Original comment by vanatteveldt@gmail.com
on 23 Apr 2013 at 8:21
Voor als je weer in NL bent: is dat een database waar je een dump van kan
maken? Dan kan ik er (makkelijk) naar kijken.
Original comment by Martijn....@gmail.com
on 25 Apr 2013 at 8:50
Original comment by Martijn....@gmail.com
on 25 Apr 2013 at 9:13
Original issue reported on code.google.com by
vanatteveldt@gmail.com
on 23 Apr 2013 at 9:53