Bedankt voor je presentatie gisteren. Het was voor iedereen leuk en verhelderend om de voorbeelden te zien. Maar nu is het echt zaak om te gaan beginnen.
Doe de dingen in mijn issue 1, allemaal en echt serieus. Je hebt zelf de risicos aangegeven in je thesis design. Ik zie nog helemaal niet hoe je die oplost, en ik denk dat ze levensgroot zijn. Dus je zal nu echt zelf creatief aan de slag moeten gaan en gaan annoteren.
Welke evaluatiematen en loss maten ga je gebruiken? Bcubed P en R, of iets wat minder streng is. Ik wil hier een hele sectie over zien in je scriptie. Ook met goede verwijzingen naar de literatuur. Ook hier kan je zeggen dat je een clustering of een classificatie taak hebt.
Ik wil graag echt goed uitgewerkte deel-deel-vragen zien. Ik zou zeker ook een rule based systeem als baseline opvoeren.
Dit lijkt mij al een heel sterk systeem:
zoek strings van de vorm 11.1 en 10.2.2 etc, omringd door whitespace
maak een zo groot mogelijke rechthoek om dat stringetje swaar geen enkele letter in staat.
Dat is een weggelakt stuk
Programmeer dit, en bepaal Bcubed P en R en andere maten op een flinke test set die je zelf annoteert.
Doe onderzoek naar software die ZELF automatiasch zaken als namen en telefoonnummers weglakt. Ik heb gelezen dat de overheid dat gebruikt en dat er aan gewerkt wordt (omdat dat heel veel tijd bespaart). Zrg dat je er alles ov er te weten komt.
Probeer erachter te komen hoe dit weglak proces gedaan wordt door die ambtenaren. Wordt het nogmaals nagekeken, etc, etc.
Kom op Ammar, je moet nu echt gaan beginnen met de voorbereidingen, Het is echt niet nodig om tijdens je scriptie erachter te komen dat je risico's waar zijn geworden. Ga er maar van uit dat ze allemaal waar zijn, en doe het plan B hierboven.
Ik verwacht echt heel flinke vooruitgang op punten 1-4 hierboven eind volgende week.
Ik ben streng, maar vrijwel iedereen die bij mij afstudeert haalt de deadline, en krijgt een mooi cijfer. Ik wil dat met jou ook bereiken, vandaar dat ik nu druk ga zetten. Als je er veel naast werkt, probeer echt vrij te krijgen/te nemen. Je hebt echt de tijd nodig voor die sc riptie. onderschat het niet!!!!!
Vanaf nu graag elke week een goede update, met links naar je werk/notebooks. Ik vind het niet prettig er om te moeten zeuren. Wees proactief.
Beste @alhasha001 ,
Bedankt voor je presentatie gisteren. Het was voor iedereen leuk en verhelderend om de voorbeelden te zien. Maar nu is het echt zaak om te gaan beginnen.
Kom op Ammar, je moet nu echt gaan beginnen met de voorbereidingen, Het is echt niet nodig om tijdens je scriptie erachter te komen dat je risico's waar zijn geworden. Ga er maar van uit dat ze allemaal waar zijn, en doe het plan B hierboven.
Ik verwacht echt heel flinke vooruitgang op punten 1-4 hierboven eind volgende week.
Ik ben streng, maar vrijwel iedereen die bij mij afstudeert haalt de deadline, en krijgt een mooi cijfer. Ik wil dat met jou ook bereiken, vandaar dat ik nu druk ga zetten. Als je er veel naast werkt, probeer echt vrij te krijgen/te nemen. Je hebt echt de tijd nodig voor die sc riptie. onderschat het niet!!!!!
Vanaf nu graag elke week een goede update, met links naar je werk/notebooks. Ik vind het niet prettig er om te moeten zeuren. Wees proactief.
succes , kom op, doe mee maarten