iflGARAJI10100 / taMAM

taMAM - Tarayıcı Mevzuat Arama Motoru
MIT License
9 stars 4 forks source link

TDDI ile Madde Sayısı Tespiti Modülü #16

Closed sertacates closed 2 years ago

sertacates commented 2 years ago

Madde Sayısını daha önceki toplantılarda tek tek yapıyorduk ama bir kişiye verelim ve modül olarak yapsın, diğer dosyalarda bu modülü çağıralım. Belki diğer alanları doldurma çalışmamızı da modüllere çeviririz. Elle değil TDDİ ile madde sayısını halledelim.

ErAk042 commented 2 years ago

Hocam şimdilik %85 oranında kural bazlı bir sistemimiz var. Ayrıca tüm dokümanların Madde 1 diye içeriği olduğunu tespit ettik. Kural bazlıyı daha da geliştireceğiz eğer %95 oranına yaklaşamazsak farklı bir yöntem ararız. Ya derin öğrenme kullanıp cümle benzerliği ya da nltk içindeki benzerlik araçlarından yararlanırız. https://scikit-learn.org/stable/modules/metrics.html burada da benzerlik ile ilgili yeterince kullanım örneği var. Buradan da yararlanabiliriz.

sertacates commented 2 years ago

Eray, Resmi Belge Kategori Ayrımı için yüklediğin dosyadaki gibi hem satır içi yorum (inline comment/statement) hem de program parçasının açıklaması için not defteri metni eklersen daha nitelikli olur.

S-Toprak commented 2 years ago

Hocam kural bazlı sistemde iyileştirmeler yaparak doğruluk oranını %96,57'a çıkartmayı başardık. Dosyada gerekli temizlikler ve belgelemeler yapıldı. Kodu sistemdeki eski sürümüyle değiştiriyorum.

sertacates commented 2 years ago

Eline sağlık Seyithan Toprak, inceledim, tamamdır. Açıklamalar yerinde olmuş. Bu başarı oranı iyi, %5'in altına düşmüş, gerisine sonra bakarız, ara yüze odaklanalım.

S-Toprak commented 2 years ago

Hocam en son düzenlemelerle artık doğruluk oranı %99'a çıktı. Bence bu sonuç kural bazlı sayım yapmamız fikrini kanıtlar niteliktedir.

sertacates commented 2 years ago

Kural bazlı gidelim ama iyi bir bilgisayarda derin öğrenme konusunda da problem olmayabilir yani o ayağı da ihmal etmeyelim. Şimdilik veri doldurma kısmını kural bazlı bitirelim vaktimiz kalırsa modellerin sonuçlarını da ekleriz.

S-Toprak commented 2 years ago

Hocam şu an o tür bir bilgisayar'a erişimim yok, aldığımız kararlara bakılırsa önemli de değil zaten. O zaman madde sayısının kural bazlı yapılması konusunda hemfikir olmuşuz gibi gözüküyor.

sertacates commented 2 years ago

Bir iki günlüğüne google colab pro hesabı alırız gibi düşünmüştüm. Neyse şimdi kural bazlı gidelim ilk iş bitince ve zaman kalırsa modellere geçeriz

S-Toprak commented 2 years ago

Madde Saysını kural bazlı bulunması yeterli hocam, model kullanmaya gerek kalmadı.

sertacates commented 2 years ago

Elinize sağlık gençler, artık yarışma gününü bekleyeceğiz.