Notebooks dan utils digunakan untuk melakukan eksplorasi terutama untuk melakukan re-anotasi terhadap named-entity, dengan bantuan NER dan POS tags (NNP)
# ::snt Bunga ditanam Bu Ani
(t / tanam
- :ARG0 (b1 / bu
- :name (a / ani))
+ :ARG0 (o / orang
+ :name (n / name :op1 "Bu" :op2 "Ani"))
:ARG1 (b / bunga))
Secara programatik ini dilakukan dengan menggunakan regex berikut (belum handle nama dnegan satu kata saja):
( *)(:ARG[0-9]) *\([a-z0-9\s]*\/ *([a-z0-9]*)[\n\s ]*:name \([a-z0-9\s]*\/ *([a-z0-9]*) *\)\)
dan replace dengan:
$1$2 (o / orang
$1$1:name (n / name
$1$1$1:op1 "$3"
$1$1$1:op2 "$4"))
:ARG0 (d / doctor :wiki - :name (n2 / name :op1 "Talcott"))
tapi kalau pak/bu/tante mah tetep aja kayak biasa
:name (m / name :op1 "Mr." :op2 "Vitulli")
Terutama partikel ke
, 'itu' dan di
(b1 / berangkat
:ARG0 (o / orang
:name (n / name :op1 "Om" :op2 "Andi"))
+ :ARG1 (s / sekolah)
- :ARG1 (s / sekolah
- :mod (k / ke))
:time (b2 / besok))
dan beberapa modifiernya (konsider untuk tidak menggunakan modifier kompleks)
(p / pergi
:ARG0 (k1 / kami
:mod (k2 / keluarga))
:ARG1 (t / tamasya)
+ :time (d / date-entity
+ :weekday (m / minggu)))
- :time (h / hari
- :mod (m / minggu)))
Menjadi location (jenis location) named op
Karena programmatic, pastiin nodenya juga direnumber dengan sesuai
Ini berdasarkan data yang digunakan oleh riset Amany dengan properties:
# ::id 1221
# ::snt Ayah mengajar di Sekolah Dasar negeri Tamanan 01 tahun ini atau Adik bermain boneka Barbie
(a / atau
:op1 (a2 / ajar
:ARG0 (a3 / ayah)
:location (s / sekolah
:mod (d / dasar
:mod (n / negeri))
:name (t / tamanan