LimaRAF / plantR

An R Package for Managing Species Records from Biological Collections
GNU General Public License v3.0
17 stars 4 forks source link

current fieldNames.csv outdated #21

Closed saramortara closed 3 years ago

saramortara commented 4 years ago

Fields gbif and splink do not match with current output from their sources. Given that we are only dealing with gbif and speciesLink data, I suggest we keep only those data sources. We should have two other columns: dwc with the current DarwinCore standard and a logical column required to specify if the field is required in the data cleaning procedure. Suggestion: file formarField.csv (and we should keep the script we used to generate it either here or in a different repo) containing the columns: gbif, splink, dwc, and required.

LimaRAF commented 3 years ago

@saramortara was this issue solved with the new formatDwc()?? Can we close it?

LimaRAF commented 3 years ago

@saramortara

Tive que olhar os códigos que geram fieldNames por conta de umas colunas essenciais que estavam sumindo com o drop. O código está funcionado bem e eu acrescentei mais colunas, separando as colunas em must/required e optional. Acho que com os testes das novas funções iremos saber se tem alguma coluna a mais em optional que tem que ir para must para as funcionalidades plantR todas funcionarem.

Também tive que acrescentar (poucos) campos opcioanis mais importantes que tinham só no speciesLink (sem equivalencia direta no DwC). Acho que por conta do left_join, essas colunas ficaram de fora.

Depois quando puder, veja as alterações que fiz nesse código. Elas estão no commit 762da3fc.