msampaio / flauta-solo

Estudo do repertório de flauta solo
BSD 3-Clause "New" or "Revised" License
2 stars 0 forks source link

Propor código identificador para movimentos de composições #12

Closed msampaio closed 11 years ago

msampaio commented 11 years ago

Os arquivos PDF do IMSLP têm um prefixo como IMSLP00001 e um sufixo como Fantasias_Telemann. Prefixo e sufixo são separados por -. Usaremos o prefixo como identificador no software que desenvolveremos. Nesta pesquisa consideraremos como unidade cada movimento de uma composição (vide ata). No IMSLP há casos em que os movimentos estão em arquivos separados, e casos em que todos os movimentos estão em um único arquivo. Nos casos em que os movimentos estão em um só arquivo, teremos que separa-los. Precisaremos então gerar um código novo para cada um desses movimentos. No software eu usarei o - como delimitador do prefixo. Eu pensei em inserir uma letra para cada movimento antes do -. Por exemplo, IMSLP00001a e IMSLP00001b. A tarefa é definir um código identificador dos movimentos da composição que aproveite o prefixo do IMLSP. Verifique se essa minha proposta das letras é eficiente, se existem letras no código do IMSLP, e como fazer com o caso de métodos que têm mais de 26 exercícios em um único livro. Leia os resultados da tarefa #1 antes de começar.

msampaio commented 11 years ago

@patrickandrews, anos atrás eu trabalhei na criação de um código de identificação de documentos (sob orientação de Lucas). Escrevi um artigo sobre este código. Talvez seja útil para realizar esta tarefa. O PDF está em Bibliografia, no Copy.

msampaio commented 11 years ago

@patrickandrews, qual o estado desta tarefa? Precisa de alguma ajuda?

patrickandrews commented 11 years ago

Estou retomando. Como havia comentado, fiquei sem computador. Consegui comprar um outro processador e por sorte, ele chegou ontem e já estou configurando meu pc.

Eu vi a tarefa #1 bem como o seu artigo e chequei alguns arquivos do IMSLP. O que estou me questionando é em relação ao tamanho do arquivo. O Windows geralmente limita os nomes de arquivos em 260 caracteres. Mas o nome do arquivo, na verdade, deve ser mais curto que isso, já que o caminho completo (como C:\Arquivos de Programa\nome_do_arquivo.txt) está incluído nessa contagem de caracteres. Por isso que podemos, ocasionalmente, encontrar um erro ao copiar um arquivo com um nome muito longo para um local que possua um caminho mais longo que o local atual.

No mac antigamente só possuia nome de arquivo máximo de 31 caracteres, mas já corrigiu isso tendo capacidade máxima de 255 caracteres (acho que é a mesma quantidade para o windows xp). Como funciona isso no Linux?

Acha que é algo pertinente a se levar em consideração?

msampaio commented 11 years ago

@patrickandrews, foi bom você observar estas questões dos caracteres no nome do arquivo. Acho que o ideal seria ter até 8 caracteres, como existia originalmente no DOS. Poderíamos ter, por exemplo, I000001 para o arquivo IMSLP000001-qualquer_extensão_possível. Ainda poderíamos ter um caractere para cada composição e outro para os movimentos. Então, o movimento 2 da música 3 da fonte I000001 seria algo como I000001bc. O que você acha?

msampaio commented 11 years ago

@patrickandrews, continuarei a anotar as ideias sobre esta codificação aqui. Durante a transcrição das 12 Fantasias de Telemann nós usamos a codificação EXTRA0001 a EXTRA0012 para cada uma das fantasias. Esta codificação é problemática, pois de fato tempos apenas uma fonte: "EXTRA0001-Telemann - Fantasies flute (with facsimile - Musica Rara)". Acho importante manter a referência a essa única fonte na codificação. Então talvez seja melhor usar algo como EXTRA0001_01 a EXTRA0001_12 para cada uma das fantasias. Os movimentos podem ser inseridos depois: EXTRA0001_01a, EXTRA0001_01b e assim por diante. Nas partituras transcritas teremos ainda uma versão "expandida". Nesta versão nós escrevemos os sinais de repetição da música por extenso. Estas partituras podem conter o símbolo E no final, como em EXTRA0001_01aE. Para simplificar o código podemos usar o prefixo E no lugar de EXTRA. Dessa forma, a transcrição expandida do segundo movimento da primeira peça da fonte EXTRA0001 seria E0001_01bE. O que você acha? @ZeRodriguez, @AlissonGSilva e @daniloabrahao, qual a opinião de vocês sobre esta codificação? Uma vez batido o martelo, teremos que nos acostumar a chamar todas as partituras com esses códigos.

patrickandrews commented 11 years ago

@msampaio Por que "EXTRA"? E você pode exemplificar, só para ter certeza de que eu entendi, como ficaria um nome completo, por exemplo da 2ª Fantasia 2b?

ZeRodriguez commented 11 years ago

@patrickandrews, a nomenclatura EXTRA se dá pelo fato de ser o nome da fonte. É assim que o arquivo é nomeado quando baixado. @msampaio, por mim não tem problemas com essa nova nomenclatura. Só é preciso um tempo para nos adaptarmos.

msampaio commented 11 years ago

@patrickandrews e @ZeRodriguez:

  1. o código EXTRA é arbitrário e serve para os casos em que usaremos fontes próprias para músicas que estão no IMSLP. Se tiver ideia melhor, pode sugerir. Coloquei EXTRA para diferenciar de IMSLP e podermos começar com as transcrições.
  2. A fonte EXTRA0001 contém todos os movimentos de todas as 12 fantasias de Telemann. O movimento n. 2 da Fantasia 2 desta fonte seria codificada como EXTRA0001_02b.
  3. Estou propondo simplificarmos os códigos EXTRA e IMLSP para E e I, respectivamente. Dessa forma, o código da fonte EXTRA0001_02b seria transformado em E0001_02b. O código de uma fonte genérica IMSLP123456 seria transformado em I123456.
  4. Precisamos testar se essa nomenclatura cobrirá outros tipos de obras musicais. Teremos exemplos para testar logo que a tarefa #45 estiver concluída.
patrickandrews commented 11 years ago

Entendi. Bem, era justamente isso que iria sugerir. Acho que realmente não é necessário aumentar o número de caracteres, no caso de usarmos EXTRA, por exemplo, apenas o E e do IMLSP o I, como você mencionou, é suficiente.

ZeRodriguez commented 11 years ago

Entendi.

msampaio commented 11 years ago

Ótimo, @patrickandrews. Você pode escrever um texto documentando como o código funciona para colocarmos no manual da pesquisa?

patrickandrews commented 11 years ago

Sim. Vou fazer.

AlissonGSilva commented 11 years ago

Eu acredito que funciona essa que Marcos sugeriu: EXTRA e IMLSP para E e I. É um sistema parecido com o sistema alfanumérico de placas de identificação de veículos antigamente, a letra indicava o Estado de origem do veículo.

daniloabrahao commented 11 years ago

@msampaio, eu acho que a sua sugestão de codificação (ex.:E0001_01b e E0001_01bE) é boa. Acho que é, de certa forma, mais simples. Vai ser só uma rápida questão de tempo até nos acostumar. Mas não tenho tato suficiente para saber se essa nova codificação pode gerar algum problema.

msampaio commented 11 years ago

@patrickandrews, você está precisando de alguma ajuda para documentar o código no manual da pesquisa? Estou precisando que você conclua esta tarefa para que eu possa seguir em frente no projeto.

patrickandrews commented 11 years ago

@msampaio Eu estava preparando um texto, mas realmente agora estou com dúvida. O tipo de texto tem que ser curto e direto ou precisa relatar em detalhes o que se foi pensado até chegar a conclusão?

msampaio commented 11 years ago

Curto e direto.

patrickandrews commented 11 years ago

https://docs.google.com/document/d/1nSecR_DbSAyrIQG94scwfBoKKlr6WWl14J0Wg3LxU3o/edit?usp=sharing

msampaio commented 11 years ago

@patrickandrews, o caminho é esse. Falta explicar o que é 0001 e 01, dizer que a versão expandida é opcional, e dizer que depois desse código pode haver um sufixo aleatório separado por -, indicando nome da peça, do compositor, ou qualquer outra informação. Em geral o sufixo é fornecido pelo IMSLP.

¹                ² 
E0001_01aE

E¹ - Simboliza EXTRA, mesmo código utilizado na transcrição das 12 Fantasias de Telemann.
0001_01 - Número da peça.
a - 1º movimento. No caso de 2º movimento, utilizar b.
E² - Refere-se a versão expandida.
patrickandrews commented 11 years ago

@msampaio Fiquei em dúvida da necessidade do 0001 e 01. Me ferido dos dois aparecerem juntos.

msampaio commented 11 years ago

@patrickandrews, existem casos em que uma fonte contém uma única música. Nesse caso o 01 seria desnecessário. No entanto há casos em que uma fonte contém várias músicas, como o nosso EXTRA0001. Nesse caso é preciso diferenciar cada uma das músicas. Nesse caso é necessário ter o 01.

patrickandrews commented 11 years ago

https://docs.google.com/document/d/1nSecR_DbSAyrIQG94scwfBoKKlr6WWl14J0Wg3LxU3o/edit

msampaio commented 11 years ago

@patrickandrews uma maneira mais formal de descrever seria:

ab_cde, onde

patrickandrews commented 11 years ago

Devo então substituir estritamente para essa maneira e deletar a parte de baixo do arquivo?

https://docs.google.com/document/d/1nSecR_DbSAyrIQG94scwfBoKKlr6WWl14J0Wg3LxU3o/edit

msampaio commented 11 years ago

@patrickandrews, a versão que você fez no google docs ficou boa. Você pode inserir no manual? Eu criei um usuário para você editar o manual

patrickandrews commented 11 years ago

Posso sim. Qual usuário?

msampaio commented 11 years ago

Você deve receber senha e login por email.

patrickandrews commented 11 years ago

Eu devo inserir em tarefas? E qual título? Por sinal, ao fazer isso, depois você terá que validar uma nova senha para Alisson uma vez em que ele ficará bloqueado.

msampaio commented 11 years ago

@patrickandrews, insira no final com o título "Código de identificação de arquivos". Qual o problema com @AlissonGSilva? Eu criei um login patrick e cadastrei seu email para o envio eletrônico da senha.

patrickandrews commented 11 years ago

Quando vou em editar, aparece a seguinte mensagem: "This content is currently locked. If you take over, Alisson Silva will be blocked from continuing to edit."

patrickandrews commented 11 years ago

Devo prosseguir?

msampaio commented 11 years ago

Entendi agora. Aguarde alguns minutos. Só é possível ter uma pessoa editando as páginas de cada vez.

AlissonGSilva commented 11 years ago

Está livre agora @patrickandrews , terminei de editar a página.

patrickandrews commented 11 years ago

@msampaio Pode conferir? http://genosmus.com/pesquisa/flauta-solo/manual/

Eu adicionei o exemplo também. Porém, é necessário?

msampaio commented 11 years ago

Ficou muito bom, @patrickandrews. O exemplo era essencial. Insira apenas esse texto antes de apresentar o código: "Os arquivos de fontes e partituras do projeto são codificados de acordo com este esquema:". Fechando tarefa.

patrickandrews commented 11 years ago

@msampaio Por favor, veja se ficou certo.

msampaio commented 11 years ago

Sim

msampaio commented 11 years ago

@patrickandrews, @ZeRodriguez, @AlissonGSilva e @daniloabrahao, só podemos saber se o código funciona testando na prática. Verifiquei duas questões referentes ao nosso código:

  1. Apenas os dois primeiros campos precisam ser obrigatório. Aparentemente o código E00001 é suficiente para identificar a fonte das 12 fantasias de Telemann que usamos.
  2. O código não estabelece diferença entre fonte e transcrição de nossa autoria. O único elemento que nos ajuda a diferenciar é o tipo de arquivo---pdf para as fontes. No entanto se precisarmos gerar pdf para as transcrições podemos ficar confusos.

Então proponho as seguintes alterações:

  1. Inserção obrigatório de um caractere alfabético entre os campos a e b indicando se o código está identificando uma fonte (F) ou transcrição (T).
  2. Obrigatoriedade apenas para esses 3 novos primeiros campos: Classificação de fonte, Fonte ou transcrição, Número de identificação.

Dessa forma nosso código passa a ser:

abc_def-g, onde:

Vejam alguns exemplos de uso desse novo código:

ZeRodriguez commented 11 years ago

@msampaio, começarei a renomear conforme seu comentário acima. Amanhã estará pronto!