Closed msampaio closed 11 years ago
@patrickandrews, anos atrás eu trabalhei na criação de um código de identificação de documentos (sob orientação de Lucas). Escrevi um artigo sobre este código. Talvez seja útil para realizar esta tarefa. O PDF está em Bibliografia
, no Copy.
@patrickandrews, qual o estado desta tarefa? Precisa de alguma ajuda?
Estou retomando. Como havia comentado, fiquei sem computador. Consegui comprar um outro processador e por sorte, ele chegou ontem e já estou configurando meu pc.
Eu vi a tarefa #1 bem como o seu artigo e chequei alguns arquivos do IMSLP. O que estou me questionando é em relação ao tamanho do arquivo. O Windows geralmente limita os nomes de arquivos em 260 caracteres. Mas o nome do arquivo, na verdade, deve ser mais curto que isso, já que o caminho completo (como C:\Arquivos de Programa\nome_do_arquivo.txt) está incluído nessa contagem de caracteres. Por isso que podemos, ocasionalmente, encontrar um erro ao copiar um arquivo com um nome muito longo para um local que possua um caminho mais longo que o local atual.
No mac antigamente só possuia nome de arquivo máximo de 31 caracteres, mas já corrigiu isso tendo capacidade máxima de 255 caracteres (acho que é a mesma quantidade para o windows xp). Como funciona isso no Linux?
Acha que é algo pertinente a se levar em consideração?
@patrickandrews, foi bom você observar estas questões dos caracteres no nome do arquivo. Acho que o ideal seria ter até 8 caracteres, como existia originalmente no DOS. Poderíamos ter, por exemplo, I000001
para o arquivo IMSLP000001-qualquer_extensão_possível
. Ainda poderíamos ter um caractere para cada composição e outro para os movimentos. Então, o movimento 2 da música 3 da fonte I000001
seria algo como I000001bc
. O que você acha?
@patrickandrews, continuarei a anotar as ideias sobre esta codificação aqui.
Durante a transcrição das 12 Fantasias de Telemann nós usamos a codificação EXTRA0001
a EXTRA0012
para cada uma das fantasias. Esta codificação é problemática, pois de fato tempos apenas uma fonte: "EXTRA0001-Telemann - Fantasies flute (with facsimile - Musica Rara)". Acho importante manter a referência a essa única fonte na codificação. Então talvez seja melhor usar algo como EXTRA0001_01
a EXTRA0001_12
para cada uma das fantasias. Os movimentos podem ser inseridos depois: EXTRA0001_01a
, EXTRA0001_01b
e assim por diante.
Nas partituras transcritas teremos ainda uma versão "expandida". Nesta versão nós escrevemos os sinais de repetição da música por extenso. Estas partituras podem conter o símbolo E
no final, como em EXTRA0001_01aE
.
Para simplificar o código podemos usar o prefixo E
no lugar de EXTRA
. Dessa forma, a transcrição expandida do segundo movimento da primeira peça da fonte EXTRA0001
seria E0001_01bE
. O que você acha?
@ZeRodriguez, @AlissonGSilva e @daniloabrahao, qual a opinião de vocês sobre esta codificação? Uma vez batido o martelo, teremos que nos acostumar a chamar todas as partituras com esses códigos.
@msampaio Por que "EXTRA"? E você pode exemplificar, só para ter certeza de que eu entendi, como ficaria um nome completo, por exemplo da 2ª Fantasia 2b?
@patrickandrews, a nomenclatura EXTRA
se dá pelo fato de ser o nome da fonte. É assim que o arquivo é nomeado quando baixado. @msampaio, por mim não tem problemas com essa nova nomenclatura. Só é preciso um tempo para nos adaptarmos.
@patrickandrews e @ZeRodriguez:
EXTRA
é arbitrário e serve para os casos em que usaremos fontes próprias para músicas que estão no IMSLP. Se tiver ideia melhor, pode sugerir. Coloquei EXTRA
para diferenciar de IMSLP
e podermos começar com as transcrições.EXTRA0001
contém todos os movimentos de todas as 12 fantasias de Telemann. O movimento n. 2 da Fantasia 2 desta fonte seria codificada como EXTRA0001_02b
.EXTRA
e IMLSP
para E
e I
, respectivamente. Dessa forma, o código da fonte EXTRA0001_02b
seria transformado em E0001_02b
. O código de uma fonte genérica IMSLP123456
seria transformado em I123456
.Entendi. Bem, era justamente isso que iria sugerir. Acho que realmente não é necessário aumentar o número de caracteres, no caso de usarmos EXTRA, por exemplo, apenas o E e do IMLSP o I, como você mencionou, é suficiente.
Entendi.
Ótimo, @patrickandrews. Você pode escrever um texto documentando como o código funciona para colocarmos no manual da pesquisa?
Sim. Vou fazer.
Eu acredito que funciona essa que Marcos sugeriu: EXTRA
e IMLSP
para E
e I
. É um sistema parecido com o sistema alfanumérico de placas de identificação de veículos antigamente, a letra indicava o Estado de origem do veículo.
@msampaio, eu acho que a sua sugestão de codificação (ex.:E0001_01b
e E0001_01bE
) é boa. Acho que é, de certa forma, mais simples. Vai ser só uma rápida questão de tempo até nos acostumar. Mas não tenho tato suficiente para saber se essa nova codificação pode gerar algum problema.
@patrickandrews, você está precisando de alguma ajuda para documentar o código no manual da pesquisa? Estou precisando que você conclua esta tarefa para que eu possa seguir em frente no projeto.
@msampaio Eu estava preparando um texto, mas realmente agora estou com dúvida. O tipo de texto tem que ser curto e direto ou precisa relatar em detalhes o que se foi pensado até chegar a conclusão?
Curto e direto.
@patrickandrews, o caminho é esse. Falta explicar o que é 0001
e 01
, dizer que a versão expandida é opcional, e dizer que depois desse código pode haver um sufixo aleatório separado por -
, indicando nome da peça, do compositor, ou qualquer outra informação. Em geral o sufixo é fornecido pelo IMSLP.
¹ ²
E0001_01aE
E¹ - Simboliza EXTRA, mesmo código utilizado na transcrição das 12 Fantasias de Telemann.
0001_01 - Número da peça.
a - 1º movimento. No caso de 2º movimento, utilizar b.
E² - Refere-se a versão expandida.
@msampaio Fiquei em dúvida da necessidade do 0001 e 01. Me ferido dos dois aparecerem juntos.
@patrickandrews, existem casos em que uma fonte contém uma única música. Nesse caso o 01
seria desnecessário. No entanto há casos em que uma fonte contém várias músicas, como o nosso EXTRA0001. Nesse caso é preciso diferenciar cada uma das músicas. Nesse caso é necessário ter o 01
.
@patrickandrews uma maneira mais formal de descrever seria:
ab_cde
, onde
a
- caractere alfanumérico que descreve origem da fonte. I
para IMSLP e E
para fontes extrasb
- conjunto de 6 caracteres numéricos que descrevem a identificação da fonte. É o mesmo valor usado no IMSLPc
- conjunto de 2 caracteres numéricos opcionais que descrevem o número da música dentro da fonte. Nos casos em que a fonte tem uma única música, o valor padrão é 00
.d
- caractere alfabético que indica o movimento dentro da música. Nos casos de movimento único, o valor padrão é a
.e
- caractere E
opcional, para os documentos com repetições formais expandidas.Devo então substituir estritamente para essa maneira e deletar a parte de baixo do arquivo?
https://docs.google.com/document/d/1nSecR_DbSAyrIQG94scwfBoKKlr6WWl14J0Wg3LxU3o/edit
@patrickandrews, a versão que você fez no google docs ficou boa. Você pode inserir no manual? Eu criei um usuário para você editar o manual
Posso sim. Qual usuário?
Você deve receber senha e login por email.
Eu devo inserir em tarefas? E qual título? Por sinal, ao fazer isso, depois você terá que validar uma nova senha para Alisson uma vez em que ele ficará bloqueado.
@patrickandrews, insira no final com o título "Código de identificação de arquivos". Qual o problema com @AlissonGSilva? Eu criei um login patrick e cadastrei seu email para o envio eletrônico da senha.
Quando vou em editar, aparece a seguinte mensagem: "This content is currently locked. If you take over, Alisson Silva will be blocked from continuing to edit."
Devo prosseguir?
Entendi agora. Aguarde alguns minutos. Só é possível ter uma pessoa editando as páginas de cada vez.
Está livre agora @patrickandrews , terminei de editar a página.
@msampaio Pode conferir? http://genosmus.com/pesquisa/flauta-solo/manual/
Eu adicionei o exemplo também. Porém, é necessário?
Ficou muito bom, @patrickandrews. O exemplo era essencial. Insira apenas esse texto antes de apresentar o código: "Os arquivos de fontes e partituras do projeto são codificados de acordo com este esquema:". Fechando tarefa.
@msampaio Por favor, veja se ficou certo.
Sim
@patrickandrews, @ZeRodriguez, @AlissonGSilva e @daniloabrahao, só podemos saber se o código funciona testando na prática. Verifiquei duas questões referentes ao nosso código:
E00001
é suficiente para identificar a fonte das 12 fantasias de Telemann que usamos.Então proponho as seguintes alterações:
a
e b
indicando se o código está identificando uma fonte (F
) ou transcrição (T
).Dessa forma nosso código passa a ser:
abc_def-g
, onde:
a
: Caractere alfanumérico que identifica a origem da fonte. I
para IMSLP e E
para fontes extras.b
: Caractere alfanumérico que identifica se o documento é uma fonte ou transcrição.c
: Conjunto de 5 caracteres numéricos que descrevem a identificação da fonte. É o mesmo valor usado no IMSLP.d
: Conjunto de 2 caracteres numéricos opcionais que descrevem o número da música dentro da fonte. Estes caracteres devem ser precedidos sempre pelo separador _
.e
: Caractere alfabético opcional que indica o movimento dentro da música.f
: Caractere E opcional, para os documentos com repetições formais expandidas.-
: Separador de código e sufixog
: Sufixo opcional, indicando nome do compositor, da peça e quaisquer outras informações geralmente fornecidas pelo IMSLP.Vejam alguns exemplos de uso desse novo código:
EF00001
- Fonte das 12 Fantasias de TelemannET00001_01a
- Transcrição da Fantasia 1, mov. 1ET00001_03d
- Transcrição da Fantasia 3, mov. 4ET00001_01bE
- Versão expandida da transcrição da Fantasia 1, mov. 2ET00001_12aE
- Versão expandida da transcrição da Fantasia 12, mov. 1@msampaio, começarei a renomear conforme seu comentário acima. Amanhã estará pronto!
Os arquivos PDF do IMSLP têm um prefixo como
IMSLP00001
e um sufixo comoFantasias_Telemann
. Prefixo e sufixo são separados por-
. Usaremos o prefixo como identificador no software que desenvolveremos. Nesta pesquisa consideraremos como unidade cada movimento de uma composição (vide ata). No IMSLP há casos em que os movimentos estão em arquivos separados, e casos em que todos os movimentos estão em um único arquivo. Nos casos em que os movimentos estão em um só arquivo, teremos que separa-los. Precisaremos então gerar um código novo para cada um desses movimentos. No software eu usarei o-
como delimitador do prefixo. Eu pensei em inserir uma letra para cada movimento antes do-
. Por exemplo,IMSLP00001a
eIMSLP00001b
. A tarefa é definir um código identificador dos movimentos da composição que aproveite o prefixo do IMLSP. Verifique se essa minha proposta das letras é eficiente, se existem letras no código do IMSLP, e como fazer com o caso de métodos que têm mais de 26 exercícios em um único livro. Leia os resultados da tarefa #1 antes de começar.