Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Adiel Mittmann ESCANSÃO AUTOMÁTICA DE VERSOS EM ..., Notas de aula de Poética

escandir é dividir um verso em sílabas poéticas. O substantivo escansão se refere tanto ao processo de escandir quanto ao resultado do ...

Tipologia: Notas de aula

2022

Compartilhado em 07/11/2022

Jose92
Jose92 🇧🇷

4.6

(178)

223 documentos

1 / 322

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Adiel Mittmann
ESCANSÃO AUTOMÁTICA DE VERSOS EM PORTUGUÊS
Tese submetida ao Programa de Pós-
Graduação em Ciência da Computação
da Universidade Federal de Santa Cata-
rina para a obtenção do Grau de Doutor
em Ciência da Computação. Orientador:
Prof. Dr. rer. nat. Aldovon Wangenheim.
Florianópolis
2016
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Adiel Mittmann ESCANSÃO AUTOMÁTICA DE VERSOS EM ... e outras Notas de aula em PDF para Poética, somente na Docsity!

Adiel Mittmann

ESCANSÃO AUTOMÁTICA DE VERSOS EM PORTUGUÊS

Tese submetida ao Programa de Pós- Graduação em Ciência da Computação da Universidade Federal de Santa Cata- rina para a obtenção do Grau de Doutor em Ciência da Computação. Orientador: Prof. Dr. rer. nat. Aldo von Wangenheim.

Florianópolis 2016

Ficha de identificação da obra elaborada pelo autor através do Programa de Geração Automática da Biblioteca Universitária da UFSC.

Mittmann, Adiel Escansão Automática de Versos em Português / Adiel Mittmann ; orientador, Aldo von Wangenheim - Florianópolis, SC, 2016. 300 p. Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Ciência da Computação. Inclui referências

  1. Ciência da Computação. 2. Escansão automática. 3. Transcrição fonética. 4. Versificação. I. Wangenheim, Aldo von. II. Universidade Federal de Santa Catarina. Programa de Pós-Graduação em Ciência da Computação. III. Título.

AGRADECIMENTOS

À Nataliya, por tanto carinho e paciência. À família, pelo apoio e con- fiança. Ao Alckmar, à Isabela, à Samanta e à Lívia, sem cuja ajuda nada teria sido feito. Ao Maciel, ao Étienne, ao Laurent e ao Damon, pelo meu período no BCL. Ao Aldo, ao Roberto e ao PPGCC, pela oportunidade de fazer pesquisa. Ao CNPq, por ter me enviado à França. Aos membros da banca, por enriquecerem o trabalho com perguntas e sugestões.

1 2 3 4 5 6 7 8 9 10 11 A- des- te, hen- de- ca- syl- la- bi, quo- t es- tis om- ne- s un- di- que, quot- quo- t es- ti- s om- nes.

Vin- de, hen- de- cas- sí- la- bos, vós quan- tos sois, De to- dos os la- dos vin- de em pro- fu- são. Catulo

ABSTRACT

This thesis presents a system capable of scanning verses in Portuguese. The system aims to scan metrical verses, those for which the number of syl- lables is a fundamental feature. Given a poem, the system first processes individual words, finding the position of their stress and dividing them into syllables. Words are then concatenated and the system finds a list of possible pronunciations for each verse, using a set of rules in order to ap- ply phenomena such as synaeresis or synaloepha. The set of pronunciati- ons for all verses in the poem are analyzed together in order to determine the poem’s meter, that is, the number of syllables its verses should contain. By grouping together all verses of a given length, the system finds rhyth- mical patterns and chooses, for each verse, the pronunciation that most closely matches the pattern. In order to validate the system, it was applied to ten corpora, from different authors and whose production dates range from the 16th to the 20th century, for a total of more than 100,000 verses. By manually assessing the correctness of the scansion produced for 1. randomly selected verses (1% of the total), the accuracy rate was ascertai- ned to be 99,0%, ranging from 97,5 to 100,0% among the different corpora.

Keywords: Automatic scansion. Phonetic transcription. Versification.

SUMÁRIO

LISTA DE FIGURAS

LISTA DE TABELAS

    1. Introdução
    • 1.1. Contextualização
    • 1.2. Proposta
    • 1.3. Motivação
    • 1.4. Objetivos
    • 1.5. Convenções
    • 1.6. Organização
    1. Versificação
    • 2.1. O verso
      • 2.1.1. Metro
      • 2.1.2. Ritmo
      • 2.1.3. Tipologia
      • 2.1.4. Metaplasmos
    • 2.2. A estrofe
    • 2.3. O poema
    1. Trabalhos relacionados
    • 3.1. Português
      • 3.1.1. LuCas e SAEP
    • 3.2. Espanhol
      • 3.2.1. Colors of Poetry
      • 3.2.2. O sistema de Gervás
      • 3.2.3. O sistema de Navarro-Colorado
    • 3.3. Italiano
      • 3.3.1. O sistema de Robey
    • 3.4. Francês
      • 3.4.1. Métromètre
      • 3.4.2. Anamètre
    • 3.5. Provençal
      • 3.5.1. O sistema de Rainsford e Scrivner
    • 3.6. Outras línguas
      • 3.6.1. Inglês
      • 3.6.2. Alemão
      • 3.6.3. Russo
      • 3.6.4. Tcheco
      • 3.6.5. Latim e grego
    • 3.7. Considerações finais
    1. Corpora
    • 4.1. Corpora lexicais
    • 4.2. Corpora poéticos principais
    • 4.3. Corpora poéticos secundários
    1. O sistema Aoidos
    • 5.1. Entrada
    • 5.2. Pré-processamento
    • 5.3. Detecção da vogal tônica
    • 5.4. Divisão silábica
    • 5.5. A máquina de regras
    • 5.6. Transcrição fonética
    • 5.7. Gerador de elocuções
    • 5.8. Análise métrica
    • 5.9. Análise rítmica
    • 5.10. Detalhes técnicos
    • 5.11. Considerações metodológicas
    1. Experimentos
    • 6.1. Vogal tônica
    • 6.2. Experimento principal de validação
      • 6.2.1. Execução
      • 6.2.2. Resultados
      • 6.2.3. Discussão
    • 6.3. Experimento secundário de validação
    • 6.4. Caso de uso: os versos de Gregório de Matos
    • 6.5. Caso de uso: os decassílabos do Uraguai
    1. Conclusão
  • Bibliografia
  • A. Versos inescandíveis
  • B. Regras prosódicas
  • C. Versos manualmente verificados
  • 5.1. Etapas do sistema e respectivos exemplos.
  • 5.2. Exemplo do formato TEI
  • 5.3. Exemplo de versos com números
  • 5.4. Exemplo de verso com palavras estrangeiras
  • 5.5. Exemplo de versos emendados
  • 6.1. Gráfico dos tipos de versos na obra de Basílio da Gama
  • 6.2. Gráfico dos tipos de versos em sete corpora
  • 1.1. Símbolos fonéticos
  • 2.1. Classificação dos versos segundo seu número de sílabas.
  • 2.2. Classificação das estrofes segundo número de versos.
  • 3.1. Contagem de sílabas pelos sistemas LuCas e SAEP
  • 3.2. Erros do sistema SAEP
  • 3.3. Sumário das ferramentas de escansão automática
  • 4.1. Corpora poéticos: autores e datas
  • 4.2. Quantidade de versos nos corpora
  • 4.3. Versos, estrofes e poemas nos corpora
  • 4.4. Versos repetidos, fragmentários e emendados nos corpora
  • 4.5. Expansões, estrangeirismos e regularizações nos corpora
  • 4.6. Versos corrigidos, faltantes, excedentes e inescandíveis
  • 4.7. Corpora poéticos secundários: autores e datas
  • 4.8. Versos, estrofes e poemas nos corpora secundários
  • 4.9. Versos corrigidos e inescandíveis nos corpora secundários
  • 5.1. Regras de localização da vogal tônica
  • 5.2. Exemplo de seções para a regra C.
  • 5.3. Grupos compostos dos grafemas u e i.
  • 5.4. Exemplo de catálogo de ritmos
  • 6.1. Acertos e erros na detecção das vogais tônicas no hou10
  • 6.2. Acertos e erros na detecção da vogal tônica no corpus lit30
  • 6.3. Tempo de execução do sistema ao analisar os corpora.
  • 6.4. Resultados da verificação manual.
  • 6.5. Quantidade de regras aplicadas nos corpora
  • 6.6. Quantidade de aplicações e de elocuções encontradas
  • 6.7. Quantidade de corpora aos quais as regras se aplicaram
  • 6.8. Validação cruzada
  • 6.9. Quantidade de aplicações segundo categoria das regras
  • 6.10. Pontuação média das aplicações segundo a categoria
  • 6.11. Quantidade absoluta de versos segundo número de sílabas
  • 6.12. Quantidade relativa de versos segundo número de sílabas
  • 6.13. Versos de Gregório de Matos
  • 6.14. Sonetos decassilábicos em espanhol de Gregório de Matos
  • 6.15. Sonetos escritos por Gregório de Matos
  • 6.16. Versos de Gregório de Matos: Aoidos vs. Chociay
  • 6.17. Versos do Uraguai explicitamente classificados por Chociay
  • 6.18. Versos heroicos do Uraguai: Aoidos vs. Chociay
  • 6.19. Versos sáficos do Uraguai: Aoidos vs. Chociay
  • 6.20. Percentuais no Uraguai: Aoidos vs. Chociay
  • 6.21. Versos heroicos de sete corpora: Aoidos vs. Chociay
  • 6.22. Versos sáficos de sete corpora: Aoidos vs. Chociay
  • 6.23. Percentuais em sete corpora: Aoidos vs. Chociay