CONHECENDO O COMPONENTE BASES DE INFORMAÇÕES ORTOGRÁFICO-FONÉTICAS DO PORTUGUÊS FALADO DE SÃO PAULO
As Bases de Informações Ortográfico-Fonéticas do Português Falado de São Paulo, a partir das quais os demais componentes do Sistema são gerados – Corpora e Léxicos –, contêm informações de cada um dos 216 informantes em dois tipos de interação dialógica – entrevistas e conversações -, num total, portanto, de 432 inquéritos. As informações estão organizadas pela ordem de registro de gravação e de acordo com os procedimentos de anotação e de estruturação adotados.
Assim sendo, além da transcrição ortográfica e da transcrição fonética de 179.720 registros de itens lexicais, as Bases incluem anotações relativas a variáveis linguísticas (especificidades da língua oral, categorias de encontros fônicos intervocabulares) e a variáveis extralinguísticas que foram controladas na seleção dos 216 informantes que forneceram material linguístico para a constituição da amostra (região de origem, sexo, escolaridade, faixa etária e nível socioeconômico) e na produção dos diálogos (formal e informal). Ou seja, as Bases trazem a informação lexical organizada em função de relações com dados linguísticos e extralinguísticos, o que permite diferentes possibilidades combinatórias.
CONHECENDO O COMPONENTE CORPORA ELETRÔNICOS DO PORTUGUÊS FALADO DE SÃO PAULO - BASES DE DADOS TEXTUAIS
O componente CORPORA possibilita a geração de Corpora Eletrônicos do Português Falado de São Paulo (Bases de Dados Textuais, ou arquivos de textos), com variadas possibilidades de exploração por programas de computador e suscetíveis de aplicação em diferentes áreas dos estudos da linguagem e de áreas afins, e de submissão a tratamento quantiqualitativo por sistemas de processamento de dados.
CONHECENDO O COMPONENTE LÉXICO DE FREQUÊNCIA ORTOGRÁFICO-FONÉTICO DO PORTUGUÊS FALADO DE SÃO PAULO
Gerado a partir das Bases de Informações Ortográfico-Fonéticas do Português Falado de São Paulo, o Léxico de Frequência traz, para cada palavra em sua transcrição ortográfica, as correspondentes transcrições fonéticas, sem e com separação silábica, com anotação da frequência da unidade fonética e da frequência acumulada da unidade ortográfica correspondente. Trata-se de léxico eletrônico, porque construído eletronicamente a partir das Bases.
CONHECENDO O COMPONENTE LÉXICO ORTOGRÁFICO-FONÉTICO DE JUNTURAS INTERVOCABULARES DO PORTUGUÊS FALADO DE SÃO PAULO
Gerado a partir das Bases de Informações Ortográfico-Fonéticas do Português Falado de São Paulo, o Léxico Ortográfico-Fonético de Junturas Intervocabulares expõe categorias de juntura intervocabular – encontros fônicos lexicais que se dão nos limites de duas ou mais fronteiras de palavras -, a combinatória acentual das sílabas intervocabulares, a transcrição ortográfica com a correspondente transcrição fonética silábico-lexical de sequências vocabulares reunidas de acordo com a categoria de juntura. Trata-se de léxico eletrônico, porque construído eletronicamente a partir das Bases.
CONHECENDO O COMPONENTE LÉXICO DE FREQUÊNCIA ORTOGRÁFICO-FONÉTICO DE JUNTURAS INTERVOCABULARES DO PORTUGUÊS FALADO DE SÃO PAULO
Também gerado a partir das Bases de Informações Ortográfico-Fonéticas do Português Falado de São Paulo, o Léxico de Frequência Ortográfico-Fonético de Junturas Intervocabulares expõe a transcrição ortográfica com a correspondente transcrição fonética silábico-lexical de sequências vocabulares reunidas de acordo com categorias de juntura intervocabular – encontros fônicos lexicais que se dão nos limites de duas ou mais fronteiras de palavras -, a frequência da categoria de juntura, da combinatória acentual das sílabas intervocabulares, da transcrição ortográfica (acumulada) e da transcrição fonética.
TEXTOS EXPLICATIVOS
© CorPor. Todos os direitos reservados.