O documento descreve a jornada da Globosat no uso de um sistema de gerenciamento de ativos de mídia (MAM) para catalogar e descrever seu acervo audiovisual. O MAM evoluiu para permitir a decupagem de cenas, pesquisa por metadados controlados e relatórios. Próximos passos incluem integrar o tesauro e ontologias para aprimorar a indexação e encontrabilidade.
4. SOBRE A GLOBOSAT...
• Empresa brasileira provedora de conteúdo para TV Paga
• Fundada em 1991
• Pertence ao Grupo Globo
• Conteúdo: produções próprias, coproduções e licenciamentos
5. 32 CANAIS
20 POSSUEM VERSÃO EM HD | 8 CANAIS PAY-PER-VIEW | 1 CANAL INTERNACIONAL
6. CONTEÚDO SOB DEMANDA
DISPONÍVEL EM OUTRAS PLATAFORMAS PARA OS ASSINANTES DAS OPERADORAS
Canal exclusivo
sob demandaTodos os canais Globosat
ao vivo ou gravado.
Conteúdo exclusivo para os assinantes destes canais Premium
8. TOP OF
MIND
Fonte: Data Folha Pesquisa Top Of Mind 2015
PERGUNTA: Quando você pensa em _______________, por assinatura, qual o primeiro canal que lhe vem a cabeça?
Categorias: CANAL DE NOTÍCIAS, CANAIS DE ESPORTE, CANAIS DE FILME, CANAIS DE VARIEDADE OU ENTRETENIMENTO
FEMININO, CANAL JOVEM e CANAIS DE CONTEÚDO LUTAS/MMA.
Notícias
canais
OS CANAIS GLOBOSAT SÃO OS MAIS LEMBRADOS
NOS SEUS SEGMENTOS
Esporte
Filme
Feminino
Jovem
Lutas/MMA
9. PRESENÇA DA GLOBOSAT
milhõesde domicílios assinantes
Fonte: PTS canais nº 227 Set e Out/15 / Projeção: média de 3,1 pessoas/domicílio PNAD2012
Estamos presentes em
Mais de
milhões
de telespectadores
possuem canais Globosat
11. PILARES DE ATUAÇÃO
Integridade AcessibilidadeEncontrabilidade
Dar aos usuários a
possibilidade de obter o
conteúdo desejado
com rapidez
Organizar o conteúdo
de modo a facilitar as
pesquisas e possibilitar
/ incentivar a
reutilização do
conteúdo de acervo
Manter o arquivo em
boas condições e com
risco aceitável de perda
de conteúdo
12. ESTRUTURA
Pesquisa e
Decupagem
Gestão do Conteúdo
Arquivamento
Digital
Vocabulário
Controlado
Formação: Técnica
• Digitalização/Arquivamento
Formação: Administração/Arquivologia
• Políticas, Procedimentos e Padrões
• Gerenciamento de vigências -> deleção/destruição
• Disponibilização de conteúdo em mídia física
Formação: Biblioteconomia/Arquivologia
• Gerenciamento de termos/taxonomias
• Implementação do Tesauro
Formação: Comunicação/afins
• Indexação/Descrição
• Pesquisa
36 efetivos + 15 temps + 4 estag + 2 aprendizes = 57
13. ACERVO
• 195.000 horas de conteúdo arquivado em mídia física
179.500 horas em BETACAMs
8.000 horas em XDCAMs
2.500 horas em CDs/DVDs
5.000 horas em MINI DVs/DVCAMs/Hi8s
• 520.000 horas de conteúdo arquivado em LTO
354.500 horas “born digital”
165.500 horas digitalizadas
15. CONCEITO
• Gerencia a cadeia dos ativos de mídia: ingest, edição, arquivamento, catalogação,
anotação, recuperação e distribuição
• Movimenta arquivos
• Oferece acesso ao conteúdo (em baixa e alta resolução)
MAMCadastro
Edição
Exibição
Decupagem
Pesquisa/
Recuperação
Arquivamento
Multiplataforma
16. FLUXO DE METADADOS
Canais/Arquivo
Cadastro de
Títulos
Títulos e versões
Pesquisa e Aquisição
Direitos e custos
Criação da
Negociação
Avaliação Técnica
Avaliação
Técnica
Problemas detectados
Formatos
Canais de áudio
IBMS MAM
Políticas de retenção
Arquivamento
Arquivo Arquivo
Decupagem
Indexação de itens
Indexação e descrição de cenas
FTP, MÍDIAS FÍSICAS
17. A EVOLUÇÃO DO MAM NA GLOBOSAT
Media Portal
Diva Director
Viz Ardome
Viz One
Upgrade para Versão 5.10.2
2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
Hoje
Abril
18. A EVOLUÇÃO DO MAM NA GLOBOSAT
Tipo de Conteúdo
Decupagem de Cena
no Sistema
Pesquisa e
Recuperação
Relatórios de
Pesquisa
Vocabulário
Controlado
Versão Exibição
Demais versões
Versão Original
Não
Texto livre
“Correr” o vídeo
Não
Não
Versão Exibição
Demais versões
Texto livre + tags
Texto livre + tags
Na cena específica
Sim
Diretórios
Sem hierarquia
Sem relações
Sem controle sinônimos
Versão Exibição
Não
Texto livre
“Correr” o vídeo
Não
Não
Versão Exibição
Demais versões
Texto livre + tags
Atalhos para log
Index. automática
Texto livre + tags
Na cena específica
Sim
Tesauro
Com hierarquia
Com relações
Com controle sinônimos
20. PROCESSO
Decupagem
(Indexação +
Descrição)
Pesquisa
• É uma prestação de serviço na Globosat
• O valor do serviço considera os custos da
operação e o total de horas demandadas,
considerando 3 níveis de complexidade
• É baseado nos direcionadores fornecidos
pelos canais e em análises realizadas pela
equipe do Arquivo
• Deve estar alinhado com as formas de busca
21. METODOLOGIA
ITEM - Vídeo completo
Indexação do Item
• Informações relacionadas ao vídeo como
um todo
• Apenas termos controlados
Ex: Cidade, estádio, competição, esporte, atletas, árbitros
e técnicos, que atuaram numa partida de futebol
CENA – Trechos relevantes do vídeo
Decupagem da Cena
• Informações relacionadas a uma cena
específica
• Termos controlados + texto livre
Ex: Jogadores envolvidos na jogada que terminou em um
gol e sua descrição detalhada
22. FORMULÁRIO COM METADADOS (ITEM E CENA)
Descrição e indexação de todos os programas
e eventos esportivos
Esporte
HOJE FUTURO
Programas
Descrição e indexação dos programas, séries,
filmes e eventos de música e moda
Eventos
Descrição e indexação de eventos de música
e moda
Descrição e indexação de todos os
programas e eventos esportivos
Esporte
Programas
Descrição e indexação dos programas, séries
e filmes
23. Descrevem a imagem com vocabulário controlado
• Character
Personagem envolvido na ação
• Identity
Nome próprio de quem executa/sofre a ação
• Action
Ação destacada na cena
• Keyword
Registra o contexto da cena (elementos/assunto)
• Sport
Modalidade esportiva da cena
• Main Event
Evento esportivo relacionado à cena
Descrevem a imagem em texto livre
• Image Title
Título com os principais destaques de uma cena
• Image Description
Informações complementares relevantes em uma cena
PRINCIPAIS METADADOS (CENA)
Metadados de Descrição Metadados de Indexação
31. LIÇÕES APRENDIDAS
• Integração Arquivo e Canais
• Definição dos conteúdos e granularidade da decupagem
• Alinhamento da linguagem
• Treinamentos constantes
• Feedback
• Integração Decupagem e Vocabulário Controlado
• Suporte à Pesquisa
32. PRÓXIMOS PASSOS...
• Criação de “atalhos” (telas específicas por tipo de conteúdo)
• Implementação do Tesauro no MAM (sinônimos, relações, candidatos)
• Utilização de relatórios de pesquisa (Encontrabilidade e Políticas)
• Integração da decupagem com Ontologia
• Ferramentas de indexação automática
• Interface única ou migração do legado para um único MAM
34. OBRIGADA!
Márcia de Simoni
Gerente de Arquivo de Conteúdo
msimoni@globosat.com.br
Renan Porto
Coordenador de Arquivamento Digital
renanp@globosat.com.br
Felipe Santos
Coordenador de Pesquisa e Decupagem
felipes@globosat.com.br
Notas del editor
Temos 32 canais, sendo 20 com opção HD, 8 pay per view e 1 canal internacional
32 lineares:
GNT
SporTV
SporTV 2
SporTV 3
Multishow
+Globosat
BIS
Viva
OFF
Gloob
Telecine Premium
Telecine Action
Telecine Touch
Telecine Fun
Telecine Pipoca
Telecine Cult
Universal
Syfy
Studio
Globo News
Canal Brasil
Megapix
Futura
Premiere
BBB
Combate
Sexyhot
Playboy TV
Venus
Sextreme
Forman
PFC Internacional
8 Pay per view :
Premiere
BBB
Combate
Sexyhot
Forman
PlayboyTV
Venus
Sextreme
Oferecemos conteúdo sob demanda em outras plataformas.
VOD Globosat
Globosat Play
Philos
Telecine Play
Premiere Play
PFC Play
Combate Play
BBB Play
Sexyhot Play
VOD NET
Philos
Private (deixou de ser posicionado como canal, é só um produto VOD – vamos mudar no site)
Brazzers
E o conteúdo está disponível nos principais devices
Temos 6 canais “Top of mind” nos seus segmentos
Estamos presents em 17 milhões de domicílios (mais de 53 milhões de telespectadores)
Garantir que o arquivo esteja em boas condições e que o conteúdo seja encontrado e esteja acessível para os usuários
36 funcionários efetivos
15 temporários
4 estagiários
2 menores aprendizes
Total : 57 pessoas
Sistema que gerencia a cadeia dos ativos de mídia, desde o ingest até a distribuição
O objetivo da figura é dar uma ideia dos processos que são realizados dentro e fora do MAM.
Direitos e custos: Tipo de contrato, Tipo de conteúdo (bruto, exibição, vod), Direitos, Nome do produto, Temporada, Distribuidor, Canal, Custo $ ...
Títulos e versões: Título, Episódio, Duração, Versão (original, narrada, legendada)
Politica de Retenção (baseada nos metadados anteriores) : Permanente ou temporário, Cache ou LTO
Duração: preenchida em várias etapas da cadeia dependendo do fluxo do conteúdo (com ou sem avaliação técnica)
Informações Técnicas – Formato, aspect ratio (16:9, 4:3, etc), informações de CQ
Ressaltar que a migração dos canais foi realizada aos poucos (dificuldades operacionais para arquivamento/decupagem e pesquisa e variedade de sistemas)
A partir do Ardome introduzimos a utilização de vocabulário controlado e recuperação de cena específica
Demais versões : Dublada, legendada, etc
Indexação automática a partir de fontes externas
É uma engrenagem que funciona coordenando o controle do vocabulário, passando pela decupagem do conteúdo e terminando na pesquisa realizada pelo usuário final.
Soma todos os custos da área, consolida todas as demandas
Valor do serviço/hora (já está incluído o ABC) = Custo total/qtd de horas demandadas =
Cada ITEM no MAM é um título do IBMS.
O ITEM funciona como um cabeçalho e apresenta as informações gerais sobre determinado vídeo
Cada ITEM, tem várias CENAS...
Decupagem : Indexação por termos controlados (Identidades, Ação, Keyword) + descrição por texto livre
Importante ressaltar que os formulários são parametrizáveis (os metadados foram definidos pelo Arquivo)
Existem metadados que não se aplicam para descrição de conteúdo de música e moda (ex. Character) e outros importantes que não existem pois impactariam programas (ex. Main Event)
Image Title: Neymar fazendo gol de bicicleta
Image Description: Torcedor chorando de emoção
Character: N/A para esporte
Identity: Neymar
Action: Fazendo gol
Sport: Futebol
Main Event: Copa do Mundo
Keyword: Gol de bicicleta
O campo “Image Description” por ser um complemento, não é indexado por vocabulário controlado
Character : Exclusivo do formulário de programas
Sport e Main Event: Exclusivos do formulário de esportes
Com a exceção de Animal (será conceito geral), Genre e Object (não existirão mais), todas as Identities entrarão em alguma categoria dos Conceitos Individuais.
Identity Role, Keyword e Sports serão inseridos dentro de alguma categoria dos Conceitos Gerais.
Event: Campo não pesquisável
Action: Não fará parte do tesauro, será um diretório
Image Title: Neymar fazendo gol de bicicleta
Image Description: Torcedor chorando de emoção
Character: N/A para esporte
Identity: Neymar
Action: Fazendo gol
Sport: Futebol
Main Event: Copa do Mundo
Keyword: Gol de bicicleta
O campo “Image Description” por ser um complemento, não é indexado por vocabulário controlado
Character : Exclusivo do formulário de programas
Sport e Main Event: Exclusivos do formulário de esportes
Image Title: Neymar fazendo gol de bicicleta
Image Description: Torcedor chorando de emoção
Character: N/A para esporte
Identity: Neymar
Action: Fazendo gol
Sport: Futebol
Main Event: Copa do Mundo
Keyword: Gol de bicicleta
O campo “Image Description” por ser um complemento, não é indexado por vocabulário controlado
Character : Exclusivo do formulário de programas
Sport e Main Event: Exclusivos do formulário de esportes
Se eu quiser por exemplo encontrar um gol do fulano dentro de uma partida específica
Estamos aproveitando os momentos de suporte à pesquisa para entender como o usuário está procurando a informação, identificando necessidade de treinamentos, etc, já que ainda não temos relatórios com estas informações.
Os relatórios vão nos ajudar a mapear as tentativas de busca que nem chegam no Arquivo (Desistiram? Encontraram?)
Agilizar a decupagem através de botões com identidades e ações específicas por tipo de conteúdo
Termos candidatos agilizam a marcação com posterior conferência sem necessidade de interromper a atividade e posteriormente retornar ao conteúdo - Citar a complexidade da operação em função do aumento do volume de termos sem o Tesauro
Entender “o que” e “como” o usuário está buscando e se de fato, está encontrando. Baseado no que o usuário está procurando, definir o que é necessário guardar e aonde (cache, LTO, disco, nuvem?)
Aproveitar as inferências da Ontologia para realizar menos marcações manuais