advertisement

tel 00008755

50 %
50 %
advertisement
Information about tel 00008755
Education

Published on January 23, 2008

Author: Vincenza

Source: authorstream.com

advertisement

<?xml version="1.0" encoding="iso-8859-1"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="fr"> <head> <link rel="shortcut icon" href="http://tel.archives-ouvertes.fr/favicon.ico" /> <link rel="Top" href="http://tel.archives-ouvertes.fr/" /> <link rel="Search" href="http://tel.archives-ouvertes.fr/?action_todo=search" /> <link rel="alternate" type="application/rss+xml" title="Canaux RSS" href="http://tel.archives-ouvertes.fr/rss.php" /> <title>TEL :: [tel-00008755, version 1] Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle</title> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> <meta http-equiv="Content-Language" content="fr" /> <meta name="Author" content="CCSD" /> <meta name="Copyright" content="CCSD" /> <meta name="Publisher" content="CCSD" /> <meta name="Generator" content="PHP" /> <meta name="Keywords" content="HAL, open-archive server, OAI" /> <link rel="schema.DC" href="http://purl.org/DC/elements/1.0/" /> <meta name="DC.identifier" content="tel-00008755, version 1" /> <meta name="DC.identifier" content="http://tel.archives-ouvertes.fr/tel-00008755/en/" /> <meta name="DC.title" content="Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle" /> <meta name="DC.creator" content="PINQUIER, Julien" /> <meta name="DC.description" content="Le développement croissant des données numériques et l'explosion des accès multimédia à l'information, sont confrontés au manque d'outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à l'indexation et la structuration de la bande sonore de documents audiovisuels sont proposées. Leurs buts sont de détecter les composantes primaires telles que la parole, la musique et les sons clés (jingles, sons caractéristiques, mots clés...). :  <?xml version="1.0" encoding="iso-8859-1"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="fr"> <head> <link rel="shortcut icon" href="http://tel.archives-ouvertes.fr/favicon.ico" /> <link rel="Top" href="http://tel.archives-ouvertes.fr/" /> <link rel="Search" href="http://tel.archives-ouvertes.fr/?action_todo=search" /> <link rel="alternate" type="application/rss+xml" title="Canaux RSS" href="http://tel.archives-ouvertes.fr/rss.php" /> <title>TEL :: [tel-00008755, version 1] Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle</title> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> <meta http-equiv="Content-Language" content="fr" /> <meta name="Author" content="CCSD" /> <meta name="Copyright" content="CCSD" /> <meta name="Publisher" content="CCSD" /> <meta name="Generator" content="PHP" /> <meta name="Keywords" content="HAL, open-archive server, OAI" /> <link rel="schema.DC" href="http://purl.org/DC/elements/1.0/" /> <meta name="DC.identifier" content="tel-00008755, version 1" /> <meta name="DC.identifier" content="http://tel.archives-ouvertes.fr/tel-00008755/en/" /> <meta name="DC.title" content="Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle" /> <meta name="DC.creator" content="PINQUIER, Julien" /> <meta name="DC.description" content="Le développement croissant des données numériques et l'explosion des accès multimédia à l'information, sont confrontés au manque d'outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à l'indexation et la structuration de la bande sonore de documents audiovisuels sont proposées. Leurs buts sont de détecter les composantes primaires telles que la parole, la musique et les sons clés (jingles, sons caractéristiques, mots clés...). Pour la classification parole/musique, trois paramètres inhabituels sont extraits : la modulation de l'entropie, la durée des segments (issue d'une segmentation automatique) et le nombre de ces segments par seconde. Les informations issues de ces trois paramètres sont ensuite fusionnées avec celle issue de la modulation de l'énergie à quatre hertz. Des expériences sur un corpus radiophonique montrent la robustesse de ces paramètres : notre système possède un taux de classification correcte supérieur à 90%. Le système est ensuite comparé, puis fusionné à un système classique basé sur des Modèles de Mélanges de lois Gaussiennes (MMG) et une analyse cepstrale.:  Pour la classification parole/musique, trois paramètres inhabituels sont extraits : la modulation de l'entropie, la durée des segments (issue d'une segmentation automatique) et le nombre de ces segments par seconde. Les informations issues de ces trois paramètres sont ensuite fusionnées avec celle issue de la modulation de l'énergie à quatre hertz. Des expériences sur un corpus radiophonique montrent la robustesse de ces paramètres : notre système possède un taux de classification correcte supérieur à 90%. Le système est ensuite comparé, puis fusionné à un système classique basé sur des Modèles de Mélanges de lois Gaussiennes (MMG) et une analyse cepstrale. Un autre partitionnement consiste à détecter des sons clés. La sélection de candidats potentiels est effectuée en comparant la « signature » de chacun des jingles au flux de données. Ce système est simple par sa mise en œuvre mais rapide et très efficace : sur un corpus audiovisuel d'une dizaine d'heures (environ 200 jingles) aucune fausse alarme n'est présente. Il y a seulement deux omissions dans des conditions extrêmes. Les sons caractéristiques (applaudissements et rires) sont modélisés à l'aide de MMG dans le domaine spectral. Un corpus télévisuel permet de valider cette première étude par des résultats encourageants. La détection de mots clés est effectuée de manière classique : il ne s'agit pas ici d'améliorer les systèmes existants mais de se placer toujours dans un besoin de structuration. Ainsi, ces mots clés renseignent sur le type des émissions (journal, météo, documentaire...). :  Un autre partitionnement consiste à détecter des sons clés. La sélection de candidats potentiels est effectuée en comparant la « signature » de chacun des jingles au flux de données. Ce système est simple par sa mise en œuvre mais rapide et très efficace : sur un corpus audiovisuel d'une dizaine d'heures (environ 200 jingles) aucune fausse alarme n'est présente. Il y a seulement deux omissions dans des conditions extrêmes. Les sons caractéristiques (applaudissements et rires) sont modélisés à l'aide de MMG dans le domaine spectral. Un corpus télévisuel permet de valider cette première étude par des résultats encourageants. La détection de mots clés est effectuée de manière classique : il ne s'agit pas ici d'améliorer les systèmes existants mais de se placer toujours dans un besoin de structuration. Ainsi, ces mots clés renseignent sur le type des émissions (journal, météo, documentaire...). Grâce à l'extraction de ces composantes primaires, les émissions audiovisuelles peuvent être annotées de manière automatique. Au travers de deux études, une réflexion est conduite quant à l'utilisation de ces composantes afin de trouver une structure temporelle aux documents. La première étude permet une détection d'un motif récurrent dans une collection d'émissions, dites de plateau, alors que la seconde réalise la structuration en thèmes d'un journal télévisé. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont développées et les besoins futurs sont explorés." /> <meta name="DC.date" content="2004-12-20" /> <meta name="DC.relation" content="http://tel.archives-ouvertes.fr/tel-00008755/en/" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/tel.css" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/tel_etape_autlab_v2.css" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/boxover.css" /> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/javascript/utile.js"></script> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/javascript/boxover.js"></script> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/language/js.php?langue=fr"></script> </head> <body> <div class="logo"> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="left" style="position:absolute;left:15px; top:5px" width="50%" nowrap="nowrap"><a href="http://hal.archives-ouvertes.fr/" target="_self""><img border="0" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="45px" height="45px" alt="HAL - hal.archives-ouvertes.fr" title="HAL - hal.archives-ouvertes.fr" /></a></td> <td align="left" style="position:absolute;left:10px; top:110px" width="50%" nowrap="nowrap"><a href="http://www.ccsd.cnrs.fr/" target="_self""><img border="0" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="400px" height="15px" alt="CCSd - Centre pour la Communication Scientifique Direct" title="CCSd - Centre pour la Communication Scientifique Direct" /></a></td> </tr> </table> </div> <div class="onglet" id="halmenu"> <ul class="niveau1"> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=home" target="_self">Accueil</a> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=deposed" target="_self">D&eacute;poser</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=login" target="_self">S'authentifier</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=register" target="_self">S'inscrire</a> </li> </ul> </li> <li class="current"> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=browse" target="_self">Consulter</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_domain" target="_self">Par domaine</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;submit=1&b_type=browse_new" target="_self">Les 30 dernières thèses déposées</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_orgthe" target="_self">Par établissement</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_date" target="_self">Par année de soutenance</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_tampon" target="_self">Par collection</a> </li> </ul> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=search" target="_self">Rechercher</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=simple" target="_self">Recherche simple</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=advanced" target="_self">Recherche avancée</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=byid" target="_self">Accès par identifiant</a> </li> </ul> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=subscribe" target="_self">S'abonner</a> </li> </ul> </div> <div class="tabs"> <a class="action_off" href="http://tel.archives-ouvertes.fr/index.php?action_todo=login&amp;halsid=0df5dabe0b842ea34416162824968190">[s'authentifier]</a> </div> <div class="lien"> <a class="action_off" href="http://tel.archives-ouvertes.fr/index.php?langue=en&amp;halsid=0df5dabe0b842ea34416162824968190" target="_self">[english version]</a> <a class="action_off" href="#" onclick="javascript:nw=window.open('http://www.ccsd.cnrs.fr/spip.php?rubrique14=','Edit','height=900,width=770,location=no,scrollbars=yes,menubars=no,toolbars=no,resizable=yes');nw.opener=self;return false;">[manuel]</a> <a class="action_off" href="#" onclick="javascript:nw=window.open('http://tel.archives-ouvertes.fr/apropos.php?halsid=0df5dabe0b842ea34416162824968190','Edit','height=325,width=500,location=no,scrollbars=yes,menubars=no,toolbars=no,resizable=yes');nw.opener=self;return false;">[à propos]</a> <a class="rss" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&action_todo=rss"><img align="absmiddle" alt="rss feed" src="http://tel.archives-ouvertes.fr/images/rss.gif" border="0" /></a> </div> <div class="corps"> <table width="100%" border="0" cellpadding="2" cellspacing="0"> <tr> <td align="left"><a href="http://tel.archives-ouvertes.fr/index.php?view_this_doc=tel-00008755&extended_view=1&halsid=0df5dabe0b842ea34416162824968190" class="lien_vue" target="_self">Fiche d&eacute;taill&eacute;e</a></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="2" cellspacing="0"> <tr> <td class="meta_refBiblio">Université Paul Sabatier - Toulouse III (20/12/2004), ANDRE-OBRECHT Régine (Dir.)</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td class="nom_meta">Liste des fichiers attachés à ce document&nbsp;:&nbsp;</td> </tr> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="1" height="6" /></td> </tr> <tr> <td class="meta"><table border="0" cellspacing="0" cellpadding="5"> <tr> <td> <img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="0" height="1" /><img alt="" src="http://tel.archives-ouvertes.fr/images/tree/folderopen.gif" border="0" /></td> <td><span class="repertoire">PDF</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="2"> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="25" height="1" /></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/PDF/tel-00008755.pdf&docid=47839" target="_blank"><img alt="" src="http://tel.archives-ouvertes.fr/images/mime/pdf.gif" border="0" /></a></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/PDF/tel-00008755.pdf&docid=47839" target="_blank" class="file_link">tel-00008755.pdf</a><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="5" height="1" /><span class="help">(4.4 MB)</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="5"> <tr> <td> <img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="0" height="1" /><img alt="" src="http://tel.archives-ouvertes.fr/images/tree/folderopen.gif" border="0" /></td> <td><span class="repertoire">ANNEX</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="2"> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="25" height="1" /></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/ANNEX/tel-00008755.ppt&docid=47839" target="_blank"><img alt="" src="http://tel.archives-ouvertes.fr/images/mime/mspowerpoint.gif" border="0" /></a></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/ANNEX/tel-00008755.ppt&docid=47839" target="_blank" class="file_link">tel-00008755.ppt</a><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="5" height="1" /><span class="help">(3.5 MB)</span></td> </tr> </table> </td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" class="meta_title">Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td class="meta_auteur" align="center"><a class="meta_auteur" href="http://tel.archives-ouvertes.fr/index.php?action_todo=search&submit=1&s_type=advanced&f_0=NMAUTHOR&p_0=is_exactly&f_1=PRAUTHOR&p_1=is_exactly&l_0=and&halsid=0df5dabe0b842ea34416162824968190&v_0=PINQUIER&v_1=Julien">Julien&nbsp;PINQUIER</a><sup class="labo_id">1</sup></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center"><hr noshade="noshade" width="60" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> <tr> <td class="meta_abstract">Le développement croissant des données numériques et l'explosion des accès multimédia à l'information, sont confrontés au manque d'outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à l'indexation et la structuration de la bande sonore de documents audiovisuels sont proposées. Leurs buts sont de détecter les composantes primaires telles que la parole, la musique et les sons clés (jingles, sons caractéristiques, mots clés...). :  Grâce à l'extraction de ces composantes primaires, les émissions audiovisuelles peuvent être annotées de manière automatique. Au travers de deux études, une réflexion est conduite quant à l'utilisation de ces composantes afin de trouver une structure temporelle aux documents. La première étude permet une détection d'un motif récurrent dans une collection d'émissions, dites de plateau, alors que la seconde réalise la structuration en thèmes d'un journal télévisé. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont développées et les besoins futurs sont explorés." /> <meta name="DC.date" content="2004-12-20" /> <meta name="DC.relation" content="http://tel.archives-ouvertes.fr/tel-00008755/en/" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/tel.css" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/tel_etape_autlab_v2.css" /> <link rel="stylesheet" type="text/css" href="http://tel.archives-ouvertes.fr/css/boxover.css" /> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/javascript/utile.js"></script> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/javascript/boxover.js"></script> <script type="text/javascript" language="javascript" src="http://tel.archives-ouvertes.fr/language/js.php?langue=fr"></script> </head> <body> <div class="logo"> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="left" style="position:absolute;left:15px; top:5px" width="50%" nowrap="nowrap"><a href="http://hal.archives-ouvertes.fr/" target="_self""><img border="0" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="45px" height="45px" alt="HAL - hal.archives-ouvertes.fr" title="HAL - hal.archives-ouvertes.fr" /></a></td> <td align="left" style="position:absolute;left:10px; top:110px" width="50%" nowrap="nowrap"><a href="http://www.ccsd.cnrs.fr/" target="_self""><img border="0" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="400px" height="15px" alt="CCSd - Centre pour la Communication Scientifique Direct" title="CCSd - Centre pour la Communication Scientifique Direct" /></a></td> </tr> </table> </div> <div class="onglet" id="halmenu"> <ul class="niveau1"> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=home" target="_self">Accueil</a> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=deposed" target="_self">D&eacute;poser</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=login" target="_self">S'authentifier</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=register" target="_self">S'inscrire</a> </li> </ul> </li> <li class="current"> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=browse" target="_self">Consulter</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_domain" target="_self">Par domaine</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;submit=1&b_type=browse_new" target="_self">Les 30 dernières thèses déposées</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_orgthe" target="_self">Par établissement</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_date" target="_self">Par année de soutenance</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=browse&amp;b_type=browse_tampon" target="_self">Par collection</a> </li> </ul> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=menu&amp;to_open=search" target="_self">Rechercher</a> <ul class="niveau2"> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=simple" target="_self">Recherche simple</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=advanced" target="_self">Recherche avancée</a> </li> <li> <a href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=search&amp;s_type=byid" target="_self">Accès par identifiant</a> </li> </ul> </li> <li> <a class="niveau1" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&amp;action_todo=subscribe" target="_self">S'abonner</a> </li> </ul> </div> <div class="tabs"> <a class="action_off" href="http://tel.archives-ouvertes.fr/index.php?action_todo=login&amp;halsid=0df5dabe0b842ea34416162824968190">[s'authentifier]</a> </div> <div class="lien"> <a class="action_off" href="http://tel.archives-ouvertes.fr/index.php?langue=en&amp;halsid=0df5dabe0b842ea34416162824968190" target="_self">[english version]</a> <a class="action_off" href="#" onclick="javascript:nw=window.open('http://www.ccsd.cnrs.fr/spip.php?rubrique14=','Edit','height=900,width=770,location=no,scrollbars=yes,menubars=no,toolbars=no,resizable=yes');nw.opener=self;return false;">[manuel]</a> <a class="action_off" href="#" onclick="javascript:nw=window.open('http://tel.archives-ouvertes.fr/apropos.php?halsid=0df5dabe0b842ea34416162824968190','Edit','height=325,width=500,location=no,scrollbars=yes,menubars=no,toolbars=no,resizable=yes');nw.opener=self;return false;">[à propos]</a> <a class="rss" href="http://tel.archives-ouvertes.fr/index.php?halsid=0df5dabe0b842ea34416162824968190&action_todo=rss"><img align="absmiddle" alt="rss feed" src="http://tel.archives-ouvertes.fr/images/rss.gif" border="0" /></a> </div> <div class="corps"> <table width="100%" border="0" cellpadding="2" cellspacing="0"> <tr> <td align="left"><a href="http://tel.archives-ouvertes.fr/index.php?view_this_doc=tel-00008755&extended_view=1&halsid=0df5dabe0b842ea34416162824968190" class="lien_vue" target="_self">Fiche d&eacute;taill&eacute;e</a></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="2" cellspacing="0"> <tr> <td class="meta_refBiblio">Université Paul Sabatier - Toulouse III (20/12/2004), ANDRE-OBRECHT Régine (Dir.)</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td class="nom_meta">Liste des fichiers attachés à ce document&nbsp;:&nbsp;</td> </tr> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="1" height="6" /></td> </tr> <tr> <td class="meta"><table border="0" cellspacing="0" cellpadding="5"> <tr> <td> <img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="0" height="1" /><img alt="" src="http://tel.archives-ouvertes.fr/images/tree/folderopen.gif" border="0" /></td> <td><span class="repertoire">PDF</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="2"> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="25" height="1" /></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/PDF/tel-00008755.pdf&docid=47839" target="_blank"><img alt="" src="http://tel.archives-ouvertes.fr/images/mime/pdf.gif" border="0" /></a></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/PDF/tel-00008755.pdf&docid=47839" target="_blank" class="file_link">tel-00008755.pdf</a><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="5" height="1" /><span class="help">(4.4 MB)</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="5"> <tr> <td> <img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="0" height="1" /><img alt="" src="http://tel.archives-ouvertes.fr/images/tree/folderopen.gif" border="0" /></td> <td><span class="repertoire">ANNEX</span></td> </tr> </table> <table border="0" cellspacing="0" cellpadding="2"> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="25" height="1" /></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/ANNEX/tel-00008755.ppt&docid=47839" target="_blank"><img alt="" src="http://tel.archives-ouvertes.fr/images/mime/mspowerpoint.gif" border="0" /></a></td> <td><a href="http://tel.archives-ouvertes.fr/action/open_file.php?url=http://tel.archives-ouvertes.fr/docs/00/04/78/39/ANNEX/tel-00008755.ppt&docid=47839" target="_blank" class="file_link">tel-00008755.ppt</a><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" border="0" width="5" height="1" /><span class="help">(3.5 MB)</span></td> </tr> </table> </td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" class="meta_title">Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td class="meta_auteur" align="center"><a class="meta_auteur" href="http://tel.archives-ouvertes.fr/index.php?action_todo=search&submit=1&s_type=advanced&f_0=NMAUTHOR&p_0=is_exactly&f_1=PRAUTHOR&p_1=is_exactly&l_0=and&halsid=0df5dabe0b842ea34416162824968190&v_0=PINQUIER&v_1=Julien">Julien&nbsp;PINQUIER</a><sup class="labo_id">1</sup></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table width="100%" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center"><hr noshade="noshade" width="60" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> <tr> <td class="meta_abstract">Le développement croissant des données numériques et l'explosion des accès multimédia à l'information, sont confrontés au manque d'outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à l'indexation et la structuration de la bande sonore de documents audiovisuels sont proposées. Leurs buts sont de détecter les composantes primaires telles que la parole, la musique et les sons clés (jingles, sons caractéristiques, mots clés...). Pour la classification parole/musique, trois paramètres inhabituels sont extraits : la modulation de l'entropie, la durée des segments (issue d'une segmentation automatique) et le nombre de ces segments par seconde. Les informations issues de ces trois paramètres sont ensuite fusionnées avec celle issue de la modulation de l'énergie à quatre hertz. Des expériences sur un corpus radiophonique montrent la robustesse de ces paramètres : notre système possède un taux de classification correcte supérieur à 90%. Le système est ensuite comparé, puis fusionné à un système classique basé sur des Modèles de Mélanges de lois Gaussiennes (MMG) et une analyse cepstrale.:  Pour la classification parole/musique, trois paramètres inhabituels sont extraits : la modulation de l'entropie, la durée des segments (issue d'une segmentation automatique) et le nombre de ces segments par seconde. Les informations issues de ces trois paramètres sont ensuite fusionnées avec celle issue de la modulation de l'énergie à quatre hertz. Des expériences sur un corpus radiophonique montrent la robustesse de ces paramètres : notre système possède un taux de classification correcte supérieur à 90%. Le système est ensuite comparé, puis fusionné à un système classique basé sur des Modèles de Mélanges de lois Gaussiennes (MMG) et une analyse cepstrale. Un autre partitionnement consiste à détecter des sons clés. La sélection de candidats potentiels est effectuée en comparant la « signature » de chacun des jingles au flux de données. Ce système est simple par sa mise en œuvre mais rapide et très efficace : sur un corpus audiovisuel d'une dizaine d'heures (environ 200 jingles) aucune fausse alarme n'est présente. Il y a seulement deux omissions dans des conditions extrêmes. Les sons caractéristiques (applaudissements et rires) sont modélisés à l'aide de MMG dans le domaine spectral. Un corpus télévisuel permet de valider cette première étude par des résultats encourageants. La détection de mots clés est effectuée de manière classique : il ne s'agit pas ici d'améliorer les systèmes existants mais de se placer toujours dans un besoin de structuration. Ainsi, ces mots clés renseignent sur le type des émissions (journal, météo, documentaire...). :  Un autre partitionnement consiste à détecter des sons clés. La sélection de candidats potentiels est effectuée en comparant la « signature » de chacun des jingles au flux de données. Ce système est simple par sa mise en œuvre mais rapide et très efficace : sur un corpus audiovisuel d'une dizaine d'heures (environ 200 jingles) aucune fausse alarme n'est présente. Il y a seulement deux omissions dans des conditions extrêmes. Les sons caractéristiques (applaudissements et rires) sont modélisés à l'aide de MMG dans le domaine spectral. Un corpus télévisuel permet de valider cette première étude par des résultats encourageants. La détection de mots clés est effectuée de manière classique : il ne s'agit pas ici d'améliorer les systèmes existants mais de se placer toujours dans un besoin de structuration. Ainsi, ces mots clés renseignent sur le type des émissions (journal, météo, documentaire...). Grâce à l'extraction de ces composantes primaires, les émissions audiovisuelles peuvent être annotées de manière automatique. Au travers de deux études, une réflexion est conduite quant à l'utilisation de ces composantes afin de trouver une structure temporelle aux documents. La première étude permet une détection d'un motif récurrent dans une collection d'émissions, dites de plateau, alors que la seconde réalise la structuration en thèmes d'un journal télévisé. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont développées et les besoins futurs sont explorés.</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table width="100" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" style="font-size:1px;" height="1" bgcolor="#f9f4e8"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td width="20" nowrap="nowrap"><span class="labo_id">1&nbsp;:&nbsp;</span></td> <td class="meta_labo"><a class="meta_labo" href="http://tel.archives-ouvertes.fr/index.php?action_todo=search&submit=1&s_type=advanced&p_0=contained&f_0=LAB&l_0=or&p_1=contained&f_1=LAB&f_2=NMAUTHOR&halsid=0df5dabe0b842ea34416162824968190&v_0=&v_1=IRIT">IRIT</a></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table width="100" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" style="font-size:1px;" height="1" bgcolor="#f9f4e8"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="5" cellspacing="0"> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">mots-clés&nbsp;:&nbsp;</span>indexation sonore &ndash; structuration audiovisuelle &ndash; classification &ndash; énergie &ndash; entropie &ndash; segmentation &ndash; parole &ndash; musique &ndash; jingles &ndash; sons clés &ndash; applaudissements &ndash; rires &ndash; mots clés &ndash; thèmes</td> </tr> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">autres localisations&nbsp;:&nbsp;</span><a target="_blank" href="http://julien.pinquier.free.fr/These/these_pinquier.pdf" class="meta">http://julien.pinquier.free.fr/These/these_pinquier.pdf</a></td> </tr> <tr> <td><hr noshade="noshade" width="100%" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td class="meta_title">Audio classification: search of primary components for audiovisual structuring</td> </tr> <tr> <td class="meta_abstract">To process the quantity of audiovisual information available in a smart and rapid way, it is necessary to have robust and automatic tools. This work addresses the soundtrack indexing and structuring of multimedia documents. Their goals are to detect the primary components: speech, music and key sounds. For speech/music classification, three unusual parameters are extracted: entropy modulation, stationary segment duration (with a Forward-Backward Divergence algorithm) and the number of segments. These three parameters are merged with the classical 4 Hertz modulation energy. Experiments on radio corpora show the robustness of these parameters. The system is compared and merged with a classical system. Another partitioning consists in detecting pertinent key sounds. For jingles, the selection of candidates is done by comparing the “signature” of each jingle with the data flow. This system is simple, fast and efficient. Applause and laughter are based on GMM with spectral analysis. A TV corpus validates this study by encouraging results. The detection of key words is carried out in a traditional way: the problem here is not to improve the existing systems but to be in a structuring task: these key words inform about the program type (news, weather, documentary…). Through two studies, a reflection is done for the component uses in order to find a temporal structure of the audiovisual documents. The first study is a detection of a recurring production invariant in program collections. The second permits to structure TV news into topics. Some examples of video analysis contribution are developed.</td> </tr> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">mots-clés en anglais&nbsp;:&nbsp;</span>audio indexing &ndash; audiovisual structuring &ndash; classification &ndash; energy &ndash; entropy &ndash; segmentation &ndash; speech &ndash; music &ndash; jingles &ndash; key sounds &ndash; key words &ndash; applause &ndash; laughter</td> </tr> </table> <table width="100%" border="0" cellpadding="2" cellspacing="0"> <tr> <td align="center"><hr noshade="noshade" width="100%" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td align="left" class="small_metadata">tel-00008755, version 1</td> </tr> <tr> <td align="left" class="small_metadata"><a class="small_metadata" href="http://tel.archives-ouvertes.fr/tel-00008755/fr/">http://tel.archives-ouvertes.fr/tel-00008755/fr/</a></td> </tr> <tr> <td align="left" class="small_metadata">oai:tel.archives-ouvertes.fr:tel-00008755_v1</td> </tr> <tr> <td colspan="2" align="left" class="small_metadata">Contributeur&nbsp;:&nbsp;<a href="#" class="small_metadata" onclick="javascript:nw=window.open('http://tel.archives-ouvertes.fr/action/user_view.php?uid=pinquier&halsid=0df5dabe0b842ea34416162824968190','Edit','height=250,width=400,location=no,scrollbars=yes,menubars=no,toolbars=no,resizable=yes');nw.opener=self;return false;">Julien PINQUIER</a><span class="small_metadata">&nbsp;&lt;</span><script type="text/javascript" language="javascript">str_unrot('<a class="small_metadata" href="', 'JxFIQL:MFKNRFBOuFOFQvCO', '">');</script><script type="text/javascript" language="javascript">str_unrot('','FyDGKyuHnyHyJovH','');</script></a><span class="small_metadata">&gt;</span></td> </tr> <tr> <td colspan="2" class="small_metadata_italic" align="left"> Vendredi 11 Mars 2005, 11:55:58</td> </tr> </table> </div> <div style="display:none;"><a href="http://tel.archives-ouvertes.fr/article_tel.html">tous les articles de la base du CCSd...</a></div> </body> </html> :  Grâce à l'extraction de ces composantes primaires, les émissions audiovisuelles peuvent être annotées de manière automatique. Au travers de deux études, une réflexion est conduite quant à l'utilisation de ces composantes afin de trouver une structure temporelle aux documents. La première étude permet une détection d'un motif récurrent dans une collection d'émissions, dites de plateau, alors que la seconde réalise la structuration en thèmes d'un journal télévisé. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont développées et les besoins futurs sont explorés.</td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="5" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table width="100" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" style="font-size:1px;" height="1" bgcolor="#f9f4e8"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td width="20" nowrap="nowrap"><span class="labo_id">1&nbsp;:&nbsp;</span></td> <td class="meta_labo"><a class="meta_labo" href="http://tel.archives-ouvertes.fr/index.php?action_todo=search&submit=1&s_type=advanced&p_0=contained&f_0=LAB&l_0=or&p_1=contained&f_1=LAB&f_2=NMAUTHOR&halsid=0df5dabe0b842ea34416162824968190&v_0=&v_1=IRIT">IRIT</a></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table width="100" border="0" cellpadding="0" cellspacing="0"> <tr> <td align="center" style="font-size:1px;" height="1" bgcolor="#f9f4e8"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="1" border="0" /></td> </tr> </table> <table border="0" cellpadding="0" cellspacing="0"> <tr> <td style="font-size:1px;"><img alt="" src="http://tel.archives-ouvertes.fr/images/vide.gif" width="1" height="10" border="0" /></td> </tr> </table> <table border="0" cellpadding="5" cellspacing="0"> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">mots-clés&nbsp;:&nbsp;</span>indexation sonore &ndash; structuration audiovisuelle &ndash; classification &ndash; énergie &ndash; entropie &ndash; segmentation &ndash; parole &ndash; musique &ndash; jingles &ndash; sons clés &ndash; applaudissements &ndash; rires &ndash; mots clés &ndash; thèmes</td> </tr> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">autres localisations&nbsp;:&nbsp;</span><a target="_blank" href="http://julien.pinquier.free.fr/These/these_pinquier.pdf" class="meta">http://julien.pinquier.free.fr/These/these_pinquier.pdf</a></td> </tr> <tr> <td><hr noshade="noshade" width="100%" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td class="meta_title">Audio classification: search of primary components for audiovisual structuring</td> </tr> <tr> <td class="meta_abstract">To process the quantity of audiovisual information available in a smart and rapid way, it is necessary to have robust and automatic tools. This work addresses the soundtrack indexing and structuring of multimedia documents. Their goals are to detect the primary components: speech, music and key sounds. For speech/music classification, three unusual parameters are extracted: entropy modulation, stationary segment duration (with a Forward-Backward Divergence algorithm) and the number of segments. These three parameters are merged with the classical 4 Hertz modulation energy. Experiments on radio corpora show the robustness of these parameters. The system is compared and merged with a classical system. Another partitioning consists in detecting pertinent key sounds. For jingles, the selection of candidates is done by comparing the “signature” of each jingle with the data flow. This system is simple, fast and efficient. Applause and laughter are based on GMM with spectral analysis. A TV corpus validates this study by encouraging results. The detection of key words is carried out in a traditional way: the problem here is not to improve the existing systems but to be in a structuring task: these key words inform about the program type (news, weather, documentary…). Through two studies, a reflection is done for the component uses in order to find a temporal structure of the audiovisual documents. The first study is a detection of a recurring production invariant in program collections. The second permits to structure TV news into topics. Some examples of video analysis contribution are developed.</td> </tr> <tr> <td class="meta"><span class="small_metadata" style="vertical-align: top;">mots-clés en anglais&nbsp;:&nbsp;</span>audio indexing &ndash; audiovisual structuring &ndash; classification &ndash; energy &ndash; entropy &ndash; segmentation &ndash; speech &ndash; music &ndash; jingles &ndash; key sounds &ndash; key words &ndash; applause &ndash; laughter</td> </tr> </table> <table width="100%" border="0" cellpadding="2" cellspacing="0"> <tr> <td align="center"><hr noshade="noshade" width="100%" size="1px" color="#f9f4e8" /></td> </tr> <tr> <td align="left" class="small_metadata">tel-00008755, version 1</td> </tr> <tr> <td align="left" class="small_metadata"><a class="small_metadata" href="http://tel.archives-ouvertes.fr/tel-00008755/fr/">http://tel.archives-ouvertes.fr/tel-00008755/fr/</a></td

Add a comment

Related presentations

Related pages

Eastern Nights Cafe | Tel - +971 2 6450399, Abu Dhabi ...

Get complete information of Eastern Nights Cafewith tel- +971 2 6450399, , Abu Dhabi at Yellowpages.ae.
Read more

Nissan Caravan Van For Sale In Sri Lanka - Ad ID ...

1996 Nissan Caravan Van For Sale. Click on the below photos for Large View. Maker: Nissan: ... Rs. 49000000/= Tel : 0778454159. Caravan Van For Sale Price
Read more

For personal use only

{00008755.DOC}BT Investment Management Limited ABN 28 126 385 822 GPO Box 7072 Sydney NSW 200 Australia The Chifley Tower ... Tel 612 8253 2999
Read more

Synthesis, structure, and metathesis activity of ruthenium ...

A series of ruthenium benzylidene complexes containing diphosphines (xantphos, dppf, Cy2P(CH2)nPCy2 (n=5, 8)) ... Tel.: +31-20-5256490; fax: +31-20-5256456.
Read more

BOSCH 0204104238 - SET PER RIPARAZIONI

00008755: Descrizione: SET PER RIPARAZIONI: ... Tel. +39 095 41 90 00 6 fax. +39 095 750 37 26 P. IVA: 03176280877 Sito web ottimizzato per Firefox e Chrome.
Read more

Canadian Food Inspection Agency - Sunjiraho

Tel: 519-631-6241: Application Date: 2012-03-21 Application Number: 12-7564 Grant of Rights Date: 2015-06-30 Certificate Number ...
Read more

www.belex.rs

tel: 381 11 220 55 00. fax: 381 11 311 02 17. Na osnovu člana 67. stav 2. Zakona o tržištu hartija od vrednosti i drugih finansijskih instrumenata (»Sl ...
Read more

ASSESSING OF THE OVERALL QUALITY OF GNSS DETERMINATIONS ...

Tel. +359-896-77-87-32 . Fax + N/A . e-mail: geozemia@geozemia.com . ... 0.00008755 . 0.00020572 : Qzz . 0.00000696 . 0.00010696 . 0.00020298 : 0.00049981 ...
Read more

Antiqued Leatherette Bench And Pair Of Ottoman Trunks Set

Tel: 01626 821111 Free Parking at ... PID: 07-00008755-1. Trago Mills. We're the South West's original discount retailer and with 3 stores and thousands of ...
Read more