Maîtriser l’Information Multimédia Stéphane Marchand-Maillet Département d‘Informatique Université de Genève

http://viper.unige.ch Contenu Internet, le Web et le Multimédia

Google: Chercher sur internet

Facebook: Réseau social, Web 2.0

Amazon: Acheter sur Internet

Flickr: Partager sur Internet

Discussion

Internet et le Web Internet: réseau d‘ordinateurs interconnectes par le protocole TCP/IP (Transmission Control Protocol/Internet Protocol (V6)

 Réseau „matériel“

WWW: World Wide Web (toile d’araignée mondiale)

Réseau d‘échange de données construit par dessus internet par le protocole HTTP (Hypertext Transfer Protocol)
 Réseau de „données“

Qui est sur Internet mais n‘est pas le Web: E-mail MSN Jeux en réseau FTP (ancien mode de transfert de données) SSH (travailler d‘une machine a l‘autre) … (logiciels d‘Entreprises)

Un bref historique Fin 60‘s: premier réseau par les militaires americains (ARPANET) 80‘s: Popularisation des PC familiaux 82: Standardisation du Protocole TCP/IP 85: Windows 1.0 90‘s: Coûts de stockage reduits (disques durs) 1991: Premieres pages HTTP au CERN 1995: Demarrage de MSN (MS Network) Fin 90‘s: Internet entre dans les foyers 1998: Naissance de Google 2004: Naissance de Facebook … Twitter, Flickr, YouTube,… Mécanique du Web Quelques chiffres Population mondiale connectee: env. 2 milliards Essentiellement via telephones portables (Natel) 1.8 milliards de telephones portables actifs Le traffic Internet a ete multiplie par 20 en 5 ans 180 millions de serveurs Web actifs

En lien avec le réel… Le Multimédia sur le Web Page Web: composition de: Texte (y.c. e-mail, SMS,…) Images Vidéo Musique / Audio (sons, parole,…) PDF, .doc, .xls,…

Mais aussi: Contacts Liste d’amis Playlists …

Encore des chiffres… Taille du Web: Google: Début 2004: 4.3 Milliard de pages indexées Début 2005: 8 Milliard de pages indexées Aujourd‘hui: 20 Milliards de pages? http://www.archive.org Croissance: 20 To/mois

Collections d'images Facebook: 140 milliards de photos 180 ans à 25 images/seconde 140‘000 disques externes, 2 milliards d‘iPad 64Go YouTube (2008): 83.4 millions de videos

Collection multimédia: Institut National de l'Audiovisuel (INA-France): 700’000h d'audio (radio) 400’000h de vidéo (télévision) 2 millions de documents, 80km d'étagères

Operations sur le Web Un-e utilisateur-trice veut:

Web 1.0: le Web des données Stocker des données pour les partager Rechercher des données Acheter des biens …

Web 2.0: le Web social Communiquer Créer un réseau de personnes … Le point de vue de l‘opérateur Web Stocker des données Fournir un accès rapide Fournir un accès fiable

Organiser les données… pour: Les retrouver Les „servir“ Les filtrer (obsolètes, inappropriées,…) En tirer le meilleur parti (publicité,…)

 Comprendre les données Comprendre du texte Texte = mots + ponctuation + structure (titre,…)

Modele: Texte = Sac de Mots (Bag of Words)

On retient du texte les mots (noms, verbes) les plus frequents

Partager des donnees

test/tagcloud.txt · Last modified: 2011/10/10 15:40 by marchand
--

Keywords: machine learning, information geometry, data mining, Big Data, affective information retrieval (recherche d'information), information visualisation, content-based image and video retrieval (CBIR, CBR, CBVR, CBMR, CBMIR), information mining, classification, multimedia and multimodal information management, semantic web, knowledge base (RDF, OWL, XML, metadata, auto-annotation, description), multimodal information fusion