14 WebSuche Ranking IV

50 %
50 %
Information about 14 WebSuche Ranking IV
Entertainment

Published on October 19, 2007

Author: Marigold

Source: authorstream.com

Web-Suche – Ranking IV: Hilltop:  Web-Suche – Ranking IV: Hilltop Einführung:  Einführung PageRank und HITS: Gleiche Ausgangslage: Suche im WWW, basierend auf Relevanz Qualität, Wichtigkeit, Autorität, ... Letzteres wird über die Linkstruktur bestimmt Beim PageRank: „global“ und unabhängig von einer Anfrage Bei HITS: „lokal“ in einem Subgraphen, der relevante Dokumente enthält Beiden gemein: Link alleine sagt nicht genug aus, sondern man braucht auch Info über die Art und Zuverlässigkeit der Quelle PageRank: Wichtigkeit oder Qualität der Quelle über rekursive Beziehung HITS: Unterscheidung in Hubs und Authorities Jetzt: Hilltop (siehe Bharat, Mihaila „When Experts Agree: Using Non-Affiliated Experts to Rank Popular Topics“, ACM Transactions on Information Systems, Vol. 20, No. 1, Jan. 2002) Hilltop: „Experts“:  Hilltop: „Experts“ Beobachtung: Viele Web-User Legen Seiten mit Link-Listen zu bestimmten Themen an, mit denen sie sich gut auskennen (Experten) Pflegen diese Listen oft sehr gut Verweisen auf gute, hochqualitative Seiten Idee: Versuche, diese Seiten automatisch zu finden und die Empfehlung, die sich durch die Verlinkung ausdrückt, für das Ranking auszunutzen Bem.: Ähnlich Hubs bei HITS, aber explizitere Beschreibung und global „Definition“: Eine Experten-Seite ist eine Seite über ein bestimmtes Thema mit vielen Links zu zueinander nicht in Beziehung stehenden Seiten über dieses Thema „zu einander in Beziehung stehen“ soll im folgenden bedeuten „nicht von Autoren der gleichen Organisation“ „viele Links“ lässt sich z.B. durch Einführung eines Schwellwerts modellieren Hilltop: „Authorities“:  Hilltop: „Authorities“ Bei der Suche interessiert man sich insbes. für die Authorities eines bestimmten Themas Beim Hilltop-Algorithmus geht man davon aus, dass eine Seite eine Authority für das durch die Anfrage spezifizierte Thema ist gdw. einige der besten Experten zu diesem Thema auf sie verweisen. Hilltop: Allgemeiner Ablauf Ablauf beim Hilltop-Algorithmus daher in 2 Stufen: Auswahl der Experten für ein bestimmtes Thema (abhängig von der Anfrage) Nutze diese zur Bestimmung u. zum Ranking der Authorities Vorher: Identifikation von Experten-Seiten (unabhängig von einer Anfrage) Identifikation von Experten (themen-unabhängig):  Identifikation von Experten (themen-unabhängig) „Definition“: Eine Experten-Seite ist eine Seite über ein bestimmtes Thema mit vielen Links zu zueinander nicht in Beziehung stehenden Seiten über dieses Thema Frage: Was zeichnet gute Experten aus und wie findet man sie? Ein Experte muss objektiv, facettenreich und unbefangen sein zu nicht-zusammengehörigen Seiten eines Themas verweisen Wir definieren Seiten als zusammengehörig, wenn die ersten 3 Achtbitzeichen Ihrer IP-Adressen übereinstimmen oder das letzte, nicht-generische Token des Host-Namens übereinstimmt Identifikation von Experten (themen-unabhängig):  Identifikation von Experten (themen-unabhängig) Damit: Unterteilung des WWW in zusammengehörende Gruppen von Web-Seiten Jetzt: Bestimmung der Experten durch Einführung eines Schwellwerts, d.h. Anzahl der Links auf unterschiedliche Gruppen, die eine Seite mindestens haben muss, um als Experte zu gelten (Bem.: Bis jetzt alles themenunabhängig!) Mögliche Erweiterungen: Berücksichtigung einer thematischen Einteilung (falls vorhanden) Berücksichtigung spezieller Eigenschaften einzelner Seiten (z.B. Gleichmäßigkeit in der Formatierung, etc.) Indizierung der Experten:  Indizierung der Experten Bestimmung der Experten: offline und themenunabhängig Auswahl der jeweils für eine Anfrage relevanten Experten: online und themenabhängig Deshalb: Indizierung der Experten, d.h. Inverted File für die Experten-Seiten Welcher Text? Nur die sog. „Key Phrases“, d.h. Worte im Titel, in Überschriften („<hi> tags“), im Ankertext einer URL Zuordnung von Phrasen zu den jeweiligen URLs Beispiel: Anfrageverarbeitung: Bestimmung u. Ranking von Authorities:  Anfrageverarbeitung: Bestimmung u. Ranking von Authorities Die Suche erfolgt in zwei Schritten Auswahl und Bewertung der Experten für die Anfrage Auswahl und Bewertung der Authorities, auf die die Experten verweisen Zu 1. Auswahl und Bewertung der Experten Auswahl (z.B.) wenn alle Anfrageworte qi mind. einer URL zugeordnet wurden Bewertung durch Berechnung eines „Expert Score“ eines Experten p Dazu definieren wir LevelScore(p) = Bewertung des Typs der entsprechenden Key Phrase (z.B. title  16, heading  6, anchor  1) FullnessFactor(p,q) = Maß für die Anzahl Term in p die in q enthalten sind IF m  2 THEN FullnessFactor(p,q) = 1 ELSE FullnessFactor(p,q) = 1- (m-2)/plen (m = Anz. Terme in p und nicht in q, plen = Länge von p) Anfrageverarbeitung: Bestimmung u. Ranking von Authorities:  Anfrageverarbeitung: Bestimmung u. Ranking von Authorities Zu 1. Auswahl und Bewertung der Experten (Forts.) Mit dem LevelScore und dem FullnessFactor berechnen sich einzelne Maßzahlen Si wie folgt: Si = key phrases p with k-i query terms LevelScore(p) X FullnessFactor(p,q) Womit sich schließlich der Expert_Score wie folgt definiert: Expert_Score = 232S0 + 216S1 + S2  Anfrageverarbeitung: Bestimmung u. Ranking von Authorities:  Anfrageverarbeitung: Bestimmung u. Ranking von Authorities Zu 2. Auswahl und Bewertung der Authorities: Auswahl von Targets = Seiten, auf die mind. zwei der zuvor ausgewählten Experten verweisen Bewertung durch Berechnung eines Target_Score in drei Schritten: Berechnung eines Edge_Score(E,T) für jede Kante (Link) von einem Experten zu der betreffenden Target-Seite gemäß Edge_Score(E,T) = Expert_Score(E) * Anfrageworte w occ(w,T) mit occ(w,T) = Anz. unterschiedlicher Key Phrases für T, die w enthalten Prüfe alle Experten, die auf das gleiche Target zeigen und entferne bei zusammengehörigen Experten alle Kanten außer der mit dem höchsten Edge_Score Berechne den Target_Score als Summe der verbleibenden Edge_Scores Mögliche Erweiterung: Kombination des Target_Score mit einem seitenabhängigen Match_Score (abh. vom Vorkommen der Anfrageterme auf der Target-Seite) Hilltop – Zusammenfassung und Diskussion:  Hilltop – Zusammenfassung und Diskussion Zusammenfassung Hilltop: Vorverarbeitung: Unterteilung des indizierten Teils des WWW in Zusammenhängende Seiten Experten Suche: Auswahl (aufgrund der Anfrage) und Bewertung von Experten, die auf Seiten des betreffenden Themas verweisen Authorities für die betreffende Anfrage Eigenschaften: Themenabhängig, d.h. Berücksichtigung der Anfrage ( PageRank) Vorab-Bestimmung der Experten, d.h. Alle Experten werden berücksichtigt ( Subgraph bei HITS) Eine effizientere Berechnung ist möglich ( HITS) Die Seitenstruktur und die entsprechenden Inhalte werden berücksichtigt The Evolution of Search Engines:  The Evolution of Search Engines Quelle: Tutorial on Search from the Web to the Enterprise (ACM SIGIR 2002) 2nd Generation: Use off-page, web-specific data Link (or connectivity) analysis Click-through data (What results people click on) Anchor-text (How people refer to a page) From 1998 (made popular by Google but everyone now) 1st Generation: Use only „on page“, text data Word frequency, language 1995 – 1997 (AltaVista, Excite, Lycos, etc.)

Add a comment

Related presentations

Related pages

Angebotsreichweite Ranking mf2014-IV Woche

CHIP (APPs und MEW) 14 4,3 1,47 Kicker (APPs und MEW) 15 4,3 1,46 DIE WELT ... Angebotsreichweite_Ranking_mf2014-IV_Woche.xlsx Author: Katharina.Boehm
Read more

Assassin's Creed IV: Black Flag - Wikipedia, the free ...

Assassin's Creed IV: Black Flag (Original Game Soundtrack) was composed by American composer Brian Tyler, who also composed the soundtrack of the previous ...
Read more

Individual values - Bulbapedia, the community-driven ...

Individual values (Japanese: ... Its Attack IV is 2, 3, 6, 7, 10, 11, 14, or 15. Except when IVs are influenced due to breeding, ...
Read more

Grand Theft Auto IV – Wikipedia

Grand Theft Auto IV (kurz GTA IV bzw. GTA 4) ist das neunte Spiel der Grand-Theft-Auto-Reihe. Das Spiel wurde vom schottischen Hersteller Rockstar North ...
Read more

ITF Tennis - SENIORS - Player Rankings

Rankings for Singles, Doubles and Mixed Doubles will be published weekly in 2016 and the 11 April rankings are available in printable format below ...
Read more

Street Fighter IV - Wikipedia, the free encyclopedia

Street Fighter IV (ストリートファイター IV, Sutorīto Faitā Fō?) is a 2008 fighting video game published by Capcom, who also co-developed the ...
Read more

Ranking of Senior IV Standard

Ranking of Senior IV Standard . The following results are from the WDSF Open taken place in Lasko - Slovenia on 14 June 2015 . Ranking Final
Read more

Fighting Games World Rankings

Fighting Games World Rankings rank.shoryuken.com ... The SF5 ranking is still early, tournaments will be weighted correctly over time; Street Fighter 5 Top 10.
Read more

Polity IV Project: Country Reports 2010

Polity IV Project: Political Regime Characteristics and Transitions, 1800-2013 Monty G. Marshall, Director Monty G. Marshall, Principal Investigator
Read more

SV Ottensen II - Mulsum/Kut. IV - FuPa

21 14 auf FuPa.tv. SV Ottensen II ... -9' Highlight FC Mulsum/Kutenholz IV -9. 59. ... Liveticker-Ranking; Informationen. Regelwerk;
Read more