Von Peter Zschunke, 20.07.10, 16:08h
Noll erfasste für seine Formel mehrere Millionen Aktionen bei delicious.com - das Eintragen eines Weblinks und die Ergänzung um bestimmte Tags, also Stichwörter. Zu bestimmten Wissensbereichen wie dem «semantischen Web» erfasste er insgesamt mehr als 100 000 Benutzer. Mit einer Webanwendung registrierte er, welche Anwender welche Webseiten als erste gespeichert haben - und welche Nutzer dann diesem Beispiel folgten.
«Wenn viele Benutzer das gleiche tun, finden wir heraus, wer in einer Community der Experte für verschiedene Wissensbereiche ist», erklärt Noll. Das zusammen mit Professor Christoph Meinel und britischen Kollegen entwickelte Programm liest die Expertise eines Nutzers daran ab, wie hoch die Qualität der von ihm gefundenen und mit Tags erschlossenen Webseiten ist. Die Qualität der Webseiten wird wiederum daran gemessen, wie viele diese als interessant oder hochwertig bezeichnen.
Diesem Verfahren liegt die Erkenntnis zugrunde, dass «ein Experte gute Informationen schneller findet als der durchschnittliche Benutzer». Und «wenn viele Benutzer das gleiche tun, merken wir, dass der erste Nutzer offenbar recht hatte».
Die Software trägt die Bezeichnung SPEAR - als Abkürzung für «Spamming-resistant Expertise Analysis and Ranking» (Spam-resistente Analyse von Bewertung von Expertise). Das Programm erhebt den Anspruch, dass es nur mit großem Aufwand ausgetrickst werden kann, etwa von Spammern - also Personen oder Firmen, die massenhaft unerwünschte Werbemails versenden. Ein Angreifer könne den Algorithmus nur mit viel Mühe aushebeln, erklärt Noll. «Ein Spammer, der kein Experte ist, kann sich kaum an die Spitze des Feldes manipulieren.»
Die Spitze des Feldes, das sind Internet-Nutzer mit dem Expertenwert 1 oder knapp darunter. Wer von der Software mit dem Wert 0 eingestuft wird, hat zumindest in diesem Wissensbereich keine Ahnung. Bei einer SPEAR-Analyse zur Webanwendungssprache JavaScript ergab sich, dass zwei professionelle Software-Entwickler die höchsten Werte erhielten - und dass auf den ersten 200 Plätzen kein einziger Spammer zu finden war.
«Unser Ansatz kann deutlich erweitert werden», sagt Noll, »auch über das Social Web hinaus.» So lässt sich der Algorithmus auch darauf ansetzen, wie oft Wissenschaftler publizieren und ihre Werke wechselseitig zitieren. In einem nächsten Schritt will sich Noll aber zunächst der Twitter-Community zuwenden und Fragen beantworten wie: «Gibt es unter meinen Followern besondere Experten? Welche sind eher irrelevant? Und wer leitet Informationen von mir weiter?
Auf der Grundlage von Projekten wie SPEAR lassen sich viele Szenarien vorstellen, um die Informationsflut im Netz besser kanalisieren zu können. Suchmaschinen für Webseiten und andere Dokumente können das auf Dauer nicht leisten. Wenn Daten aus den Sozialen Netzwerken einbezogen werden, ergeben sich neue Möglichkeiten.
«Im Zeitalter großer Datenmengen und der Informationsflut ist es für jede Plattform, die relevant sein will, von entscheidender Bedeutung, wenn man sich bei der Suche nach Erkenntnissen auf Experten und persönliche Beziehungen verlassen kann», erklärt Vik Singh, der sich auf Fragen zur Zukunft der Internet-Suche spezialisiert hat und bei der US-Investmentfirma Sutter Hill Ventures tätig ist. «SPEAR bietet einen vielversprechenden Ansatz für solche intelligenten Informationssysteme.»
(dpa)| JETZT BESTELLEN! 4 Wochen Rundschau zum Vorzugspreis. Sie sparen mehr als 35%. |
|
Anzeige
![]() |
Mahjongg Fortuna » 2337 Spieler |
![]() |
Zuma » 1507 Spieler |
![]() |
Bookworm » 1263 Spieler |
![]() |
Bubble Shooter » 1038 Spieler |
![]() |
Bejeweled 2 » 956 Spieler |
22. April 2012,
E-Werk Köln