Suchansätze dringen in die Tiefen des Internets
publiziert: Dienstag, 24. Feb 2009 / 14:27 Uhr

New York - Die Google-Suche erfasst inzwischen über eine Billion Webadressen, doch das ist nur ein Bruchteil des gesamten Internets. In Datenbanken liegen gewaltige Informationsmengen von Einkaufskatalogen über Flugpläne bis hin zu wissenschaftlichen Forschungsergebnissen verborgen, die mit aktuellen Methoden kaum erfasst werden können.

Viele Inhalte öffentlicher Datenbanken sind über die normale Suche nicht zu finden.
Viele Inhalte öffentlicher Datenbanken sind über die normale Suche nicht zu finden.
3 Meldungen im Zusammenhang
Weiterführende Links zur Meldung:

Deep Peep
Forschungsprojekt der University of Utah.
www.deeppeep.org

Neue Technologien beginnen nun, diese Tiefen des Internets zu erforschen, um die Qualität der Online-Suche zu verbessern, berichtet die New York Times. Ein Zugang ist dabei, mittels Testanfragen herauszufinden, mit welchen Begriffen Datenbanken ihre Geheimnisse entlockt werden können.

Suchmaschinen setzen zur Indizierung auf Crawler, die Links auf Webseiten folgen und so Informationen sammeln können, bei Datenbanken aber relativ schnell an ihre Grenzen stossen.

Testanfragen

Das wollen Forscher mit neuen Technologien ändern. Das Projekt DeepPeep der University of Utah strebt an, sowohl Durchschnitts-Usern als auch Anwendungsentwicklern besseren Zugang zu den Inhalten öffentlicher Web-Datenbanken zu bieten.

Um diese Quellen zu indizieren setzt man darauf, zunächst mit einigen Begriffen Testanfragen an die Datenbanken zu stellen und die Ergebnisse zu analysieren. «So können wir ein Verständnis der Datenbanken entwickeln und ermitteln, nach welchen Worten wir gezielt suchen sollen», sagt Projektleiterin Juliana Freire. Insgesamt können dann mit gezielten Anfragen mehr als 90 Prozent der Datenbank-Inhalte erfasst werden, so Freire.

Grundprobleme

Ein Grundproblem dabei, die verborgenen Inhalte der vielen Mio. Datenbanken im Web sinnvoll zugänglich zu machen, ist, dass Suchmaschinen wissen müssen, welche Datenbanken am ehesten zu einer Anfrage passende Informationen enthalten. Ausserdem muss klar sein, wie Fragen an die Datenbank gestellt werden müssen, um ihr auch tatsächlich Inhalte zu entlocken.

«Das ist das interessanteste vorstellbare Problem in Sachen Datenintegration», so Alon Halevy, Computerwissenschaftler und Leiter eines Google-Teams, das sich mit dem Problem auseinandersetzt. Googles Zugang zur Datenbank-Indizierung nutzt dabei ein Analyseprogramm. Ähnlich wie DeepPeep setzt man darauf, mithilfe von Testanfragen ein Modell zur Vorhersage von Datenbank-Inhalten zu erstellen.

Wie präsentieren?

Wenn Inhalte aus den Tiefen des Webs in Suchergebnisse integriert werden sollen, stellt sich auch die Frage der Präsentation. Das Start-up Kosmix setzt darauf, eine Art themenspezifische Web-Startseite zu generieren. «Die meisten Suchmaschinen versuchen, die Nadel im Heuhaufen zu finden. Aber wir versuchen dabei zu helfen, den Heuhaufen zu erforschen», sagt Kosmix-Mitgründer Anand Rajaraman.

Eine echte Herausforderung könnte die Integration der zusätzlichen Inhalte in die Ergebnisse der Google-Suche werden. Das Unternehmen hat gröbere Änderungen am Format der Suchergebnisse bislang eher vermieden. «Sie wollen ein besseres Nutzererlebnis schaffen, müssen aber sehr vorsichtig mit Änderungen sein, um nicht die User zu verstimmen», meint Chris Sherman von der Suchmaschinen- und Suchmarketingplattform Search Engine Land.

(fest/pte)

?
Facebook
SMS
SMS
0
Forum
Kommentieren Sie jetzt diese news.ch - Meldung.
Lesen Sie hier mehr zum Thema
Google hat seine Internet-Suche um eine Datenbank mit abgesicherten Fakten, ... mehr lesen
Google ist jetzt mit einer Wissens-Datenbank ausgestattet.
eGadgets Mountain View - Das Internet hat sich ... mehr lesen
Wiener Stephansdom in der Vogelperspektive bei Virtual Earth.
.
Digitaler Strukturwandel  Nach über 16 Jahren hat sich news.ch entschlossen, den Titel in seiner jetzigen Form einzustellen. Damit endet eine Ära medialer Pionierarbeit. mehr lesen 21
-
Publinews Papiliorama  Tauchen Sie ein in die faszinierende Welt der Tiere und Pflanzen: erleben Sie das bunte Ballett der exotischen Schmetterlinge, welche frei um Sie herumfliegen, die bizzaren Kreaturen der Nacht, die Regenbogentukane und einheimischen Schmetterlinge, die Gliederfüsser mit ihren aussergewöhnlichen Formen und die Wollschweine, welche sich als Landschaftsgärtner betätigen. Das Papiliorama in Kerzers nimmt Sie mit auf eine spannende Entdeckungsreise. mehr lesen  
Medizinische Forschung  Bern - Das Inselspital nimmt mit der ... mehr lesen
Das Berner Inselspital stellt die Proben für mehrere Forschungsprojekte und einem grösseren Forscherkreis zur Verfügung.
Zika wird hauptsächlich durch Mückenstiche verbreitet.
Wegen Zika - Acht Wochen nur geschützt  Genf - Touristen sollen nach ihrer Heimreise aus Zika-Gebieten mindestens acht Wochen ... mehr lesen  
Erhöhtes Osteoporose-Risiko  Trondheim - In den letzten Wochen der Schwangerschaft gehört die Weitergabe von Kalzium an den Fötus ... mehr lesen  
Die Knochendichte eines Frühchens ist geringer.
Titel Forum Teaser
 
Stellenmarkt.ch
Kreditrechner
Wunschkredit in CHF
wetter.ch
Heute Di Mi
Zürich -1°C 4°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig freundlich Nebel
Basel 0°C 6°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig freundlich sonnig
St. Gallen 1°C 3°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig Wolkenfelder, kaum Regen sonnig
Bern -3°C 5°C freundlichleicht bewölkt, ueberwiegend sonnig recht sonnig sonnig
Luzern 0°C 5°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig freundlich sonnig
Genf -2°C 7°C recht sonnigleicht bewölkt, ueberwiegend sonnig recht sonnig sonnig
Lugano 4°C 10°C recht sonnigleicht bewölkt, ueberwiegend sonnig sonnig recht sonnig
mehr Wetter von über 8 Millionen Orten