Suchansätze dringen in die Tiefen des Internets

publiziert: Dienstag, 24. Feb 2009 / 14:27 Uhr

New York - Die Google-Suche erfasst inzwischen über eine Billion Webadressen, doch das ist nur ein Bruchteil des gesamten Internets. In Datenbanken liegen gewaltige Informationsmengen von Einkaufskatalogen über Flugpläne bis hin zu wissenschaftlichen Forschungsergebnissen verborgen, die mit aktuellen Methoden kaum erfasst werden können.

Viele Inhalte öffentlicher Datenbanken sind über die normale Suche nicht zu finden.
Viele Inhalte öffentlicher Datenbanken sind über die normale Suche nicht zu finden.
3 Meldungen im Zusammenhang
Weiterführende Links zur Meldung:

Deep Peep
Forschungsprojekt der University of Utah.
www.deeppeep.org

Neue Technologien beginnen nun, diese Tiefen des Internets zu erforschen, um die Qualität der Online-Suche zu verbessern, berichtet die New York Times. Ein Zugang ist dabei, mittels Testanfragen herauszufinden, mit welchen Begriffen Datenbanken ihre Geheimnisse entlockt werden können.

Suchmaschinen setzen zur Indizierung auf Crawler, die Links auf Webseiten folgen und so Informationen sammeln können, bei Datenbanken aber relativ schnell an ihre Grenzen stossen.

Testanfragen

Das wollen Forscher mit neuen Technologien ändern. Das Projekt DeepPeep der University of Utah strebt an, sowohl Durchschnitts-Usern als auch Anwendungsentwicklern besseren Zugang zu den Inhalten öffentlicher Web-Datenbanken zu bieten.

Um diese Quellen zu indizieren setzt man darauf, zunächst mit einigen Begriffen Testanfragen an die Datenbanken zu stellen und die Ergebnisse zu analysieren. «So können wir ein Verständnis der Datenbanken entwickeln und ermitteln, nach welchen Worten wir gezielt suchen sollen», sagt Projektleiterin Juliana Freire. Insgesamt können dann mit gezielten Anfragen mehr als 90 Prozent der Datenbank-Inhalte erfasst werden, so Freire.

Grundprobleme

Ein Grundproblem dabei, die verborgenen Inhalte der vielen Mio. Datenbanken im Web sinnvoll zugänglich zu machen, ist, dass Suchmaschinen wissen müssen, welche Datenbanken am ehesten zu einer Anfrage passende Informationen enthalten. Ausserdem muss klar sein, wie Fragen an die Datenbank gestellt werden müssen, um ihr auch tatsächlich Inhalte zu entlocken.

«Das ist das interessanteste vorstellbare Problem in Sachen Datenintegration», so Alon Halevy, Computerwissenschaftler und Leiter eines Google-Teams, das sich mit dem Problem auseinandersetzt. Googles Zugang zur Datenbank-Indizierung nutzt dabei ein Analyseprogramm. Ähnlich wie DeepPeep setzt man darauf, mithilfe von Testanfragen ein Modell zur Vorhersage von Datenbank-Inhalten zu erstellen.

Wie präsentieren?

Wenn Inhalte aus den Tiefen des Webs in Suchergebnisse integriert werden sollen, stellt sich auch die Frage der Präsentation. Das Start-up Kosmix setzt darauf, eine Art themenspezifische Web-Startseite zu generieren. «Die meisten Suchmaschinen versuchen, die Nadel im Heuhaufen zu finden. Aber wir versuchen dabei zu helfen, den Heuhaufen zu erforschen», sagt Kosmix-Mitgründer Anand Rajaraman.

Eine echte Herausforderung könnte die Integration der zusätzlichen Inhalte in die Ergebnisse der Google-Suche werden. Das Unternehmen hat gröbere Änderungen am Format der Suchergebnisse bislang eher vermieden. «Sie wollen ein besseres Nutzererlebnis schaffen, müssen aber sehr vorsichtig mit Änderungen sein, um nicht die User zu verstimmen», meint Chris Sherman von der Suchmaschinen- und Suchmarketingplattform Search Engine Land.

(fest/pte)

Kommentieren Sie jetzt diese news.ch - Meldung.
Lesen Sie hier mehr zum Thema
Google hat seine Internet-Suche um eine Datenbank mit abgesicherten Fakten, ... mehr lesen
Google ist jetzt mit einer Wissens-Datenbank ausgestattet.
eGadgets Mountain View - Das Internet hat sich ... mehr lesen
Wiener Stephansdom in der Vogelperspektive bei Virtual Earth.
.
Digitaler Strukturwandel  Nach über 16 Jahren hat sich news.ch entschlossen, den Titel in seiner jetzigen Form einzustellen. Damit endet eine Ära medialer Pionierarbeit. mehr lesen 22
Es sind 216 Millionen Veränderungen einzelner Aminosäuren möglich.
Es sind 216 Millionen Veränderungen einzelner Aminosäuren ...
Seltene Krankheiten sind oft schwer zu diagnostizieren, da sie nur wenige Menschen betreffen und die Symptome variieren können. Eine neue Software namens AlphaMissense soll Ärzten dabei helfen, solche Krankheiten schneller und genauer zu erkennen. Die Software nutzt künstliche Intelligenz (KI), um die genetischen Ursachen von seltenen Krankheiten zu analysieren und mögliche Therapien vorzuschlagen. mehr lesen 
Prof. Ofer Bergman von der Bar-Ilan Universität in Israel hat in drei Studien eine faszinierende Entdeckung gemacht: In der Ära des Musikstreamings gibt es eine bemerkenswerte Beziehung ... mehr lesen
Unbegrenzte Verfügbarkeit von Musik verringert den Hörgenuss.
Apotheke & Pharma News Kooperation aus Uni Bonn, den USA und den Niederlanden knackt die Wirkweise des Clovibactins  In einem vielversprechenden Durchbruch haben Forscher:innen ein neues Antibiotikum namens Clovibactin entdeckt. Es weist vielversprechende Eigenschaften auf und könnte gegen die bisher resistenten «Krankenhauskeime» eingesetzt werden. mehr lesen  
Neurowissenschaftler der University of California, Berkeley, haben zum ersten Mal ein erkennbares Lied aus Gehirnaufzeichnungen rekonstruiert. Die Studie, die in der Fachzeitschrift PLOS Biology veröffentlicht wurde, könnte neue Wege zur Verbesserung der Kommunikation bei Menschen mit Sprachstörungen eröffnen. mehr lesen  
Titel Forum Teaser
 
Stellenmarkt.ch
Kreditrechner
Wunschkredit in CHF
wetter.ch
Heute So Mo
Zürich 10°C 16°C wolkig, aber kaum Regenleicht bewölkt, ueberwiegend sonnig recht sonnig recht sonnig
Basel 10°C 19°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig recht sonnig sonnig
St. Gallen 9°C 13°C bedeckt, wenig Regenleicht bewölkt, ueberwiegend sonnig recht sonnig recht sonnig
Bern 10°C 16°C bedecktleicht bewölkt, ueberwiegend sonnig recht sonnig sonnig
Luzern 11°C 17°C bedeckt, wenig Regenleicht bewölkt, ueberwiegend sonnig recht sonnig recht sonnig
Genf 12°C 17°C wechselnd bewölktleicht bewölkt, ueberwiegend sonnig recht sonnig sonnig
Lugano 13°C 21°C gewitterhaftleicht bewölkt, ueberwiegend sonnig sonnig sonnig
mehr Wetter von über 8 Millionen Orten