Suche & Verfügbarkeit für Travel-Plattformen | Gradion

Das technische Problem

Eine Suchantwort von zwei Sekunden im Reisebereich ist kein Problem der Nutzererfahrung. Es ist ein Umsatzproblem. Jede zusätzliche Sekunde Latenz reduziert die Konversionsrate um messbare Prozentsätze. Im Reisegeschäft, wo die Abbruchraten hoch sind und Alternativen nur einen Klick entfernt, summieren sich diese Kosten schnell. Das Problem wird nicht beim Start, sondern bei der Skalierung akut: Plattformen, die bei 100.000 Angeboten noch adäquat funktionieren, zeigen bei einer Million erste Schwächen. Frühe Architektur-Entscheidungen werden dann zu den limitierenden Faktoren, die das Wachstum deckeln.

Zwei Fehlerbilder treten dabei häufig gemeinsam auf. Verfügbarkeitsantworten, die beim Nutzer veraltet ankommen und Inventar anzeigen, das bereits vor 30 Sekunden ausgebucht war. Facettierte Filter, die sich auf den gesamten Katalog beziehen statt auf tatsächlich verfügbare Ergebnisse, führen Käufer in Sackgassen. Keines davon ist ein Datenqualitätsproblem. Beides sind Architekturprobleme.

Sucharchitektur

Das Rückgrat einer produktionsreifen Reisesuche ist eine dedizierte Suchmaschine, keine relationale Datenbank mit zusätzlichen Indizes. Elasticsearch und OpenSearch sind die Standardoptionen, wobei die Wahl des Systems weniger entscheidend ist als das darauf aufbauende Indexdesign. Für Reiseinventar kodiert ein gut konzipierter Index Dokumente mit mehreren Attributen, die Standort, Datumsbereiche, Kapazität, Preisstufen, Ausstattung, Bewertungen und Verfügbarkeitsfenster in einer Struktur abdecken, die die spezifischen Abfragemuster der Plattform unterstützt. Der Unterschied zwischen einem guten und einem mittelmäßigen Indexdesign wird bei einer Million Angebote sichtbar und bei fünfzehn Millionen kritisch. Feldauswahl, Analyzer-Konfiguration und Shard-Strategie bestimmen, ob eine P99-Latenz von unter 500 ms unter Spitzenlast erreichbar ist.

Objekt-Deduplizierung und Datensatzabgleich

Eines der am meisten unterschätzten technischen Probleme in der Reisesuche ist die Deduplizierung: dasselbe Hotel, dieselbe Villa oder dasselbe Objekt mehrfach in den Suchergebnissen erscheint, weil es von verschiedenen Anbietern mit unterschiedlichen Identifikatoren, Namen und Datenmodellen stammt.

Ein einzelnes Objekt kann im Inventar einer Plattform über einen OTA-Channel-Manager, eine direkte Hotel-API, einen GDS-Feed und eine Bed Bank erscheinen – jeweils mit einer anderen Objekt-ID, einer leicht abweichenden Adresse und einem Namen, der möglicherweise nicht exakt übereinstimmt. Ohne eine Deduplizierungsschicht sehen Nutzer dasselbe Objekt viermal zu vier Preisen gelistet, ohne Hinweis darauf, dass es sich um dasselbe Zimmer handelt. Die Konversionsrate sinkt. Das Vertrauen der Anbieter nimmt ab. Die Plattform wirkt unzuverlässig.

Die Branchenreferenz zur Lösung dieses Problems ist GIATA – ein deutsches Unternehmen, das eine Master-Objektdatenbank mit über 750.000 Hotelobjekten weltweit pflegt. Jedes Objekt erhält eine eindeutige GIATA ID, die über alle Vertriebskanäle hinweg persistent ist. Die Zuordnung eingehenden Anbieterinventars zu GIATA IDs ermöglicht es einer Plattform, dasselbe Objekt aus verschiedenen Feeds in einem einzigen kanonischen Datensatz zusammenzuführen und dann mehrere Anbieterpreise für diesen Datensatz anzuzeigen, anstatt Duplikate darzustellen. Wir entwickeln die GIATA-Integration und die Deduplizierungs-Pipeline, die eingehendes Inventar in einen sauberen Objekt-Graphen normalisiert: Erstellung kanonischer Datensätze, Zusammenführung von Attributen aus mehreren Quellen, Konfliktlösung bei abweichenden Angaben zu Zimmeranzahl oder Ausstattung von Anbietern sowie die Weitergabe von Index-Updates, wenn sich der Master-Datensatz ändert.

Für Plattformen, die GIATA nicht nutzen können – sei es aufgrund von Lizenzkosten oder weil der Inventartyp (Mietobjekte, private Villen, Veranstaltungsorte) von der Datenbank nicht ausreichend abgedeckt wird – entwickelt Gradion probabilistische Matching-Pipelines, die Duplikatkandidaten anhand von Namensähnlichkeit, geografischer Nähe und Attributüberschneidungen clustern, ergänzt durch eine Konfidenzbewertungsschicht und eine manuelle Überprüfungswarteschlange für Matches mit geringer Konfidenz. Die technische Herausforderung liegt im Recall: Das Übersehen eines Duplikats ist in den meisten Fällen schlimmer als ein falsch-positives Ergebnis, da Nutzer es entdecken und der Plattform weniger vertrauen werden.

Echtzeit-Verfügbarkeit

Der Inventarstatus im Reisebereich ist einem ständigen Wandel unterworfen. Buchungen, ablaufende Haltefristen und asynchrone Partner-Feeds führen zu kontinuierlichen Änderungen. Die architektonische Herausforderung besteht nicht darin, ob der Echtzeitstatus abgebildet werden soll, sondern wie dies ohne synchrone Aufrufe an langsame externe Systeme bei jeder Suchanfrage gelingt.

Für große Plattformen hat sich ein hybrider Ansatz als praktikabel erwiesen: Die Suchschicht nutzt einen gepflegten Verfügbarkeitsindex, der über Event-Streams bei Buchungen, Stornierungen und dem Ablauf von Haltefristen aktualisiert wird. Der Checkout-Prozess führt vor der finalen Reservierungsbestätigung eine Live-Verfügbarkeitsprüfung durch. HomeToGo koordiniert die Verfügbarkeit über mehr als 100 Partner-APIs und 15M+ Angebote in 25 Märkten. Die technische Herausforderung liegt in der Synchronisierung von Statusdaten aus heterogenen Quellen – jede mit eigenen Aktualisierungsfrequenzen, Datenformaten und Zuverlässigkeitsprofilen – zu einem konsistenten internen Modell, das Suchanfragen verlässlich nutzen können. Die Integrationsschicht, die diese Daten normalisiert, erfordert einen ebenso hohen Engineering-Aufwand wie die Suchmaschine selbst.

Caching-Strategie

Nicht alle Daten in einer Reisesuchantwort weisen die gleiche Volatilität auf. Statische Attribute, Ausstattungslisten, Standortdaten und historische Preisentwicklungen lassen sich mit angemessenen TTLs (Time-to-Live) cachen. Echtzeit-Verfügbarkeiten hingegen nicht. Fehler bei dieser Abgrenzung führen zu Problemen in beide Richtungen: Zu aggressives Caching zeigt nicht verfügbare Angebote und untergräbt das Vertrauen; zu wenig Caching beeinträchtigt die Suchlatenz. Eine Cache-Invalidierung bei Buchungsereignissen ist für jedes reservierte oder bestätigte Inventar zwingend erforderlich. Die Gestaltung, welche Daten im Cache liegen, mit welcher TTL und was die Invalidierung auslöst, ist kein Detail – es ist eine grundlegende Korrektheitsbedingung.

Facettierte Suche und Filterung

Facettierte Filter, die zum Abfragezeitpunkt das tatsächlich verfügbare Inventar präzise widerspiegeln, erfordern eine Aggregation über das gefilterte Ergebnisset – nicht über den gesamten Katalog. Nur so lassen sich Zählungen generieren, die der tatsächlichen Buchbarkeit entsprechen. Dies ohne vollständige Tabellenscans zu erreichen, erfordert den gezielten Einsatz von Aggregationsfunktionen der Suchmaschine und, wo die Präzision der Zählungen weniger kritisch ist als die Geschwindigkeit, den Einsatz von Näherungstechniken. Dynamische Facetten – bei denen sich Wertebereiche und Zählungen mit der Anwendung von Filtern aktualisieren – stellen zusätzliche Anforderungen an die Abfragekonstruktion und Latenz. Spezialisierte Filteranforderungen erfordern zusätzliche Investitionen in die Inhaltsschicht: Eine auf muslimische Reisende ausgerichtete Plattform benötigt beispielsweise Halal-Zertifizierungen, Gebetseinrichtungen und Informationen zur Alkoholpolitik als filterbare Attribute. Diese müssen konsistent im Inventar vorhanden und verifiziert sein, bevor sie als zuverlässige Filteroptionen angeboten werden können. Wir haben die Content-Enrichment-Pipelines entwickelt, die eine spezialisierte Filterung glaubwürdig und nicht nur technisch verfügbar machen.

Relevanz-Ranking und GDS-Integration

Die Keyword-Relevanz bildet die Basis, nicht die Obergrenze, des Rankings in der Reisesuche. Ein Multi-Signal-Ranking berücksichtigt Preiswettbewerbsfähigkeit, Verfügbarkeitszuverlässigkeit, historische Konversionsraten nach Objekt und Marktsegment sowie die geografische Nähe zur Suchabsicht. Ein Machine-Learning-Re-Ranking, trainiert auf Buchungskonversionsdaten, ergänzt eine Personalisierungsschicht, deren Effizienz mit der Skalierung zunimmt. Für Plattformen, die Inventar aus globalen Distributionssystemen beziehen, verbindet sich die Verfügbarkeitspipeline mit Feeds von Amadeus, Sabre oder Travelport sowie mit direkten Channel-Manager-APIs. Jede Quelle verfügt über ein eigenes Datenmodell, eine spezifische Aktualisierungsfrequenz und ein individuelles Zuverlässigkeitsprofil. Die Normalisierung in ein konsistentes internes Verfügbarkeitsmodell ist eine Voraussetzung für kohärente Suchergebnisse. Die Mapping-Schicht ist dabei der Punkt, an dem sich im Laufe der Zeit, mit der Entwicklung der Quellschemata, häufig Korrektheitsprobleme in den Integrationen ansammeln.

Geospatiale Suche

Standort ist eine zentrale Suchachse in den meisten Reisekategorien. OpenSearch und Elasticsearch bieten nativen Support für Geodaten-Abfragen. Dazu gehören Bounding-Box-Abfragen für die Kartensuche, Radius-Abfragen zur Umkreissuche und Polygon-Abfragen für die Suche in Zielgebieten. Für Unterkunfts- und Aktivitätsplattformen ist die Kombination von Geodaten-Filtern mit Verfügbarkeits- und Attributfiltern in einer einzigen Abfrage Standard. Korrekt implementiert, führt dies zu minimaler zusätzlicher Latenz.

Erfolgreich im Betrieb

KAYAK ist die weltweit größte Reisesuchplattform und verarbeitet jährlich über 2 Milliarden Verbraucheranfragen in 60 Märkten. NFQ (vertreten durch Gradion) baute und betrieb über ein Jahrzehnt lang ein hochleistungsfähiges Engineering-Team, das fest in die Produktentwicklung von KAYAK integriert war. Die Arbeit umfasste die Kerninfrastruktur für Suche und Verfügbarkeit, die im Maßstab von KAYAK operiert: Aggregation mehrerer Anbieter, Echtzeit-Verfügbarkeitsnormalisierung über heterogene Datenquellen, Relevanz-Ranking bei Milliarden von Abfragen pro Jahr und das Latenz-Engineering, das Flug- und Unterkunfts-Metasuchen erfordern. Im Jahr 2018 übernahm KAYAK etwa 40 dieser Ingenieure direkt in KAYAK Litauen – das deutlichste Signal dafür, dass das Team nach internen Engineering-Standards und nicht nach externen Dienstleister-Standards gearbeitet hatte.

HomeToGo ist der weltweit größte Marktplatz für Ferienunterkünfte mit über 15 Millionen Angeboten, mehr als 60.000 vertrauenswürdigen Partnern und Aktivitäten in 25 Ländern. NFQ (vertreten durch Gradion) stellte Engineering-Teams mit bis zu 150 Ingenieuren an vier Standorten bereit: über 50 Produktiv-Deployments pro Tag, mehr als 100 gleichzeitige A/B-Tests und 99,99 % Uptime in einem System, das über 100 Partner-APIs in ein einheitliches Verfügbarkeitsmodell integriert. Die Herausforderungen bei der Deduplizierung und Normalisierung von über 15 Millionen Angeboten aus heterogenen Quellen sind ein direkter Beleg dafür, was Property Matching im großen Maßstab erfordert.

roadsurfer: Kompletter Plattform-Neuaufbau in 20 Tagen, 8 Sprachen, 7 Währungen. Buchungen und Umsatz verdoppelten sich innerhalb eines Jahres nach dem Launch.

Nächste Schritte

Beschreiben Sie die Größe deines Inventars, deine Abfragemuster und aktuelle Performance-Engpässe. Wir definieren die passende Sucharchitektur.

Echtzeit-Inventarsuche in der Geschwindigkeit, die Reisekäufer erwarten.