Stel je zoekt in een grote documentenbibliotheek naar alles wat gaat over 'het verlagen van energiekosten'. Een traditionele zoekmotor geeft je alleen resultaten terug die letterlijk die woorden bevatten. Weaviate geeft je ook de stukken over isolatie, warmtepompen en slimme meters, omdat het systeem begrijpt wat je bedoelt, niet alleen wat je typt.
Dat is in een notendop wat het Amsterdamse Weaviate doet. Het bedrijf, opgericht in 2019 door Bob van Luijt en Etienne Dilocker, bouwt een open-source vectordatabase die data opslaat en doorzoekt op basis van semantische betekenis. Geen trefwoorden, maar context. Geen exacte matches, maar begrip.
Met een Series B-ronde van ruim 45 miljoen euro, afgesloten begin 2024, heeft het bedrijf de middelen om die ambitie verder uit te bouwen. Maar de kern van Weaviate is al jaren hetzelfde: een database die AI-toepassingen ondersteunt op een schaal die tot miljarden objecten reikt.
Van trefwoord naar betekenis
Traditionele databases slaan data op als rijen en kolommen, en zoeken op exacte of gedeeltelijke tekstovereenkomsten. Vectordatabases werken anders. Tekst, afbeeldingen of andere data worden omgezet in wiskundige representaties, zogenoemde vectoren, die de betekenis van een stuk informatie vastleggen in een ruimte van honderden of duizenden dimensies. Twee zinnen die hetzelfde betekenen maar andere woorden gebruiken, liggen in die ruimte dicht bij elkaar.
Weaviate is gebouwd rond dat principe. Ontwikkelaars kunnen er gegevensobjecten in opslaan, voorzien van vectorrepresentaties, en die vervolgens doorzoeken op semantische nabijheid. Het platform regelt zelf de vectorisering, het rangschikken van resultaten en het automatisch opschalen van de infrastructuur. Wie een AI-toepassing bouwt, hoeft die technische laag dus niet zelf te bouwen of te beheren.
De oprichters en hun achtergrond
Bob van Luijt, CEO van Weaviate, heeft een achtergrond in softwareontwikkeling en machine learning. Hij combineert technische diepgang met een brede interesse in open-source en digitale productontwikkeling. Mede-oprichter en CTO Etienne Dilocker komt uit de wereld van gedistribueerde systemen en cloudtechnologie, een achtergrond die direct zichtbaar is in hoe Weaviate is opgezet: schaalbaar, gedistribueerd en ontworpen voor productieomgevingen onder grote belasting.
Samen richtten ze SeMI Technologies op, het bedrijf dat later Weaviate als product en merknaam naar voren schoof. De keuze voor open-source was van begin af aan bewust. Een open database trekt een gemeenschap van ontwikkelaars aan die bijdragen aan de code, bugs rapporteren en het product in allerlei onverwachte contexten inzetten. Dat versnelt de ontwikkeling en vergroot het vertrouwen bij organisaties die geen propriëtaire vendor-lock-in willen.
Wat je ermee bouwt
Weaviate positioneert zich als infrastructuur voor drie typen AI-toepassingen die momenteel sterk in opkomst zijn. De eerste is semantisch zoeken, waarbij gebruikers in natuurlijke taal kunnen zoeken door grote hoeveelheden documenten, afbeeldingen of andere content. De tweede is Retrieval Augmented Generation, vaak afgekort als RAG. Bij RAG wordt een taalmodel gekoppeld aan een externe kennisbron: de database levert relevante context aan, waarna het model een antwoord genereert op basis van die specifieke informatie. Dat vermindert het risico op verzonnen antwoorden en maakt het mogelijk om taalmodellen te gebruiken over bedrijfsspecifieke data.
De derde categorie is die van agentische workflows, waarbij AI-systemen meerdere stappen achter elkaar uitvoeren, informatie ophalen, redeneren en acties ondernemen. Ook daarvoor is een snelle, betrouwbare vectordatabase een essentieel onderdeel van de architectuur.
Weaviate ondersteunt integraties met gangbare AI-frameworks en taalmodellen, zodat ontwikkelaars het platform kunnen koppelen aan de tools die ze al gebruiken.
Open-source als strategie
De open-source kern van Weaviate is geen bijzaak. Het is een bewuste keuze die het bedrijf in staat stelt om breed te worden ingezet, van individuele ontwikkelaars die lokaal experimenteren tot grote ondernemingen die de database in hun eigen cloud-omgeving draaien. Naast de zelf te hosten versie biedt Weaviate een beheerde cloudvariant aan, wat een gangbaar verdienmodel is in de open-source databasewereld.
Die aanpak heeft Weaviate een actieve gebruikersgemeenschap opgeleverd en bijgedragen aan de zichtbaarheid van het project in de bredere AI-infrastructuurmarkt. Het is een markt die de afgelopen jaren snel is gegroeid, aangejaagd door de opkomst van grote taalmodellen en de behoefte aan gespecialiseerde opslaglaag voor vectordata.
Amsterdam als uitvalsbasis voor AI-infrastructuur
Weaviate is een van de weinige Europese spelers in een markt die vooralsnog wordt gedomineerd door Amerikaanse bedrijven als Pinecone en Chroma. Vanuit Amsterdam concurreert het bedrijf wereldwijd, met een product dat zowel technisch als qua licentiemodel aansluit bij de behoeften van organisaties die grip willen houden op hun data en infrastructuur.
Voor de Nederlandse en Europese AI-scene is Weaviate een voorbeeld van hoe diepe technische infrastructuur hier wel degelijk kan worden gebouwd en gefinancierd. Met de groeiende nadruk op digitale soevereiniteit en de Europese AI-regelgeving als achtergrond, is er ruimte voor Europese alternatieven in de infrastructuurlaag onder AI-toepassingen. Dat Weaviate vanuit Amsterdam opereert en tegelijk wereldwijd schaalt, laat zien dat die combinatie haalbaar is.