NotuBiz archiveert dagelijks audiovisuele opnamen van grote hoeveelheden gemeenteraadsvergaderingen en legt daarbij precies vast wie er op welk moment aan het woord is geweest. Met behulp van automatische sprekerherkenning van SpraakLab kan NotuBiz deze taak consistent met hoge kwaliteit uitvoeren.
Beeld & Geluid beheert onder andere het archief van alle publieke radio- en televisiezenders. Met behulp van automatische sprekerindexering (sprekerherkenning voor grote collecties en archieven) van SpraakLab ontsluit Beeld & Geluid dit archief voor zijn professionele klanten.
Tell James maakt spraakgestuurd rapporteren in de zorg mogelijk. James zet jouw gesproken rapportages direct om naar tekst: terwijl je praat zie je tekst in het dossier (welke dan ook) verschijnen.
Met deze vorm van spraakherkenning wordt de spraak van alle verschillende sprekers in de opname (of stream) in realtime herkend. Het is mogelijk om het systeem aan te passen voor een specifieke taak.
SpraakLab beschikt over systemen voor het Nederlands, Frans, Duits en Engels.
De akoestiek over de telefoon is anders dan bij breedband-opnamen. Daarom beschikt SpraakLab over een speciaal telefonie-spraakherkennings-systeem voor het Nederlands. Het is mogelijk om een heel gesprek te herkennen, of om een kort fragment van één spreker onmiddellijk te herkennen. Bij deze laatste vorm is de herkenning klaar binnen 0,2 seconde na het uitspreken van de laatste zin.
Soms is een volledig vrije herkenning niet nodig. Bij het geven van spraak-commando's bijvoorbeeld is het handiger om een beperkte grammatica te gebruiken.
SpraakLab beschikt over gestuurde systemen voor het Nederlands, Frans, Duits en Engels.
Als de spraak in uw opname al is uitgeschreven (bijvoorbeeld als u beschikt over notulen van uw vergadering), dan is het mogelijk om deze transcriptie volledig automatisch om te zetten in ondertiteling. Hoe nauwkeuriger uw verslag, hoe beter dit werkt, maar helemaal perfect hoeft de transcriptie niet te zijn!
SpraakLab kan op deze manier ondertiteling voor u genereren in het Nederlands, Frans, Duits of in het Engels.
Het is niet alleen mogelijk om te herkennen wat er gezegd wordt, maar ook wie het zegt. Met deze vorm van spraaktechnologie, sprekerherkenning, kunt u sprekers in een opname onderscheiden (speaker diarization) en daarna eventueel de identiteit van iedere spreker vaststellen (speaker identification).
Sprekerherkenning is taal-onafhankelijk. Het maakt voor dit systeem dus niet uit in welke taal gesproken wordt.
Beschikt u over grote hoeveelheden audiovisueel materiaal en wilt u in dit materiaal kunnen zoeken naar fragmenten? SpraakLab kan uw collectie ontsluiten op basis van spraakherkenning en/of sprekerherkenning.
Bij ontsluiting op basis van spraakherkenning worden alle gesproken woorden uit de collectie herkend en toegevoegd aan een index. Via onze webinterface kunt u of uw bezoekers daarna eenvoudig interessante fragmenten terugvinden!
Zoeken op sprekerbasis kan supervised, nadat voor alle interessante sprekers statistische modellen zijn gemaakt, of ook unsupervised op basis van query-by-example. In deze laatste vorm kan gezocht worden naar spraakfragmenten waarvan de spreker hetzelfde is als een voorbeeld-fragment.
Sprekerherkenning is taal-onafhankelijk. Het maakt voor dit systeem dus niet uit in welke taal gesproken wordt.
dr. ir. Marijn Huijbregts
Marijn is enthousiast, creatief, analytisch, onderzoeker en (dus) een tikkeltje eigenwijs. In 2015 heeft Marijn SpraakLab opgericht. Hij biedt sindsdien niet alleen zijn spraak- technologische systemen en expertise aan onder deze naam, ook zijn onderzoek heeft hij in volle vaart voortgezet.
PhD onderzoek
Marijn heeft zijn promotieonderzoek op het gebied van spraakherkenning en het doorzoekbaar maken van audiovisuele collecties uitgevoerd aan de vakgroep Human Media Interaction, Universiteit Twente. Een deel van zijn onderzoek heeft Marijn uitgevoerd bij het International Computer Science Institute (ICSI) in Berkeley.
PostDoc onderzoek
Na zijn promotie heeft Marijn zijn onderzoek voortgezet bij het Centre for Language and Speech Technology aan Radboud Universiteit Nijmegen. In Nijmegen heeft Marijn onderzoek gedaan naar automatische sprekerherkenning in grote audiovisuele collecties.
SpraakLab is onderdeel van NotuBiz
In januari 2022 is SpraakLab onderdeel geworden van NotuBiz. Met Pascal en Niki in het management team en ondersteuning vanuit NotuBiz kunnen we nu onze dienstverlening een boost geven.
Nu bestaat het onderzoeks en ontwikkelteam van SpraakLab nog uit een klein startup team van twee personen, maar met hulp van onze moederonderneming NotuBiz en natuurlijk die van jou, gaat het R&D-team de komende periode groeien tot een volwaardige spraaktechnologische software-groep. Draag jij daar binnenkort aan bij? Check hier onze vacatures.