17-08-2007 - De geschiedenis van spraakherkenning
Kanteff Speech Processing B.V. tel: 023 - 56 57 200 www.kanteffspeech.nl
levert sinds 2000 spraakherkenningsoplossingen aan advocaten, medici, gehandicapten en iedereen die snelheid wil behalen.
Geschiedenis
Al bijna 50 jaar vormt spraakherkenningstechnologie een vast thema in sciencefictionboeken en -films. Denk maar aan wereldwijd bekende en buitengewoon succesvolle series als star Trek of aan een mijlpaal in de filmgeschiedenis als 2001: A space odyssey.
De successen op het witte doek bezorgden spraaktechnologie roem, maar deden tegelijkertijd afbreuk aan de geloofwaardigheid van deze technologie. Jarenlang werd spraaktechnologie geassocieerd met entertainment, en om die reden beschouwde men deze technologie als SF-fantasie en niet als een wetenschappelijk gegeven.
De laatste jaren heeft de technologie een enorme vlucht genomen, zowel in de huiskamer als op kantoor. Denk maar aan Internet, mobiele telefonie, MP3-spelers, iPods, DVD, krachtige pc’s en spelcomputers, draadloze netwerken, Bluetooth-verbindingen en flatscreen-tv’s. Het gevolg van deze ontwikkeling is dat spraakherkenningstechnologie serieuzer wordt genomen, uiteraard ook omdat deze technologie zich al zo ver heeft ontwikkeld, dat ze is geïntegreerd in apparaten waarvan we het bestaan al heel gewoon vinden. Dus of u nou achter uw computer zit, uw mobiel gebruikt, vluchtinformatie checkt, uw bank belt of in uw auto zit, de kans dat u met een spraaktoepassing te maken heeft, is heel groot. In de afgelopen tien jaar hebben bedrijven als Nuance (voorheen Scansoft) druk gewerkt aan de ontwikkeling van spraaktechnologie, terwijl de grootheden als Microsoft en IBM ook stevig in de technologie hebben geïnvesteerd. Daarnaast dragen nieuwe industriestandaarden voor allerlei toepassingen van spraaktechnologie – in geïntegreerde vorm, via het netwerk of via de computer - bij aan de ontwikkeling en de verspreiding ervan.
De jaren 30
1939: Bell Laboratorium demonstreert 'de voder', een apparaat voor spraaksynthese, vervaardigd door H.W. Dudley. Na de demonstratie van het apparaat op de wereldbeurs in 1939, roept de New York Times in zijn reportage over dit apparaat uit: 'Mijn God, het praat!”.
De jaren 60
1962: Een van de gedenkwaardigste momenten in het onderzoek naar spraaksynthese in het Bell Laboratorium is als John L. Kelly de met een IBM 704 computer vervaardigde sample ten gehore brengt. De vocoder-synthesizer van Kelly reproduceert het nummer 'Bicycle Built for Two”. Arthur C. Clarke, op bezoek bij een collega van Bell Laboratorium, is getuige van deze bijzondere gebeurtenis en gebruikt het idee in de cruciale scène van zijn roman en de gelijknamige film '2001: Space Odyssey”, waarin de computer HAL9000 dit liedje “zingt” als astronaut Dave Bowman de computer uit elkaar haalt.
1968: De HAL-9000 computer in de film '2001: A Space Odyssey” maakt de wereld deelgenoot van het concept van spraakomzetting via de computer.
1969: John Pierce van Bell Laboratorium waarschuwt dat het, vanwege de benodigde kunstmatige intelligentie, nog wel tientallen jaren zal duren voordat spraakherkenning realiteit wordt. De Amerikaanse defensieorganisatie voor wetenschappelijk onderzoek, DARPA, begint een onderzoeksprogramma naar spraakherkenning om een computersysteem te ontwikkelen dat spraak kan begrijpen. Lawrence Roberts, initiatiefnemer van het programma, geeft jaarlijks $ 3 miljoen aan overheidssteun uit voor zijn speurtocht die vijf jaar zou duren en zou leiden tot het grootste spraakherkenningsproject ooit.
De jaren 70
1976: Jim Baker van IBM ontwerpt op basis van een zogenaamd Hidden Markov-model (HMM) een spraakherkenningsapparaat dat 1000 woorden kan herkennen. HMM is een statistische techniek voor patroonherkenning die uiteindelijk wordt overgenomen door alle toonaangevende instellingen voor spraak- en stemherkenning, waaronder Dragon systems, IBM, Philips en AT&T.
1978: Texas instruments introduceert het populaire leerhulpmiddel “ speak & spell”. De spraakchip in speak & spell leidt tot grote stappen voorwaarts in de ontwikkeling van meer op de menselijke stem lijkende digitale klanken
De jaren 80
1982: Covox wordt opgericht. Dit bedrijf levert digitaal geluid aan de commodore 64, Atari 400/800 en ten slotte, in het midden van de jaren 80, aan de IBM-pc.
1982: Dragon systems wordt opgericht door de pioniers in de spraakindustrie, drs. Jim en Janet Baker. Dragon systems is vermaard om zijn lange historie van innovaties op het gebied van spraak- en taaltechnologie en zijn uitgebreide portfolio aan patenten. Met versie 9 van Dragon NaturallySpeaking, nu eigendom van Nuance communications inc., kan de gebruiker tot 160 woorden per minuut dicteren met een nauwkeurigheid van 99%.
1983: Autofabrikant Austin Rover introduceert de ‘Maestro’-serie van gezinsauto’s. De topmodellen hebben een ingebouwde computer die gebruik maakt van spraaksynthese om de inzittenden eraan te herinneren hun veiligheidsgordel om te doen en om hen te waarschuwen bij een laag oliepeil of niet-gesloten deuren. Een Engelse journalist die tijdens de perspresentatie was omgerold, vertelt wat de computer liet horen toen de auto op zijn kop lag: ‘oliedruk – laag’.
1984: SpeechWorks, vooraanstaand leverancier van oplossingen voor geautomatiseerde spraakherkenning via de telefoon, wordt opgericht.
1987: Lernout & Hauspie (L&H) wordt opgericht. L& H, een gerenommeerd bedrijf met een ruim aanbod aan geavanceerde spraaktechnologieproducten, laat helaas niet meer dan een glimp zien van hoe spraaktechnologie in toekomstige hardwaretoepassingen zal worden ingezet.
1988: Dragon systems voert de eerste openbare demonstratie op van dicteer-spaakherkenningssysteem via de computer met een vocabulaire van 8000 woorden.
De jaren 90
1996: Een van de grootste financiële dienstverleners van de VS, Charles Schwab, is de eerste onderneming die middelen ter beschikking stelt voor het ontwikkelen van een IVRspraakherkenningssysteem met Nuance. Het programma, VoiceBroker, maakt het mogelijk dat maar liefst 360 klanten tegelijkertijd kunnen inbellen voor koersen van aandelen en opties. Het programma kan ongeveer 50.000 verzoeken per dag verwerken. Het systeem is tot 95% nauwkeurig en is de wegbereider voor andere bedrijven zoals Sears, Roebuck en co, United Parcel Service of America inc. en E*trade securities.
1990: Dragon demonstreert een 5000 woorden tellend, continue-spraakherkenningssysteem voor de computer en introduceert de DragonDictate 30K, het eerste spraak-naar-tekstsysteem met een groot vocabulaire voor algemene dicteertoepassingen. De computer kan worden bestuurd met behulp van stemcommando’s, maar de gebruiker moet wel pauzeren tussen de woorden.
1994: Dragon systems komt met Dragon Dictate voor Windows, het eerste dicteerproduct voor pc-software
1995: Dragon brengt spraakherkenningssoftware voor het dicteren van woorden. Het is de eerste keer dat technologie voor dicteren en stemherkenning ook voor de consument beschikbaar is. IBM en Kurzweil volgen enkele maanden later met hun aanbod.
1997: IBM komt met ViaVoice, een spraakherkenningsprogramma voor de computer.
1998: L&H introduceert VoiceXpress, zijn eigen spraakherkenningssoftware voor de computer
De 21e eeuw
Januari 2000: Oprichting van Kanteff Speech Processing B.V.
Gestart in Almere en later verhuisd naar Hoofddorp.
April 2000: Lernout & Hauspie neemt Dragon systems voor ongeveer $ 460 miljoen over.
Oktober 2000: ondanks dat de technologie en de toepassingsmogelijkheden wereldwijd worden erkend, leiden onregelmatigheden in de boekhouding tot het faillissement van Lernout & Hauspie. De bezittingen worden verkocht en een van de groten van de spraakindustrie gaat ten onder.
December 2001: Scansoft neemt de spraakfaciliteiten van L&H over, inclusief producten en technologieën van Dragon: Dragon NaturallySpeaking en AudioMining, “RealSpeak” Tekst-naar-spraak en de automatische spraakherkennings-engine, ASR1600.
September 2002: Kanteff Speech Processing uit Hoofddorp verandert de leerfase (stem training) In samen werking met Marion v.d. Coolwijk Kind in Beeld wordt de stemtraining op AVI niveau gemaakt. Uit het onderzoek dat vervolgens met 200 dyslectische MBO-leerlingen blijkt dat spraakherkenningsoftware goed kan worden ingezet als hulpmiddel bij het maken van huiswerk, schrijven van werkstukken etc. De spraakherkenningssoftware wordt op de Nederlandse markt gebracht onder de naam DyslexieSoftware.
Augustus 2003: Scansoft neemt Speechworks over, een bedrijf dat spraakherkenning, tekst-naar-spraak (TTs) en sprekerverificatie voor netwerk en geïntegreerde omgevingen, waaronder nieuwe multimodale systemen met zowel audio-interface als visuele weergave. Door deze overname kan scansoft zijn aanbod van netwerk- en geïntegreerde spraakoplossingen verder uitbreiden.
November 2004: Scansoft gaat een partnerschap aan met het Royal National institute for the Blind (RNiB) om de TALKS-software te integreren met door Symbian aangestuurde telefoons en om deze te kunnen aanbieden aan mensen met een visuele handicap. De TALKSsoftware stelt blinde en slechtziende mensen in staat om met hun stem tekstberichten samen te stellen. inkomende berichten en telefoonnummers kunnen worden omgezet in gesproken tekst.
Mei 2005: Scansoft en Nuance fuseren en vormen ’s werelds grootste en meest succesvolle onderneming voor spraakproducten: Nuance communications, inc. Spraaktechnologie is te vinden in computers en in callcenters, mobiele apparatuur, spelcomputers en navigatiesystemen.
Oktober 2005: Scansoft verandert zijn naam in Nuance communications en presenteert daarmee een uniformiteit in zijn positie op de markten die het bedient. De naam Scansoft wordt nog steeds gebruikt voor de serie beeldoplossingen die het bedrijf biedt. Nuance blijft ‘s werelds meest uitgebreide leverancier van spraak- en beeldoplossingen voor particulieren en bedrijven, waaronder AOL, Bank of America, British Airways, Charles Schwab, Citigroup, Daimler Chrysler, Ford, General Electric, LG, Nokia, SBC, united Airlines, verizon en Vodafone.
Maart 2006: Nuance rondt de overname af van Dictaphone corporation, toonaangevend leverancier van dicteer- en spraakherkenningsoplossingen voor de medische sector, en versnelt daarmee de strategie van Nuance om de handmatige transcripties in de medische sector te automatiseren.
Juni 2006: Een krantenkop in het internationaal gerespecteerde financiële dagblad de Financial Times meldt het vol‑
gende: “voice Recognition starts to Make Big Noise” (spraakherkenning laat duidelijk van zich horen). in het bijbehorende artikel komen bedrijven aan de orde die een snelle groei hebben doorgemaakt sinds zij Dragon NaturallySpeaking hebben ingezet als een essentieel zakelijk instrument.
Juli 2006: Nuance introduceert Dragon NaturallySpeaking versie 9, een nieuwe uitgave van ‘s werelds bestverkochte spraakherkenningsproduct, met een nauwkeurigheid van 99%. Als primeur hoeft de gebruiker met deze versie niet langer de software in te schakelen. Dragon NaturallySpeaking Medical versie 9, speciaal ontwikkeld voor medische professionals, verschijnt spoedig hierna. Dragon NaturallySpeaking Legal versie 9, ontwikkeld voor juridische professionals in grote bed rijven, kleine praktijken of juridische afdelingen van bedrijven of overheidsinstellingen, verschijnt in augustus van dat jaar. Zowel de versies voor de medische als voor de juridische sector worden zeer goed ontvangen door de vele trouwe gebruikers in die sectoren.
Maart 2007: De sterren van de autosalon van Genève 2007 worden gevormd door de nieuwe generatie van Mercedes-Benz c-klasse, Fiat Bravo en Ford Mondeo. Alledrie zijn zij uitgerust met de nieuwste autotechnologie en alledrie bieden zij de spraakherkenningstechnologie van Nuance als interface voor hun infotainment-systemen, en leveren daarmee veiligheid en gemak aan miljoenen automobilisten.
Lloyds TSB viert het tienjarig bestaan van spraaktechnologie voor een callcenter-toepassing: phoneBank Express. onderzoeken wijzen uit dat klanten zeer te spreken zijn over de snelheid en betrouwbaarheid van het systeem. klanten zijn ook vol lof over het geruste gevoel dat zij krijgen omdat de financiële transacties worden uitgevoerd in een beproefd veilige en beveiligde omgeving.
April 2007: Tegen de achtergrond van belangrijke mijlpalen en bijzondere prestaties viert Dragon NaturallySpeaking zijn tiende verjaardag. Dragon NaturallySpeaking wordt nu algemeen erkend als ‘s werelds beste spraakherkenningsoplossing met een gebruiksgemak en nauwkeurigheid die ervoor zorgen dat iedereen deze oplossing kan gebruiken. Overal ter wereld profiteren miljoenen mensen van de enorme productiviteit van deze software en elk jaar waarderen steeds meer klanten de snelheid en nauwkeurigheid van ‘s werelds bekendste, meest geavanceerde en meest gerespecteerde spraakherkenningsoplossing. Dragon NaturallySpeaking 9 zet spraak om in tekst met een snelheid van tot 160 woorden per minuut en een nauwkeurigheid van 99 procent. Dragon NaturallySpeaking is verkrijgbaar in het Nederlands, Engels, Frans, Duits, Italiaans en Spaans.
Gepost door: DianaKoenekoop op 17-08-2007 om 13:14
|