Kontakta Oss Karriär Nyheter Start

Utveckling av Automated Speach Recognition hos Volvo Trucks

Amin Saremi

Amin Saremi har en gedigen utbildningsbakgrund och besitter stor kompetens inom sitt område. Han är elektronikingenjör med inriktning mot inbyggda system och har en doktorsexamen inom signalbehandling. Amin är specialist inom ASR, Automated Speech Recoginition, och arbetar med att utveckla just det – framtidens röstteknik. Amin kom till ESSIQ 2016 och kastades då rakt in i hetluften på Volvo Cars. Några år senare har han nu klivit vidare till ett nytt uppdrag, som Voice Control Function and System Leader på Volvo Trucks. Uppdraget: att implementera molnbaserad röstassistent i lastbilar – något som aldrig tidigare gjorts.

Det kan låta luddigt, att göra något som inte gjorts förut – och på många sätt är det också det, när man arbetar med något som ska testas för första gången. Det Amin och hans projektgrupp har i uppgift är att implementera röstassistent i lastbilar. Uppdraget påbörjades i april 2018 och Amin leder projektet ur tekniskt perspektiv. Röstigenkänning är nog bekant för många inom det här fältet, men röstassistent är något helt annat, förklarar Amin. En röstassistent är betydligt mer avancerad: den ska kunna samla in data och kommunicera med personen som talar, inte bara ta emot budskap. Den ska kunna hitta platser, streama musik, söka efter information, utan att vi behöver aktivera funktionen med ett knapptryck – den ska kunna kommunicera med människan på samma nivå som vi kommunicerar med varandra.

Arbetsgången inleddes för Amins del med att göra research och undersöka förutsättningarna för projektet. Han tog del av underlag kring det som gjorts tidigare och analyserade tidigare leverantörer och insatser. I sin analys kom han fram till att en del ändringar var nödvändiga, och de ansvariga för projektet var av samma åsikt som Amin. Leverantörer byttes ut och projektet kunde starta upp under Amins tekniska ledning, med nya, förbättrade förutsättningar.

Amin arbetar tätt ihop med två Android-utvecklarteam. Målet är att implementera röstassistent i Volvos lastbilar så att chauffören inte ska behöva trycka på några knappar, vilket inte minst är en viktig åtgärd för att öka säkerheten under körning. Men även om uppdraget är intressant och utvecklande är det inte fritt från utmaningar. Amin lyfter bland annat upp att lastbilar utgör en svår miljö när det handlar om röstteknik – det är ju en brusig miljö med mycket ljudintryck, något som påverkar ljudigenkänningen negativt. Amin och hans team arbetar därför mycket med akustiska parametrar, för att hitta en fungerande lösning trots att omgivningen är långt från tyst. Självklart är det också en enorm utmaning att vara först i sitt slag – det finns inga riktiga referensobjekt, och få personer att fråga om råd. Mycket handlar därför om att testa och utvärdera, och att använda sina kompetenser, sitt team och sina erfarenheter för att hitta en väg framåt.

Genom projektet har Amin fått flera nya kompetenser, bland annat inom HMI (Human Machine Interaction) och ledarskap, och självklart om ASR och dess möjligheter i denna kontext. Arbetet har gått bra och delresultaten har fått positivt mottagande. Amin och hans projektgrupp har nått ett viktigt delmål: att kunna prata i telefon genom röststyrning i lastbilen. Under demosessioner har uppdragscheferna varit nöjda med vad som åstadkommits, och Amin berättar att han fått bra stöd av leverantören, som är ivriga att se produkten implementeras i det här sammanhanget. Och ivriga, det är vi också. Vi ser fram emot att ta del av framtidens bilar, där modern röstteknik kommer vara en viktig del. Lyckligtvis är framtiden närmare än vi tror.

  • Amin Saremi

    Amin Saremi