Apple legt uit: ‘Hey Siri’ gaat niet over een nacht ijs

Raymon op 19 oktober 2017 10 reacties Laatste door Cybertopian

Je hoort woorden als Artificial Intelligence en Neurale Netwerken steeds vaker, maar hoe ziet dat er nou in de praktijk uit? Apple geeft in een nieuwe whitepaper een mooi voorbeeld. Wat doet je iPhone allemaal als je “Hey Siri” hebt gezegd? Meer dan je denkt.

De iPhone en Apple Watch analyseren omgevingsgeluid zo’n 16.000 keer per seconde en checken constant of iemand Siri misschien heeft opgeroepen. Als de mogelijkheid bestaat, wordt een grote beslisboom doorlopen.

Belangrijke taak voor coprocessor

Sinds de iPhone 6s kun je Siri oproepen zonder fysieke handeling. Dat komt omdat de iPhone naast zijn hoofdchip ook een kleine M-chip heeft. Deze coprocessor bevat ondanks zijn beperkte omvang twee neurale netwerken. Het eerste neurale netwerk is het kleinst en berekent hoe groot de kans is dat “Hey Siri” is gezegd. Is die kans klein? Dan onderneemt de telefoon geen actie, maar als de kans aanwezig is, wordt het tweede deel van de chip aangesproken om een analyse uit te voeren.

iphone coprocessor 16x9

Klik/tap voor groter.

Is het volgens het tweede neurale netwerk ook zeker dat de gebruiker “Hey Siri” heeft geroepen, dan wordt de audio naar een server bij Apple gestuurd. Die zet de audio vervolgens om in tekst. Alleen als daar ook uit blijkt dat het juiste commando is gezegd, wordt Siri geactiveerd. Als de server detecteert dat de gebruiker toch iets anders heeft gezegd, wordt de coprocessor weer uitgeschakeld. Dit alles moet binnen minder dan een seconde gebeuren.

Apple wil zo een goede balans tussen privacy en gemak houden. Alleen als de iPhone zeker is dat je Siri wil oproepen, wordt een Apple-server ingezet.

Apple Watch

De Apple Watch heeft een stuk minder processorkracht dan de iPhone en Apple is dan ook genoodzaakt om de Siri-detectie te beperken. Het slimme horloge luistert alleen naar audio als beweging wordt gedetecteerd. Om te zorgen dat de accu niet leegloopt door het analyseren van omgevingsgeluid, mag dit de processor maximaal 5 procent belasten. Daardoor kan de analyse soms wat langer duren.

apple watch hey siri

Klik/tap voor groter.

Al deze details werden op Apple’s Machine Learning Journal gepubliceerd. Het bedrijf geeft op dat blog regelmatig een kijkje in zijn academische keuken.

Raymon is vaste redacteur bij OMT, maar noemt zich liever redactieninja. Ook te volgen op Twitter en wekelijks te horen in de TechSnacks Podcast. Lees meer artikelen van Raymon.

En nu?

10 reacties

Profielfoto

Zzyzx_Rd op 19 oktober 2017

Here’s what I found on the web…

Buiten timers instellen en reminders maken om, heb ik nog nooit iets nuttigs van Siri gehoord.

Profielfoto

ItsMeMario op 19 oktober 2017

Hier idem. Gebruik Alexa werkt 100 keer beter. Ik begrijp dat niet van zo’n groot bedrijf als Apple. Siri verstaat me echt nooit (ook niet in het engels) en Alexa bijna altijd. Heb de hele siri bedoeling uit gezet, niet aan mij besteed…

Profielfoto

MEEUW op 19 oktober 2017

Artificial Intelligence en Neurale Netwerken is niks anders dan een database vol met informatie.
Tabbelen zijn op bepaalde manier gekoppeld.
En de programmatuur kan mogelijkheden aan elkaar koppelen.
of evt erbij zetten.
Of gebruikt evt externe bronnen.
Meer niet.
Het is dus allemaal niet zo als de benaming het zeg.

Profielfoto

Jan-petor op 19 oktober 2017

@MEEUW

Dat geldt toch voor elke vorm van intelligentie? Het op een bepaalde manier van informatie koppelen zodat nieuwe informatie beschikbaar komt.
Neural Networks werken op dezelfde manier als de neuronen in onze hersenen, maar zijn dan kunstmatig (Artificial) aangelegd. Had geen betere benaming kunnen kiezen persoonlijk.

Profielfoto

Barika Cala Saidah op 19 oktober 2017

@MEEUW, waarom zwijg je niet gewoon als je niets over weet?

@ItsMeMario, dan lijkt me er meer iets naar de knoppen met je microfoons dan met Siri.

Profielfoto

Cybertopian 1 maand geleden

@MEEUW, goed dat je hier even aangeeft dat je echt geen idee hebt waar je het over hebt.;-) (En databases op basis van tabellen er ook al heel ouderwets.)

On topic: volgens mij heeft Siri nog een derde netwerkje nodig. Maar al te vaak schrikt ze wakker door iets wat lijk op “Hey Siri” op b.v. de TV of iPad in de buurt. En het is zelfs voorgekomen tijdens het spelen van muziek via CarPlay. Dus eigenlijk werd ze daar wakker van muziek dat ze zelf afspeelde. Daar moet toch zeker een soort feedback loopje voor in te bouwen zijn.

Profielfoto

MEEUW 1 maand geleden

Ja jullie zeggen het….
Maar ik zou me dan toch iets meer verdiepen erin.
Iets met prolog..
En als siri op google zoekt. word er toch weer database aangesproken ;).
Behalve de lieve bewoording van jullie zie ik nergens argumentatie…

Jullie hebben zeker ook allemaal onbeperkt data van 5gb :P?

Profielfoto

rob seller 1 maand geleden

Check, onbeperkt data. Siri doet 2 dingen top. 1. Elke zaterdag is mijn ei precies goed gekookt. 2. Op CarPlay doet hij 90% van de tijd wat ik vraag. Voor de rest lopen Google en Amazon hier mijlen op voor. Alexa kan mij alles vertellen wat ik vraag. Google kan ik door vragen op eerder gestelde vragen.

Profielfoto

ArMac 1 maand geleden

Ik gebruik Siri tientallen keren per dag. 9 van de 10 keer gaat het perfect. Zelfs als in de auto de muziek hard staat, hoort Siri me gewoon.

Snap werkelijk niet dat mensen veel problemen ervaren met Siri, echt een super functie. En gaat je commando niet goed: zoals Siri in het begin moeite had met Waze, dan kun je je commando handmatig aanpassen, volgende keer gaat het dan wel goed. Zo leert Siri steeds beter jouw uitspraak te herkennen.

Profielfoto

Cybertopian 1 maand geleden

@MEEUW, je bent nu wel je leeftijd aan het verraden. Prolog is ook al niet meer zo jong.;-)
En nee, prolog heeft ook niets met neurale netwerken te maken. Prolog werd (word?) gebuikt voor kennissystemen. Dat is een heel andere benadering van AI. En ook prolog sloeg zijn data niet op in tabellen.

Google gebruik heel eigen datastructuren. Als ze een standaard DBMS van de plank hadden gehaald en alles in tabelletjes hadden gestopt hadden ze de wereld nooit kunnen bedienen.

Dus hoe ver wil je het concept van een database en tabellen oprekken om je punt te maken? Is een mpeg ook een database met tabellen van images en ondertitels?

Ik weet niet welke argumentatie je hebben wilt, maar je kunt er ook zelf naar op zoek gaan. B.v. bij Apple de WWDC van dit jaar bekijken. Een aantal sessie gaan over Machine Learning en welke mogelijkheden Apple heeft ingebouwd. Veel kijk plezier.:-)

 


Je kunt alleen reageren met een gratis OMT account.
Heb je geen OMT account? Registreer je dan nu gratis!

Inloggen

 

of Wachtwoord resetten?