Apple legt uit: ‘Hey Siri’ gaat niet over een nacht ijs

Door: Raymon Mens - 10 reacties

Je hoort woorden als Artificial Intelligence en Neurale Netwerken steeds vaker, maar hoe ziet dat er nou in de praktijk uit? Apple geeft in een nieuwe whitepaper een mooi voorbeeld. Wat doet je iPhone allemaal als je “Hey Siri” hebt gezegd? Meer dan je denkt.

De iPhone en Apple Watch analyseren omgevingsgeluid zo’n 16.000 keer per seconde en checken constant of iemand Siri misschien heeft opgeroepen. Als de mogelijkheid bestaat, wordt een grote beslisboom doorlopen.

Belangrijke taak voor coprocessor

Sinds de iPhone 6s kun je Siri oproepen zonder fysieke handeling. Dat komt omdat de iPhone naast zijn hoofdchip ook een kleine M-chip heeft. Deze coprocessor bevat ondanks zijn beperkte omvang twee neurale netwerken. Het eerste neurale netwerk is het kleinst en berekent hoe groot de kans is dat “Hey Siri” is gezegd. Is die kans klein? Dan onderneemt de telefoon geen actie, maar als de kans aanwezig is, wordt het tweede deel van de chip aangesproken om een analyse uit te voeren.

iphone coprocessor 16x9
Klik/tap voor groter.

Is het volgens het tweede neurale netwerk ook zeker dat de gebruiker “Hey Siri” heeft geroepen, dan wordt de audio naar een server bij Apple gestuurd. Die zet de audio vervolgens om in tekst. Alleen als daar ook uit blijkt dat het juiste commando is gezegd, wordt Siri geactiveerd. Als de server detecteert dat de gebruiker toch iets anders heeft gezegd, wordt de coprocessor weer uitgeschakeld. Dit alles moet binnenĀ minder dan een seconde gebeuren.

Apple wil zo een goede balans tussen privacy en gemak houden. Alleen als de iPhone zeker is dat je Siri wil oproepen, wordt een Apple-server ingezet.

Apple Watch

De Apple Watch heeft een stuk minder processorkracht dan de iPhone en Apple is dan ook genoodzaakt om de Siri-detectie te beperken. Het slimme horloge luistert alleen naar audio als beweging wordt gedetecteerd. Om te zorgen dat de accu niet leegloopt door het analyseren van omgevingsgeluid, mag dit de processor maximaal 5 procent belasten. Daardoor kan de analyse soms wat langer duren.

apple watch hey siri
Klik/tap voor groter.

Al deze details werden op Apple’s Machine Learning JournalĀ gepubliceerd. Het bedrijf geeft op dat blog regelmatig een kijkje in zijn academische keuken.

Reacties

10 reacties
  • Profielfoto
    Zzyzx_Rd

    Hereā€™s what I found on the web…

    Buiten timers instellen en reminders maken om, heb ik nog nooit iets nuttigs van Siri gehoord.

  • Profielfoto
    ItsMeMario

    Hier idem. Gebruik Alexa werkt 100 keer beter. Ik begrijp dat niet van zoā€™n groot bedrijf als Apple. Siri verstaat me echt nooit (ook niet in het engels) en Alexa bijna altijd. Heb de hele siri bedoeling uit gezet, niet aan mij besteed…

  • Profielfoto
    MEEUW

    Artificial Intelligence en Neurale Netwerken is niks anders dan een database vol met informatie.
    Tabbelen zijn op bepaalde manier gekoppeld.
    En de programmatuur kan mogelijkheden aan elkaar koppelen.
    of evt erbij zetten.
    Of gebruikt evt externe bronnen.
    Meer niet.
    Het is dus allemaal niet zo als de benaming het zeg.

  • Profielfoto
    iGuy

    @MEEUW

    Dat geldt toch voor elke vorm van intelligentie? Het op een bepaalde manier van informatie koppelen zodat nieuwe informatie beschikbaar komt.
    Neural Networks werken op dezelfde manier als de neuronen in onze hersenen, maar zijn dan kunstmatig (Artificial) aangelegd. Had geen betere benaming kunnen kiezen persoonlijk.

  • Profielfoto
    Barika Cala Saidah

    @MEEUW, waarom zwijg je niet gewoon als je niets over weet?

    @ItsMeMario, dan lijkt me er meer iets naar de knoppen met je microfoons dan met Siri.

  • Profielfoto
    Cybertopian

    @MEEUW, goed dat je hier even aangeeft dat je echt geen idee hebt waar je het over hebt.;-) (En databases op basis van tabellen er ook al heel ouderwets.)

    On topic: volgens mij heeft Siri nog een derde netwerkje nodig. Maar al te vaak schrikt ze wakker door iets wat lijk op “Hey Siri” op b.v. de TV of iPad in de buurt. En het is zelfs voorgekomen tijdens het spelen van muziek via CarPlay. Dus eigenlijk werd ze daar wakker van muziek dat ze zelf afspeelde. Daar moet toch zeker een soort feedback loopje voor in te bouwen zijn.

  • Profielfoto
    MEEUW

    Ja jullie zeggen het….
    Maar ik zou me dan toch iets meer verdiepen erin.
    Iets met prolog..
    En als siri op google zoekt. word er toch weer database aangesproken ;).
    Behalve de lieve bewoording van jullie zie ik nergens argumentatie…

    Jullie hebben zeker ook allemaal onbeperkt data van 5gb :P?

  • Profielfoto
    rob seller

    Check, onbeperkt data. Siri doet 2 dingen top. 1. Elke zaterdag is mijn ei precies goed gekookt. 2. Op CarPlay doet hij 90% van de tijd wat ik vraag. Voor de rest lopen Google en Amazon hier mijlen op voor. Alexa kan mij alles vertellen wat ik vraag. Google kan ik door vragen op eerder gestelde vragen.

  • Profielfoto
    ArMac

    Ik gebruik Siri tientallen keren per dag. 9 van de 10 keer gaat het perfect. Zelfs als in de auto de muziek hard staat, hoort Siri me gewoon.

    Snap werkelijk niet dat mensen veel problemen ervaren met Siri, echt een super functie. En gaat je commando niet goed: zoals Siri in het begin moeite had met Waze, dan kun je je commando handmatig aanpassen, volgende keer gaat het dan wel goed. Zo leert Siri steeds beter jouw uitspraak te herkennen.

  • Profielfoto
    Cybertopian

    @MEEUW, je bent nu wel je leeftijd aan het verraden. Prolog is ook al niet meer zo jong.;-)
    En nee, prolog heeft ook niets met neurale netwerken te maken. Prolog werd (word?) gebuikt voor kennissystemen. Dat is een heel andere benadering van AI. En ook prolog sloeg zijn data niet op in tabellen.

    Google gebruik heel eigen datastructuren. Als ze een standaard DBMS van de plank hadden gehaald en alles in tabelletjes hadden gestopt hadden ze de wereld nooit kunnen bedienen.

    Dus hoe ver wil je het concept van een database en tabellen oprekken om je punt te maken? Is een mpeg ook een database met tabellen van images en ondertitels?

    Ik weet niet welke argumentatie je hebben wilt, maar je kunt er ook zelf naar op zoek gaan. B.v. bij Apple de WWDC van dit jaar bekijken. Een aantal sessie gaan over Machine Learning en welke mogelijkheden Apple heeft ingebouwd. Veel kijk plezier.:-)